海内外大语言模型（LLM） | 第21页

模型框架

腾讯混元大模型全面降价，混元-lite 模型调整为全面免费

今天，腾讯云公布全新大模型价格方案，其中主力模型之一混元-lite 模型，API 输入输出总长度计划从目前的 4k 升级到 256k，价格从 0.008 元 / 千 tokens 调整为全面免费。混元-standard API 输入价格从 0.01 元 / 千 tokens 降至 0.0045 元 / 千 tokens ，下降 55%，API 输出价格从 0.01 元 / 千…

2024年5月23日

模型框架

百川智能发布最新一代基座大模型 Baichuan 4

据官方介绍，Baichuan 4 相较 Baichuan 3 在各项能力上均有极大提升，其中通用能力提升超过 10%，数学和代码能力分别提升 14% 和 9%，在国内权威大模型评测机构 SuperCLUE 的评测中，模型能力国内第一。地址： https://platform.baichuan-ai.com/homePage 工具调用支持自定义工具调用，助力企业复杂场景支持对接…

2024年5月22日

中国大模型头名易主：全球盲测榜单上，Yi-Large与GPT-4o中文并列第一

机器之心发布机器之心编辑部上周，一个名为 “im-also-a-good-gpt2-chatbot” 的神秘模型突然现身大模型竞技场 Chatbot Arena，排名直接超过 GPT-4-Turbo、Gemini 1 .5 Pro、Claude 3 0pus、Llama-3-70b 等各家国际大厂的当家基座模型。随后 OpenAI 揭开 “im-also-a-good-gp…

2024年5月21日 • 模型框架

模型框架

AWPortrait 1.4 正式发布，人物肖像效果炸裂

AWPortrait终于迎来了1.4，将SD1.5人像的真实感提升到了一个新的高度，增加了旗袍、汉服等东方元素，更好的棚拍效果及户外效果，可更改人物年龄，比较稳定的输出效果是10-80岁。模型地址（1.99G）： https://www.liblib.art/modelinfo/721fa2d298b262d7c08f0337ebfe58f8

2024年5月3日

开源项目

苹果也开始学 Meta，完全开源了 OpenELM 一系列模型，包括270M、450M、1.1B和3B四个规模的模型

苹果公司在人工智能领域迈出了重要的一步，通过开源OpenELM系列模型，展示了其对开放科学和共享资源的承诺。以下是对苹果这一举措的优化文案： **苹果公司推动AI开放创新，开源OpenELM系列模型** 苹果公司最近宣布了一个重大的人工智能开源项目——OpenELM，这一系列模型包括了从270M到3B不等规模的多个模型。这一举措不仅为AI研究和开发社区带来了前所未有的资源，也体…

2024年4月25日

开源项目

中文聊天模型Llama3-8B-Chinese-Chat发布

Llama3-8B-Chinese-Chat 是一个专为中文优化的聊天模型，基于 Meta-Llama-3-8B-Instruct 模型并通过 ORPO 进行微调。该模型显著减少了中文问题英文回答以及回答中中英文混合的现象，同时减少了回答中表情符号的使用，使得回答更加正式。 User: 我的蓝牙耳机坏了，我该去看牙科还是耳鼻喉科？ Assistant: 很抱歉听到你的蓝牙耳机出…

2024年4月23日

模型框架

Meta 发布号称是最强大的开源大语言模型：Llama 3

Meta 公司发布了新闻稿，宣布推出下一代大语言模型 Llama 3，共有 80 亿和 700 亿参数两种版本，号称是最强大的开源大语言模型。Llama 3 具有更强的推理能力和服从指令能力，并且能够处理文本、图片和视频。Meta 公司还发布了新的信任和安全工具，即将在 Facebook、Instagram、WhatsApp 等应用中整合 Llama 3。地址： https:…

2024年4月19日

模型框架

MiniMax发布万亿MoE模型abab 6.5，包含abab 6.5和abab 6.5s两个模型

国内 AI 初创企业 MiniMax正式推出abab 6.5系列模型，包含abab 6.5和abab 6.5s两个模型。万亿MoE模型abab 6.5支持200k tokens的上下文长度，在各类核心能力测试中，开始接近GPT-4、Claude 3 Opus、Gemini 1.5 Pro等世界领先的大语言模型的性能。abab 6.5s跟abab 6.5使用了同样的训练技术和数据…

2024年4月17日

模型框架

360 开源了 360 智脑 7B（70 亿参数模型）支持 50 万字长文本输入

360 公司日前在 GitHub 上开源了 360 智脑 7B（70 亿参数模型）。360 智脑大模型采用 3.4 万亿 Tokens 的语料库训练，以中文、英文、代码为主，开放 4K、32K、360K 三种不同文本长度。360 表示，360K（约 50 万字）是当前国产开源模型文本长度最长的。地址： https://github.com/Qihoo360/360zhinao

2024年4月13日

模型框架

马斯克的xAI再次推出首个多模态模型 Grok-1.5 Vision 可将流程图转成 Python 代码

1. **游戏概述**：– 这是一个猜数字游戏，其中计算机生成一个1到10之间的随机数，用户需要猜测这个数字。 2. **代码实现**：– 文章提供了一个Python函数`guess_number()`，该函数实现了游戏的核心逻辑。– 首先，使用`random.randint(1, 10)`生成一个1到10之间的随机整数作为目标数字（`tar…

2024年4月13日