模型 | 梭哈 AI

openai-gpt

马斯克放话：Grok 4.5性能比肩Claude Opus，今年每月发一个新模型

马斯克在X上宣布，xAI最新大模型Grok 4.5已在SpaceX和特斯拉内部启动Beta测试，后续会向更广泛用户开放。性能什么水平？马斯克透露，早期评测显示Grok 4.5的性能接近甚至超越Anthropic的Claude Opus。强化学习（RL）还在持续提升模型表现，配套的测试基准也在同步优化。每月一个新模型更狠的是，马斯克承诺今年剩余时间每月发布一个全新基础模型…

1天前

算力提速关键突破：北大与DeepSeek联合开源大模型推理框架DSpark

大模型推理的速度和成本，一直是AI落地的两大痛点。最近，北京大学和DeepSeek联合开源了一个叫DSpark的推理框架，专门解决这两个问题。从初步信息来看，DSpark在生成效率和吞吐量上都有显著提升。对于需要大规模部署AI服务的企业来说，这可能是个好消息。大模型推理的痛点：慢和贵先说说为什么大模型推理这么让人头疼。现在的AI应用，比如ChatGPT、文心一言这些聊天…

模型框架 1天前

模型变小，能力不减：新浪VibeThinker-3B开源，AI推理迎来轻量化新思路

大模型一定要”大”才好用吗？新浪最近开源的VibeThinker-3B给出了一个让人意外的答案——这个只有30亿参数的小模型，在数学、编程等高难度任务上，居然能跟那些几百亿参数的”大块头”掰掰手腕。小模型，大能量 VibeThinker-3B最吸引人的地方，是它的性价比。参数规模只有30亿，但在多个基准测试中的表现却相当亮眼。…

开源项目 1天前

AI 日报

AI日报：Seedance2.5视频模型发布、Vidu Q3上线华为云、百川M4医疗模型亮相

今天AI圈有几条值得关注的动态，集中在模型发布和视频生成领域。 1、火山引擎发布豆包Seedance2.5视频模型 Seedance2.5实现了30秒单段原生视频直出，支持50个全模态素材联合生成。同步发布的还有Seedream5.0 Pro（交互式精准编辑+可编辑分层设计图）和Seed-Audio 1.0（多角色对白+拟音特效零样本生成）。火山引擎方舟大模型服务用户已超11…

2026年6月24日

开源项目

京东开源全球首个全栈视觉交互模型，AI终于能”边看边说”了

京东最近搞了个大动作——正式开源了JoyAI-VL-Interaction实时视频视觉语言交互模型。这玩意儿号称全球首个全栈开源的视觉交互模型，连整套部署系统都一并放出来了。传统AI的痛点：太被动了现在市面上的多模态模型基本都是”你问我答”的模式，用户不提问，AI就傻站着。这种被动式交互在实时监控、直播讲解这些场景里根本不够用。 JoyAI的三大革新…

2026年6月23日

阿里发布Qwen-Robot系列具身大模型：三大模型协同攻克异构机器人适配痛点

具身智能赛道又有大动作——阿里巴巴正式发布 Qwen-Robot 系列具身大模型，一口气推出三大核心模型，瞄准的是机器人行业最头疼的问题：异构机器人适配。行业痛点为什么具身智能这么难？核心原因之一就是「硬件异构」——不同公司的机器人硬件完全不同，机械臂的结构、传感器的配置、运动控制的接口都不一样。传统做法是「一个机器人一套模型」，但这样成本极高、扩展性极差。一个通用机器人…

模型框架 2026年6月16日

谷歌发布 DiffusionGemma：本地 AI 推理速度飙升 4 倍，文本扩散模型来了

【核心看点】谷歌在 6 月 11 日放出了一个新玩意——DiffusionGemma。这是一款实验性的开源文本扩散模型，最大的卖点是本地推理速度比传统自回归模型提升了整整 4 倍。如果这一方向被验证可行，它可能彻底改变大模型在端侧设备上的运行方式。【详细解析】文本扩散是什么？我们熟悉的大语言模型（如 GPT、Gemini）大多是自回归模型，也就是从左到右、逐词生成的方式…

Google Gemini 2026年6月14日

Google重磅开源DiffusionGemma：文本生成速度提升4倍，打破自回归模型垄断

谷歌又来搞事情了！这次不是Gemini的更新，而是一款全新的开源模型——DiffusionGemma。核心看点 6月11日，谷歌正式发布并开源了DiffusionGemma，这是一款基于文本扩散机制的大语言模型。与传统的GPT、Gemini等自回归模型不同，DiffusionGemma采用了一种全新的文本生成方式，在本地推理速度上实现了4倍的提升。什么是文本扩散模型？传统…

Google Gemini 2026年6月13日

Anthropic发布史上最强Claude Fable 5：Mythos级模型首次向公众开放

核心看点 6月9日，Anthropic正式发布Claude Fable 5，这是该公司迄今为止向公开市场推出的最强模型首个公开可用的Mythos级AI模型，此前Mythos分类仅用于内部前沿模型跑分屠榜：SWE-Bench Pro 80.3%，FrontierCode Diamond 29.3%，全面领先GPT 5.5和Gemini 3.1 双模型策略：Fable 5面向公…

anthropic-Claude 2026年6月11日

中国AI大模型周调用量创新高，包揽全球前四

中国AI大模型正在加速超车。 6月8日消息，中国AI大模型上周的周调用量达到14.19万亿Token，环比增长27.49%，连续六周超越美国。国产大模型霸榜前四，DeepSeek-V4-Flash、腾讯Hy3 preview和MiniMaxM3表现突出。核心看点调用量新高：中国AI大模型周调用量达14.19万亿Token，环比增长27.49% 连续六周领先：连续六周超越美国…

AI 日报 2026年6月8日