模型
-
马斯克放话:Grok 4.5性能比肩Claude Opus,今年每月发一个新模型
马斯克在X上宣布,xAI最新大模型Grok 4.5已在SpaceX和特斯拉内部启动Beta测试,后续会向更广泛用户开放。 性能什么水平? 马斯克透露,早期评测显示Grok 4.5的性能接近甚至超越Anthropic的Claude Opus。强化学习(RL)还在持续提升模型表现,配套的测试基准也在同步优化。 每月一个新模型 更狠的是,马斯克承诺今年剩余时间每月发布一个全新基础模型…
-
算力提速关键突破:北大与DeepSeek联合开源大模型推理框架DSpark
大模型推理的速度和成本,一直是AI落地的两大痛点。最近,北京大学和DeepSeek联合开源了一个叫DSpark的推理框架,专门解决这两个问题。 从初步信息来看,DSpark在生成效率和吞吐量上都有显著提升。对于需要大规模部署AI服务的企业来说,这可能是个好消息。 大模型推理的痛点:慢和贵 先说说为什么大模型推理这么让人头疼。 现在的AI应用,比如ChatGPT、文心一言这些聊天…
-
模型变小,能力不减:新浪VibeThinker-3B开源,AI推理迎来轻量化新思路
大模型一定要”大”才好用吗?新浪最近开源的VibeThinker-3B给出了一个让人意外的答案——这个只有30亿参数的小模型,在数学、编程等高难度任务上,居然能跟那些几百亿参数的”大块头”掰掰手腕。 小模型,大能量 VibeThinker-3B最吸引人的地方,是它的性价比。 参数规模只有30亿,但在多个基准测试中的表现却相当亮眼。…
-
AI日报:Seedance2.5视频模型发布、Vidu Q3上线华为云、百川M4医疗模型亮相
今天AI圈有几条值得关注的动态,集中在模型发布和视频生成领域。 1、火山引擎发布豆包Seedance2.5视频模型 Seedance2.5实现了30秒单段原生视频直出,支持50个全模态素材联合生成。同步发布的还有Seedream5.0 Pro(交互式精准编辑+可编辑分层设计图)和Seed-Audio 1.0(多角色对白+拟音特效零样本生成)。 火山引擎方舟大模型服务用户已超11…
-
京东开源全球首个全栈视觉交互模型,AI终于能”边看边说”了
京东最近搞了个大动作——正式开源了JoyAI-VL-Interaction实时视频视觉语言交互模型。这玩意儿号称全球首个全栈开源的视觉交互模型,连整套部署系统都一并放出来了。 传统AI的痛点:太被动了 现在市面上的多模态模型基本都是”你问我答”的模式,用户不提问,AI就傻站着。这种被动式交互在实时监控、直播讲解这些场景里根本不够用。 JoyAI的三大革新…
-
阿里发布Qwen-Robot系列具身大模型:三大模型协同攻克异构机器人适配痛点
具身智能赛道又有大动作——阿里巴巴正式发布 Qwen-Robot 系列具身大模型,一口气推出三大核心模型,瞄准的是机器人行业最头疼的问题:异构机器人适配。 行业痛点 为什么具身智能这么难?核心原因之一就是「硬件异构」——不同公司的机器人硬件完全不同,机械臂的结构、传感器的配置、运动控制的接口都不一样。 传统做法是「一个机器人一套模型」,但这样成本极高、扩展性极差。一个通用机器人…
-
谷歌发布 DiffusionGemma:本地 AI 推理速度飙升 4 倍,文本扩散模型来了
【核心看点】 谷歌在 6 月 11 日放出了一个新玩意——DiffusionGemma。这是一款实验性的开源文本扩散模型,最大的卖点是本地推理速度比传统自回归模型提升了整整 4 倍。如果这一方向被验证可行,它可能彻底改变大模型在端侧设备上的运行方式。 【详细解析】 文本扩散是什么? 我们熟悉的大语言模型(如 GPT、Gemini)大多是自回归模型,也就是从左到右、逐词生成的方式…
-
Google重磅开源DiffusionGemma:文本生成速度提升4倍,打破自回归模型垄断
谷歌又来搞事情了!这次不是Gemini的更新,而是一款全新的开源模型——DiffusionGemma。 核心看点 6月11日,谷歌正式发布并开源了DiffusionGemma,这是一款基于文本扩散机制的大语言模型。与传统的GPT、Gemini等自回归模型不同,DiffusionGemma采用了一种全新的文本生成方式,在本地推理速度上实现了4倍的提升。 什么是文本扩散模型? 传统…
-
Anthropic发布史上最强Claude Fable 5:Mythos级模型首次向公众开放
核心看点 6月9日,Anthropic正式发布Claude Fable 5,这是该公司迄今为止向公开市场推出的最强模型 首个公开可用的Mythos级AI模型,此前Mythos分类仅用于内部前沿模型 跑分屠榜:SWE-Bench Pro 80.3%,FrontierCode Diamond 29.3%,全面领先GPT 5.5和Gemini 3.1 双模型策略:Fable 5面向公…
-
中国AI大模型周调用量创新高,包揽全球前四
中国AI大模型正在加速超车。 6月8日消息,中国AI大模型上周的周调用量达到14.19万亿Token,环比增长27.49%,连续六周超越美国。国产大模型霸榜前四,DeepSeek-V4-Flash、腾讯Hy3 preview和MiniMaxM3表现突出。 核心看点 调用量新高:中国AI大模型周调用量达14.19万亿Token,环比增长27.49% 连续六周领先:连续六周超越美国…
