马斯克放话:Grok 4.5性能比肩Claude Opus,今年每月发一个新模型

Grok 4.5

马斯克在X上宣布,xAI最新大模型Grok 4.5已在SpaceX和特斯拉内部启动Beta测试,后续会向更广泛用户开放。

性能什么水平?

马斯克透露,早期评测显示Grok 4.5的性能接近甚至超越Anthropic的Claude Opus。强化学习(RL)还在持续提升模型表现,配套的测试基准也在同步优化。

每月一个新模型

更狠的是,马斯克承诺今年剩余时间每月发布一个全新基础模型——不是渐进升级,而是完全从零开始训练的新模型。

这意味着xAI要推行极高强度的研发周期,直接对标OpenAI、Anthropic、谷歌的发布节奏。AI大模型竞赛进入白热化阶段。

技术细节

Grok 4.5基于1.5万亿参数的V9基础模型构建,补充训练中特别引入了AI编程工具Cursor的数据。这明确指向Grok会持续深耕软件开发方向——毕竟代码辅助是大模型最值钱的应用场景之一。

先在SpaceX和特斯拉内部测试,积累真实工程场景的经验,再逐步开放。这种”内部打磨→外部释放”的节奏,和OpenAI的做法类似。

竞争格局

头部AI公司现在拼的就是发布速度和模型能力。xAI一边扩建算力基础设施,一边加速模型迭代,目标很明确:把Grok打造成生成式AI市场的顶级选手。

每月一个新模型的承诺,说明马斯克对xAI的工程能力很有信心。但能不能持续兑现,还得看后续几个月的实际表现。

本文地址:https://www.163264.com/13523

(0)
折叠屏走入AI Native时代:vivo X Fold6的”大屏+AI”新解法
上一篇 5小时前
支持第三方支持自定义API地址ChatGPT原生客户端[macOS/iOS] :OpenCat
下一篇 2023年4月17日 上午12:10

相关推荐