马斯克放话每月推全新大模型,Grok4.5内测性能比肩Claude Opus

马斯克又放狠话了。

这次他说的是:xAI的最新大模型Grok4.5已经在SpaceX和特斯拉内部开始Beta测试,性能接近甚至超越了Anthropic的旗舰模型Claude Opus。更夸张的是,他计划每个月都推出一个全新训练的基础模型

如果这是真的,那AI行业的竞争格局可能要变天了。

Grok4.5什么来头?

据马斯克透露,Grok4.5基于xAI自研的V9基础模型打造,参数规模达到了1.5万亿。这个规模是什么概念?GPT-4据说在1.8万亿左右,Claude 3 Opus的具体数字没公开,但业界估计也在万亿级别。

Grok4.5的一个特别之处是,它在训练数据中融入了Cursor的相关数据。Cursor是目前最火的AI编程工具之一,这意味着Grok4.5在代码理解和生成方面可能有额外加成。

目前Grok4.5只在SpaceX和特斯拉内部测试,普通用户还用不上。但马斯克说性能已经”接近甚至超越Claude Opus”,如果这话不虚,那Grok系列的实力确实上了一个大台阶。

每月一个新模型?这节奏太疯狂

比Grok4.5本身更震撼的,是马斯克的发布节奏。

他说SpaceX计划每个月推出一个”完全从零开始训练”的全新基础模型。注意关键词:”完全从零开始训练”。这不是在现有模型上微调,而是每个月都从头练一个新模型。

这有多难?

训练一个万亿参数级别的大模型,通常需要数周甚至数月的时间,消耗数万张GPU,成本以千万美元计。即使xAI有马斯克的钱包和算力支持,每个月从头训练一个新模型,也是极其激进的节奏。

有几种可能的解释:

  • 模型规模更小:也许不是每个月都练万亿参数模型,而是不同规模的模型轮着来
  • 训练基础设施极强:xAI可能搭建了超大规模的训练集群,并行训练多个模型
  • 马斯克惯常的夸张:先把牛吹出去,实际执行打折扣

不管怎样,这个表态本身就说明了xAI的野心——不想做追随者,要做引领者

Grok的差异化:真实世界数据

Grok系列从一开始就走了一条不一样的路。

其他大模型的训练数据主要是互联网文本、书籍、代码等。Grok则额外接入了X(推特)的实时数据,这让它在时效性上有独特优势。比如问”今天发生了什么新闻”,Grok能给出基于最新推文的回答,而GPT-4的知识可能还停留在几个月前。

Grok4.5加上Cursor数据,说明xAI还在持续扩充它的数据护城河。代码数据对于提升模型的逻辑推理能力很有帮助,这可能是Grok4.5能在性能上追赶Claude Opus的原因之一。

对行业的冲击

如果xAI真的能做到每月发布新模型,对整个AI行业的影响会很大。

对OpenAI:GPT-5的发布压力更大了。OpenAI一向以技术领先自居,但如果xAI的迭代速度更快,OpenAI的”行业老大”地位会受到挑战。

对Anthropic:Claude Opus一直是”最强模型”的有力竞争者。Grok4.5如果真能比肩甚至超越,Anthropic需要拿出更强的回应。

对Google:Gemini系列一直在追赶,但市场声量不如GPT和Claude。xAI的加入让竞争更复杂,Google可能需要在差异化上找突破口。

对开发者和用户:竞争加剧意味着更好的模型、更低的价格、更多的选择。这是好事。

但马斯克的”嘴炮”历史让人谨慎

不过,对马斯克的话,历来要打个折扣。

他有过太多”说到没做到”的先例:特斯拉完全自动驾驶说了多少年?Neuralink的人体实验推迟了多少次?推特(X)的改革承诺兑现了多少?

“每月一个新模型”这个目标,听起来更像是一个愿景,而不是一个已经排进日程表的承诺。即使xAI有这个技术能力,商业上是否值得每个月烧这么多钱训练新模型,也是个问题。

更可能的情况是:xAI会保持高频迭代,但”每月从零训练”可能是一种夸张表述,实际执行中会有弹性。

写在最后

不管马斯克的”每月新模型”能不能兑现,Grok4.5的进展本身已经值得关注。

xAI从成立到现在才两年多,已经推出了多代Grok模型,还建起了号称”全球最大AI训练集群”的Colossus。这个速度,在AI行业里是相当惊人的。

如果Grok4.5真的能在性能上比肩Claude Opus,那xAI就从”有特色的挑战者”升级为”第一梯队的玩家”。再加上马斯克的影响力和X平台的数据优势,xAI可能会成为OpenAI最危险的对手。

AI行业的竞争,越来越像一场军备竞赛。而马斯克,从来都不是一个按常理出牌的选手。

本文地址:https://www.163264.com/13477

(0)
上一篇 8小时前
下一篇 8小时前

相关推荐