AI即将开始自主造自己:Import AI创始人预测2028年前60%概率实现全自动AI研发

核心看点

  • AI创始人Jack Clark预测:到2028年底,AI有60%以上概率能自主训练自己的继任者
  • 编码能力从SWE-Bench的2%飙升到93.9%,AI已能独立工作12小时以上
  • 论文复现、模型微调、GPU内核优化等核心科研技能正被AI快速攻克
  • 行业共识:OpenAI、Anthropic、Meta都在押注AI自动化研发,数百亿美元涌入这个方向

最近读了一篇让人后背发凉的文章——Import AI创始人Jack Clark写的。他用一整篇文章论证了一个观点:AI系统即将开始自主构建自己的继任者。而且这不是科幻,是基于公开数据和benchmark的冷静分析。

为什么说AI能自己造自己了?

Clark给出的概率是60%以上——到2028年底,前沿AI模型将能在没有人类参与的情况下,自主训练出下一代更强大的AI。为啥这么笃定?因为”拼图碎片”已经一块块到位了。

编码能力爆炸:AI研发本质上就是写代码。SWE-Bench这个测AI解决真实GitHub问题的benchmark,2023年底Claude 2只有2%的通过率,最新的Claude Mythos Preview直接飙到93.9%——基本把这个测试给”考饱和”了。硅谷现在几乎所有工程师都用AI写代码、写测试、检查代码。AI已经能自动化AI研发中最基础的一环。

工作时间跨度指数级增长:METR机构跟踪AI能独立完成的任务时长,从2022年的30秒 → 2023年的4分钟 → 2024年的40分钟 → 2025年的6小时 → 2026年的12小时。预计年底可能达到100小时。也就是说,AI已经可以独立工作一整天不需要人类插手。而AI研究员的大部分工作——清洗数据、读论文、跑实验——都在这个时长范围内。

AI正在攻克科研核心技能

如果你觉得”写代码”只是基本功,那看看AI在真正的科研任务上的表现:

  • 复现论文(CORE-Bench):从21.5%涨到95.5%,2025年底被宣布”解决”
  • Kaggle竞赛(MLE-Bench):从16.9%涨到64.4%
  • GPU内核优化:DeepSeek、Meta都在用LLM自动写CUDA代码,训练速度提升52倍(人类花4-8小时才能达到4倍)
  • 微调模型(PostTrainBench):AI达到人类水平的25-28%,还在快速追赶
  • 对齐研究:Anthropic证明AI agents能自主提出击败人类基线的安全技术

更夸张的是,AI已经开始管理AI。Claude Code这类产品里,一个agent能管多个子agent,形成”合成团队”——有总监、有批评者、有编辑、有工程师。AI不再是一个人在战斗,而是一个公司在自动运转。

AI研究不需要”天才”也能推进

Clark有个特别扎心的洞察:AI研究不像发现相对论那样需要百年一遇的天才。它更像乐高——大部分是脏活累活。

爱迪生说过:”天才是1%的灵感和99%的汗水。”AI领域的大部分进步不是靠灵光一现,而是靠一个循环:拿一个表现好的系统→扩大某个维度(数据、算力)→看什么东西崩了→找工程修复方案→继续扩大。这种”汗水工作”正是AI最擅长的。

当然,AI也有初步的创造力信号:Gemini在700个数学难题中独立解决了一个非平凡的开放问题;Google DeepMind和大学研究者合作,用AI发现了新的数学证明。虽然还不算”天才级”突破,但已经有”生命迹象”。

行业正在All in这个方向

最可怕的是,整个行业都在往这个方向猛踩油门:

  • OpenAI:目标2026年9月前做出”自动化AI研究实习生”
  • Anthropic:公开发表自动化对齐研究论文
  • Recursive Superintelligence:刚融资5亿美元,专门做AI自动化研究
  • Mirendil:目标是”构建擅长AI研发的系统”

数百亿美元的资金正在涌入”自动化AI研发”这个赛道。这不是某个人的预测,这是整个行业的集体押注。

如果成真,意味着什么?

Clark列了几个深远影响,每一个都足以改变世界:

1. 对齐问题变成生死问题。如果AI自己训练下一代,对齐技术的99.9%准确率经过50代后变成95%,500代后变成60.5%。AI可能”假装听话”,在测试中表现良好但隐藏真实意图。更可怕的是,AI开始主导自己的训练研究,人类可能连AI在学什么、怎么想的都搞不清楚。

2. 经济被彻底重塑。AI像提升软件工程师效率一样,提升所有领域的效率。但算力供不应求时,谁来决定AI资源分配?新药研发、教育、医疗……哪些该优先?这变成政治问题。而且”机器经济”会出现——资本密集、人力轻量的AI公司相互交易,甚至可能出现完全自主的AI公司。

3. 我们正站在一个”难以预测”的十字路口。Clark说,如果自动化AI研发成真,我们将跨过一条”卢比孔河”,进入一个几乎无法预测的未来。2026年不会发生,但2027-2028年很可能出现”模型端到端训练继任者”的概念验证。

时间线预测

概率 事件 时间
60% 前沿模型能自主训练继任者 2028年底
30% 同上 2027年底
如果未发生 当前技术范式有根本性缺陷 2028后

这篇文章我读了三遍。每次读完都觉得:AI行业的人是不是太淡定了?如果Clark的预测有一半准确,我们现在讨论的就不是”AI能不能写代码”,而是”AI正在自己升级自己,人类准备好了吗”。

也许真正的拐点不是某个模型发布了,而是某个模型在深夜默默训练出了比它自己更聪明的模型——而人类第二天早上才发现。

本文地址:https://www.163264.com/11470

(0)
上一篇 2026年5月5日 下午10:15
下一篇 6天前

相关推荐