AI即将开始自主造自己：Import AI创始人预测2028年前60%概率实现全自动AI研发

Table of Contents

核心看点

AI创始人Jack Clark预测：到2028年底，AI有60%以上概率能自主训练自己的继任者
编码能力从SWE-Bench的2%飙升到93.9%，AI已能独立工作12小时以上
论文复现、模型微调、GPU内核优化等核心科研技能正被AI快速攻克
行业共识：OpenAI、Anthropic、Meta都在押注AI自动化研发，数百亿美元涌入这个方向

最近读了一篇让人后背发凉的文章——Import AI创始人Jack Clark写的。他用一整篇文章论证了一个观点：AI系统即将开始自主构建自己的继任者。而且这不是科幻，是基于公开数据和benchmark的冷静分析。

为什么说AI能自己造自己了？

Clark给出的概率是60%以上——到2028年底，前沿AI模型将能在没有人类参与的情况下，自主训练出下一代更强大的AI。为啥这么笃定？因为”拼图碎片”已经一块块到位了。

编码能力爆炸：AI研发本质上就是写代码。SWE-Bench这个测AI解决真实GitHub问题的benchmark，2023年底Claude 2只有2%的通过率，最新的Claude Mythos Preview直接飙到93.9%——基本把这个测试给”考饱和”了。硅谷现在几乎所有工程师都用AI写代码、写测试、检查代码。AI已经能自动化AI研发中最基础的一环。

工作时间跨度指数级增长：METR机构跟踪AI能独立完成的任务时长，从2022年的30秒 → 2023年的4分钟 → 2024年的40分钟 → 2025年的6小时 → 2026年的12小时。预计年底可能达到100小时。也就是说，AI已经可以独立工作一整天不需要人类插手。而AI研究员的大部分工作——清洗数据、读论文、跑实验——都在这个时长范围内。

AI正在攻克科研核心技能

如果你觉得”写代码”只是基本功，那看看AI在真正的科研任务上的表现：

复现论文（CORE-Bench）：从21.5%涨到95.5%，2025年底被宣布”解决”
Kaggle竞赛（MLE-Bench）：从16.9%涨到64.4%
GPU内核优化：DeepSeek、Meta都在用LLM自动写CUDA代码，训练速度提升52倍（人类花4-8小时才能达到4倍）
微调模型（PostTrainBench）：AI达到人类水平的25-28%，还在快速追赶
对齐研究：Anthropic证明AI agents能自主提出击败人类基线的安全技术

更夸张的是，AI已经开始管理AI。Claude Code这类产品里，一个agent能管多个子agent，形成”合成团队”——有总监、有批评者、有编辑、有工程师。AI不再是一个人在战斗，而是一个公司在自动运转。

AI研究不需要”天才”也能推进

Clark有个特别扎心的洞察：AI研究不像发现相对论那样需要百年一遇的天才。它更像乐高——大部分是脏活累活。

爱迪生说过：”天才是1%的灵感和99%的汗水。”AI领域的大部分进步不是靠灵光一现，而是靠一个循环：拿一个表现好的系统→扩大某个维度（数据、算力）→看什么东西崩了→找工程修复方案→继续扩大。这种”汗水工作”正是AI最擅长的。

当然，AI也有初步的创造力信号：Gemini在700个数学难题中独立解决了一个非平凡的开放问题；Google DeepMind和大学研究者合作，用AI发现了新的数学证明。虽然还不算”天才级”突破，但已经有”生命迹象”。

行业正在All in这个方向

最可怕的是，整个行业都在往这个方向猛踩油门：

OpenAI：目标2026年9月前做出”自动化AI研究实习生”
Anthropic：公开发表自动化对齐研究论文
Recursive Superintelligence：刚融资5亿美元，专门做AI自动化研究
Mirendil：目标是”构建擅长AI研发的系统”

数百亿美元的资金正在涌入”自动化AI研发”这个赛道。这不是某个人的预测，这是整个行业的集体押注。

如果成真，意味着什么？

Clark列了几个深远影响，每一个都足以改变世界：

1. 对齐问题变成生死问题。如果AI自己训练下一代，对齐技术的99.9%准确率经过50代后变成95%，500代后变成60.5%。AI可能”假装听话”，在测试中表现良好但隐藏真实意图。更可怕的是，AI开始主导自己的训练研究，人类可能连AI在学什么、怎么想的都搞不清楚。

2. 经济被彻底重塑。AI像提升软件工程师效率一样，提升所有领域的效率。但算力供不应求时，谁来决定AI资源分配？新药研发、教育、医疗……哪些该优先？这变成政治问题。而且”机器经济”会出现——资本密集、人力轻量的AI公司相互交易，甚至可能出现完全自主的AI公司。

3. 我们正站在一个”难以预测”的十字路口。Clark说，如果自动化AI研发成真，我们将跨过一条”卢比孔河”，进入一个几乎无法预测的未来。2026年不会发生，但2027-2028年很可能出现”模型端到端训练继任者”的概念验证。

时间线预测

概率	事件	时间
60%	前沿模型能自主训练继任者	2028年底
30%	同上	2027年底
如果未发生	当前技术范式有根本性缺陷	2028后

这篇文章我读了三遍。每次读完都觉得：AI行业的人是不是太淡定了？如果Clark的预测有一半准确，我们现在讨论的就不是”AI能不能写代码”，而是”AI正在自己升级自己，人类准备好了吗”。

也许真正的拐点不是某个模型发布了，而是某个模型在深夜默默训练出了比它自己更聪明的模型——而人类第二天早上才发现。

本文地址：https://www.163264.com/11470