核心看点
AI大牛Andrej Karpathy近日发推,揭示了一个值得关注的现象:外界对AI能力的认知正在出现巨大分裂。
第一类人:被”过时免费版”误导
Karpathy认为,很多人去年试用了免费版ChatGPT后,就以此为依据形成了对AI的看法。这群人整天嘲笑AI的各种”翻车”视频、幻觉问题。
但问题是——这些免费且老旧的模型,根本不代表2026年最先进的AI能力。真正厉害的是OpenAI Codex、Claude Code这类面向编程和研究的Agent模型。
第二类人:见证”AI精神病”
Karpathy自创了一个词——“AI精神病”(AI Psychosis)。指的是那些真正掏钱使用前沿Agent模型、并在编程/数学/研究领域专业使用的人。
他们看到的是:把终端交给AI,原本需要数天甚至数周才能完成的编程问题,被AI几小时解决。这种震撼程度,让这部分人对AI能力的判断与第一类人完全不在一个维度。
为什么技术领域进步最猛?
Karpathy解释了根本原因:
- 可验证的奖励信号:编程有单元测试(非黑即白),数学有标准答案,这些”可验证奖励”让强化学习训练效果拔群。相比之下,写作、建议这类任务很难被机器评判好坏
- B2B价值驱动:编程/研究工具在企业场景价值更高,AI公司把最大精力投入在这些方向,因为能赚更多钱
两个极端同时存在
这正是最魔幻的地方:
OpenAI免费版Advanced Voice Mode会在Instagram短视频里连”去洗车应该开车还是走路”这种蠢问题都答错——与此同时,付费200美元的Codex可以自主工作1小时,重构整个代码库,或者找到并利用计算机系统的安全漏洞。
这两类能力同时存在,但分别被两类人看到,于是大家在网上吵成一团,却根本不在说同一件事。
结语
Karpathy的洞察提醒我们:评估AI能力,要看你用的是哪个层级的工具,以及用在哪里。免费版的局限不代表技术前沿的水平;而前沿模型的能力,也在大多数普通用户的认知盲区里。
这场AI认知鸿沟,可能还会持续很长一段时间。
原文:@karpathy
本文地址:https://www.163264.com/10848