历史性突破：AI首次通过图灵测试，75年的追问终有答案

Table of Contents

核心看点

图灵测试，这个由计算机科学之父阿兰·图灵在1950年提出的经典命题，整整困扰了人类75年。

测试规则很简单：让测试者同时与真人和AI对话，判断哪一方是人类。如果AI能让超过30%的测试者误判，就算通过。

过去几十年，无数AI系统声称”通过”，但要么测试标准宽松，要么样本量不足，学术界始终不认账。

这次不一样。UCSD团队采用了严格的三方图灵测试设计，系统评估了4个主流大语言模型。结果显示，GPT-4.5在角色扮演（Persona）模式下，被误认为真人的比例达到73%——这意味着测试者更倾向于认为AI是真人，而不是真人本身。

换句话说：AI比真人还像人。

论文已发表于PNAS，这是首个获得顶级学术期刊背书的图灵测试实证研究。

这个里程碑意味着什么？

首先，它标志着大语言模型在对话自然度、逻辑连贯性和情感模拟上达到了前所未有的高度。其次，它迫使我们重新思考”人类独特性”的边界——如果连图灵测试这道防线都被攻破，接下来该用什么标准来区分人与机器？

当然，通过图灵测试不等于拥有意识。AI依然是在统计概率中跳舞，只是舞步越来越像人类。但不可否认的是，人机界限正在加速模糊。

对于普通用户来说，未来你在网上遇到的”网友”，可能 increasingly 不是人。对于从业者来说，这是机遇也是挑战——当机器能完美模仿人类，什么才是真正的价值？

75年的追问，今天有了答案。但新的问题，才刚刚开始。

本文地址：https://www.163264.com/12153