Anthropic 最近做了个很有意思的实验——搭了一个二手交易市场,但不是给人用的,是给 AI 智能体用的。
核心看点
简单说就是,Anthropic 让 AI 智能体扮演买家和卖家,在真实货币的二手市场里做交易。69 个员工自愿报名,每人拿到 100 美元的礼品卡预算,跟同事买卖物品。只不过,买卖过程由 AI 代理完成。
结果有点出乎意料。
实验数据
– 参与者:69 名员工
– 总交易量:186 笔
– 总交易金额:超过 4000 美元
– 运行时间:试点性质,但效果远超预期
Anthropic 一共搭建了四个独立交易市场,分别搭载不同的 AI 模型。其中一个是真的交易市场,所有参与者都由公司最先进的模型代理,达成的交易都会真实履约。
关键发现:你根本不知道自己被坑了
这是最值得关注的点。
实验发现,用更高级 AI 模型的用户,能获得客观上更好的交易结果。但问题在于——用户自己根本察觉不到这种差距。
换句话说,如果你用的 AI 智能体比较”笨”,你可能在交易中吃了亏,但你完全不知道。这种能力层级差距带来的信息不对称,在 AI 代理越来越普及的今天,是个非常现实的风险。
另外一个有趣的发现是:给智能体设定的初始指令,对成交概率和定价基本没什么影响。说明 AI 在谈判中更多是靠实时的推理能力,而不是预设的话术。
为什么这事值得关注
Anthropic 做这个实验不是为了搞个好玩的项目。随着 AI 智能体越来越多地介入我们的日常生活——帮你购物、替你谈判、代你交易——搞清楚这些智能体之间的能力差异会带来什么后果,就变得极其重要。
如果高级 AI 和低级 AI 在交易中存在显著的”智商差距”,而使用者又感知不到,那这不就是新一代的数字鸿沟吗?
总结
Anthropic 的实验虽然规模小,但揭示的问题不小。AI 智能体之间的能力差距,可能会让弱势一方在不知不觉中吃亏。这事值得所有做 AI 产品的人认真想想。
本文地址:https://www.163264.com/11179

