阶跃StepAudio 2.5 TTS登顶全球前三，中国大模型语音合成冲进第一梯队

阶跃星辰的StepAudio 2.5 TTS模型在Artificial Analysis Speech Arena的全球盲测榜单中位列前三。这个榜可不是随便排的——它用的是Elo评分机制，让真实用户盲听对比，拼的是”听起来像不像人”。

盲测前三意味着什么？

Speech Arena的评测方式是让用户盲听两段语音，选”哪个更像真人”。这意味着排名靠前的模型不是靠参数堆出来的，而是被真人听众认可的。阶跃能进前三，说明中国大模型在语音合成这个赛道已经和国际顶尖水平掰手腕了。

技术落地比排名更值得关注

阶跃星辰不只是发了个好模型，还完成了全链路布局：
– StepAudio 2.5 TTS：语音合成，说人话
– StepAudio 2.5 ASR：语音识别，听懂人话
– StepAudio 2.5 Realtime：实时交互，边听边说

这套组合拳已经落地了——吉利银河M9等车型已经搭载了阶跃的语音技术。智能座舱场景下，车机能不能”听清、听懂、说好”直接影响用户体验。阶跃在这一块的商业化路径已经走通了。

本文地址：https://www.163264.com/11577