阶跃星辰的StepAudio 2.5 TTS模型在Artificial Analysis Speech Arena的全球盲测榜单中位列前三。这个榜可不是随便排的——它用的是Elo评分机制,让真实用户盲听对比,拼的是”听起来像不像人”。
核心看点
- StepAudio 2.5 TTS在Speech Arena Leaderboard全球前三
- 采用盲测Elo评分,衡量语音自然度和感染力
- 已发布全链路模型:TTS、ASR、Realtime实时交互,商业化落地加速
盲测前三意味着什么?
Speech Arena的评测方式是让用户盲听两段语音,选”哪个更像真人”。这意味着排名靠前的模型不是靠参数堆出来的,而是被真人听众认可的。阶跃能进前三,说明中国大模型在语音合成这个赛道已经和国际顶尖水平掰手腕了。
技术落地比排名更值得关注
阶跃星辰不只是发了个好模型,还完成了全链路布局:
– StepAudio 2.5 TTS:语音合成,说人话
– StepAudio 2.5 ASR:语音识别,听懂人话
– StepAudio 2.5 Realtime:实时交互,边听边说
这套组合拳已经落地了——吉利银河M9等车型已经搭载了阶跃的语音技术。智能座舱场景下,车机能不能”听清、听懂、说好”直接影响用户体验。阶跃在这一块的商业化路径已经走通了。
本文地址:https://www.163264.com/11577

