阶跃StepAudio 2.5 TTS登顶全球前三,中国大模型语音合成冲进第一梯队

阶跃星辰的StepAudio 2.5 TTS模型在Artificial Analysis Speech Arena的全球盲测榜单中位列前三。这个榜可不是随便排的——它用的是Elo评分机制,让真实用户盲听对比,拼的是”听起来像不像人”。

核心看点

  • StepAudio 2.5 TTS在Speech Arena Leaderboard全球前三
  • 采用盲测Elo评分,衡量语音自然度和感染力
  • 已发布全链路模型:TTS、ASR、Realtime实时交互,商业化落地加速

盲测前三意味着什么?

Speech Arena的评测方式是让用户盲听两段语音,选”哪个更像真人”。这意味着排名靠前的模型不是靠参数堆出来的,而是被真人听众认可的。阶跃能进前三,说明中国大模型在语音合成这个赛道已经和国际顶尖水平掰手腕了。

技术落地比排名更值得关注

阶跃星辰不只是发了个好模型,还完成了全链路布局:
– StepAudio 2.5 TTS:语音合成,说人话
– StepAudio 2.5 ASR:语音识别,听懂人话
– StepAudio 2.5 Realtime:实时交互,边听边说

这套组合拳已经落地了——吉利银河M9等车型已经搭载了阶跃的语音技术。智能座舱场景下,车机能不能”听清、听懂、说好”直接影响用户体验。阶跃在这一块的商业化路径已经走通了。

本文地址:https://www.163264.com/11577

(0)
上一篇 2天前
下一篇 2天前

相关推荐