阿里通义推出语音识别大模型Fun-ASR1.5：覆盖30种语言支持汉语七大方言体系

核心看点：阿里通义实验室推出 Fun-ASR1.5 语音识别大模型，基于统一大模型架构，单模型覆盖 30 种语言、汉语七大方言及 20 余种地方口音，典型方言场景字错误率（CER）相对下降 56.2%。

【主要功能】

• 多语言支持：单模型覆盖 30 种语言
• 方言识别：无缝支持汉语七大方言体系（东北/华北/吴/闽/粤/湘/客家），以及 20 余种地方口音，连古诗词吟诵也能精准转写
• 智能内容整理：自动添加标点符号，将口语化数字/日期/金额/手机号转换为标准书面格式

【性能提升】

在典型方言场景下，Fun-ASR1.5 的字错误率（CER）相对下降 56.2%。目前已有：
• 5 种方言识别准确率突破 90%
• 15 种方言准确率超过 80%

【应用场景】

• 会议纪要整理
• 采访录音转写
• 司法笔录整理
• 方言语音研究

【体验方式】

• 阿里云百炼平台（API 调用）：https://bailian.console.aliyun.com/cn-beijing?tab=model#/efm/model_experience_center/voice?modelId=fun-asr
• 魔搭社区（免费在线体验）：https://modelscope.cn/studios/iic/FunAudio-ASR

Fun-ASR1.5 的推出标志着语音识别技术在方言处理领域迈上新台阶，对多语言和方言场景的覆盖能力大幅增强。

本文地址：https://www.163264.com/11003

阿里通义推出语音识别大模型Fun-ASR1.5：覆盖30种语言 支持汉语七大方言体系

相关推荐

阿里通义推出语音识别大模型Fun-ASR1.5：覆盖30种语言支持汉语七大方言体系