核心看点:阿里通义实验室推出 Fun-ASR1.5 语音识别大模型,基于统一大模型架构,单模型覆盖 30 种语言、汉语七大方言及 20 余种地方口音,典型方言场景字错误率(CER)相对下降 56.2%。
【主要功能】
• 多语言支持:单模型覆盖 30 种语言
• 方言识别:无缝支持汉语七大方言体系(东北/华北/吴/闽/粤/湘/客家),以及 20 余种地方口音,连古诗词吟诵也能精准转写
• 智能内容整理:自动添加标点符号,将口语化数字/日期/金额/手机号转换为标准书面格式
【性能提升】
在典型方言场景下,Fun-ASR1.5 的字错误率(CER)相对下降 56.2%。目前已有:
• 5 种方言识别准确率突破 90%
• 15 种方言准确率超过 80%
【应用场景】
• 会议纪要整理
• 采访录音转写
• 司法笔录整理
• 方言语音研究
【体验方式】
• 阿里云百炼平台(API 调用):https://bailian.console.aliyun.com/cn-beijing?tab=model#/efm/model_experience_center/voice?modelId=fun-asr
• 魔搭社区(免费在线体验):https://modelscope.cn/studios/iic/FunAudio-ASR
Fun-ASR1.5 的推出标志着语音识别技术在方言处理领域迈上新台阶,对多语言和方言场景的覆盖能力大幅增强。
本文地址:https://www.163264.com/11003