比Whisper快6倍,体积小50%的语音识别模型:Distil-Whisper

比Whisper快6倍,体积小50%的语音识别模型:Distil-Whisper

Distil-Whisper:比Whisper快6倍,体积小50%的语音识别模型。它在Whisper核心功能的基础上进行了优化和简化,速度提高了6倍。主要优点包括速度、尺寸、准确性、抗噪声、减少幻听和推测性解码。该模型使用了伪标签方法和知识蒸馏,参数减少了51%。实验结果显示,Distil-Whisper在处理速度和准确性方面都有显著提升。评论中的一些关键亮点包括该模型适用于移动设备、对长音频的处理效果更好以及与Whisper模型的兼容性。

比Whisper快6倍,体积小50%的语音识别模型:Distil-Whisper

评论中的一些亮点包括:1)Distil-Whisper是否能与fast-whisper相媲美;2)期待该模型可以部署在移动设备上;3)该模型支持几种语言;4)Distil-Whisper在处理长音频时表现更好;5)Distil-Whisper可以作为Whisper模型的替代品使用。

git:

https://github.com/huggingface/distil-whisper

论文:

https://arxiv.org/abs/2311.00430

来源:https://mp.weixin.qq.com/s/O07ueDXPmrE987Sh8AwItg

本文地址:https://www.163264.com/5578

(0)
上一篇 2023年11月5日 下午11:09
下一篇 2023年11月5日 下午11:10