当用户与语音助手交互时,自动语音识别(ASR)模型将语音转为文本。由于核心ASR模型训练数据有限,对罕见词句处理能力较弱,因此需通过语言模型对识别假设进行二次排序。传统方法使用长短期记忆(LSTM)语言模型,而本文提出基于BERT的RescoreBERT模型,显著提升准确性。
模型通过以下方式工作:
与Alexa团队合作部署后,RescoreBERT在保持商用效率的同时,错误率较LSTM模型降低13%。该技术尤其擅长处理罕见词(如"fission"),通过结合初次分数与判别式训练,显著提升排序准确性。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。