我正在研究自动语音识别系统的端到端架构。
RNN换能器(RNN-T)是一种流行的端到端方法,但训练难度大。
因此,我正在寻找一个框架或工具包,它可以帮助我轻松地实现基线模型,然后根据我的意愿进行修改。
提前感谢!
发布于 2020-12-24 17:32:55
对于感兴趣的人,我目前正在使用ESPnet toolkit,它主要专注于端到端语音识别和端到端文本到语音。
https://stackoverflow.com/questions/65074554
相似问题