我想在中国为14岁以下的儿童建立一个英语声学模型,使用cmusphinx,词汇量约800个单词。
我做了一些研究,一些商业语音引擎需要花费数千个小时的语音记录来训练他们的声学模型:(细微差别和谷歌花费了2000+和1000+时间)。
因为我需要达到大约95%的准确率,我需要多少个小时的声音语料库?
语音语料库越长,其准确率就越高吗?
发布于 2013-10-31 10:10:10
300-400小时是一个很好的数据。少于100将无法工作。
随着数据大小的增加,如果培训数据本身存在系统问题,则不必提高准确性,但是,如果您正确地分析了培训数据中的问题,则结果可能会有所提高。
如果你一般学习机器学习,这门课程将涵盖数据准备问题。
https://stackoverflow.com/questions/19684546
复制相似问题