我正在寻找一个软件/库,可以识别说话者的性别。如果一个人有一个音频文件,我想让软件检测出什么性别说过话,说了多长时间。你知道Kaldi http://kaldi-asr.org/是否可行吗?
发布于 2017-08-04 04:10:22
这个脚本是性别识别的kaldi示例的一个很好的开始:https://github.com/kaldi-asr/kaldi/blob/master/egs/sre08/v1/sid/gender_id.sh
你需要基于你的数据集构建你的标识符,它将为整个数据集创建UBM模型,无论是女性还是男性。
https://stackoverflow.com/questions/40462623
复制相似问题