我的工作是ASR(自动语音识别)索马里数据作为硕士论文,现在我被困在如何创建一个语音或语音字典为它。我在网上搜索,却找不到。
我不知道该怎么解决这个问题。有人能指引我吗?
发布于 2020-02-12 18:02:41
我也在reddit上发布了一个类似的问题,并得到了尼古拉·施梅列夫的回复:
“如果你想转换拉丁文,你可以自己写一些简单的规则。比如这。或者你可以使用缩略图。”
感谢尼古拉·施梅列夫,他最初是在reddit中回答的。
发布于 2020-02-21 05:22:18
网络上有很多现有的ASR数据集,虽然我找不到专门针对索马里人的。如果您碰巧找到了一个,但是它没有包含感兴趣的单词,您可以用g2p工具扩展它。
如果你想从头开始制作一本语音词典,那么语音词典通常都是用手写的规则引导的。您可以在Wikipedia页面中找到有关您的语言的音素列表,并编写一个简单的Python脚本将单词映射到音素。
https://datascience.stackexchange.com/questions/67967
相似问题