文章/答案/技术大牛

发布

社区首页 >问答首页 >从输入数据集词生成同音词的机器学习算法

问从输入数据集词生成同音词的机器学习算法
EN

Data Science用户

提问于 2020-09-15 07:31:21

回答 1查看 224关注 0票数 0

https://www.google.com/search?sxsrf=ALeKk01_SgA8G4UfNm4rOqku4yJBFvKhLw%3A1600154854621&source=hp&ei=5mxgX8ztI6KZ4-EPq-mL8Ak&q=homophones+example&oq=Homophones&gs_lcp=ChFtb2JpbGUtZ3dzLXdpei1ocBABGAEyBQgAELEDMgUIABCxAzICCAAyCAgAELEDEIMBMgUIABCxAzICCAAyAggAMgUIABCxAzoHCCMQ6gIQJzoECCMQJzoFCAAQkQI6CAguELEDEIMBOgUILhCxA1DkKliKSGDuUGgBcAB4AIAB6wGIAe8NkgEFMC44LjKYAQCgAQGwAQ8&sclient=mobile-gws-wiz-hp

是否有机器学习算法从输入数据集单词生成同音词？

同音词的例子：

附件，附件。

广告，加。

空气，继承人。

全部，啊。

允许，大声说出来。

施舍，手臂。

投入:广告

输出:广告，添加

是否有机器学习算法从输入数据集中生成同音词，包括印地语、古吉拉特语、孟加拉语等印度地区语言以及法语、德语、意大利语、西班牙语、荷兰语等其他语言？

word

bag-of-words

回答 1

Data Science用户

发布于 2020-09-15 16:30:41

我对同音发生器知之甚少。我觉得要做一个同音检测器，人们应该更多地关注单词的语音学，而不是拼写。

试着做一个单词语音学列表数据集，然后训练一个模型。
关注单词语音之间的距离/模糊/编辑距离。

第二，也有相同的语音学-T UW。尝试这个网站找到语音- http://www.speech.cs.cmu.edu/cgi-bin/cmudict?in=to，他们已经映射了单词和语音。我认为在非英语语言中寻找同音词是一项艰巨的任务。

票数 1

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/81719

复制

相似问题

问从输入数据集词生成同音词的机器学习算法
EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问从输入数据集词生成同音词的机器学习算法EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问从输入数据集词生成同音词的机器学习算法
EN