首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >从输入数据集词生成同音词的机器学习算法

从输入数据集词生成同音词的机器学习算法
EN

Data Science用户
提问于 2020-09-15 07:31:21
回答 1查看 224关注 0票数 0

https://www.google.com/search?sxsrf=ALeKk01_SgA8G4UfNm4rOqku4yJBFvKhLw%3A1600154854621&source=hp&ei=5mxgX8ztI6KZ4-EPq-mL8Ak&q=homophones+example&oq=Homophones&gs_lcp=ChFtb2JpbGUtZ3dzLXdpei1ocBABGAEyBQgAELEDMgUIABCxAzICCAAyCAgAELEDEIMBMgUIABCxAzICCAAyAggAMgUIABCxAzoHCCMQ6gIQJzoECCMQJzoFCAAQkQI6CAguELEDEIMBOgUILhCxA1DkKliKSGDuUGgBcAB4AIAB6wGIAe8NkgEFMC44LjKYAQCgAQGwAQ8&sclient=mobile-gws-wiz-hp

是否有机器学习算法从输入数据集单词生成同音词?

同音词的例子:

附件,附件。

广告,加。

空气,继承人。

全部,啊。

允许,大声说出来。

施舍,手臂。

投入:广告

输出:广告,添加

是否有机器学习算法从输入数据集中生成同音词,包括印地语、古吉拉特语、孟加拉语等印度地区语言以及法语、德语、意大利语、西班牙语、荷兰语等其他语言?

EN

回答 1

Data Science用户

发布于 2020-09-15 16:30:41

我对同音发生器知之甚少。我觉得要做一个同音检测器,人们应该更多地关注单词的语音学,而不是拼写。

  1. 试着做一个单词语音学列表数据集,然后训练一个模型。
  2. 关注单词语音之间的距离/模糊/编辑距离。

第二,也有相同的语音学-T UW。尝试这个网站找到语音- http://www.speech.cs.cmu.edu/cgi-bin/cmudict?in=to,他们已经映射了单词和语音。我认为在非英语语言中寻找同音词是一项艰巨的任务。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/81719

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档