我想用机器学习来分类缩略语。例如:我有水。我向用户询问什么是watermel。(我的应用程序上下文是关于食物的)。然后他把它归类为西瓜。在其他时间,如果其他用户插入水。用机器学习技术推断西瓜和西瓜是一样的吗?
发布于 2017-04-13 18:20:10
查看这个用于Python的包:https://pypi.python.org/pypi/Distance/
您可以使用它生成一个数字值,表示单词之间的相似性。
下面是一篇类似的文章,应该有所帮助:https://stats.stackexchange.com/questions/123060/clustering-a-long-list-of-strings-words-into-similarity-groups
此外,复杂性的一个层次是在使用word2vec生成的数组上使用this(这是word嵌入)。这方面的示例和资源如下:https://www.codeproject.com/tips/788739/visualization-of-high-dimensional-data-using-t-sne http://sebastianruder.com/word-embeddings-1/
发布于 2017-04-13 17:11:08
自然语言处理/文本挖掘可以帮助您找到解决问题的可能方法。因为,在您的情况下,使用词法分析器和分析器处理它们是不可避免的。
希望这能帮上忙!!
https://datascience.stackexchange.com/questions/18331
复制相似问题