当我需要分组分类时,我遇到了一个问题。例如:输入:苹果,西瓜,刀,肥皂。
我需要把输入分成几个组
食品:苹果,西瓜制品:刀清洁产品:肥皂
但我不知道怎样才能达到我的目标。还有其他人遇到过类似的问题吗?
发布于 2017-04-17 14:57:01
一种可能的方法是使用预先训练过的词嵌入(如word2vec (https://blog.acolyer.org/2016/04/21/the-amazing-power-of-word-vectors/) ),将一个单词映射到高维空间中的实值向量,然后使用聚类技术(k-means等)。将单词分配给类别。
发布于 2017-04-16 15:46:55
看起来你有分类问题,好像你已经知道正确的类了。所以我想你是在要求机器学习(ML)领域的监督方法。
要找到一些关于ML的一般想法,并得到一些方法,您可以看一看论文一些关于ML的有用知识。
除了简单的方法之外,您还可以查看神经网络的实现。在本文中,用于句子分类的卷积神经网络,但要注意,他们分类的情感,也有完整的句子作为输入。
此外,还有一些带有API的项目,它为给定的单词提供了一个类。我记不起来了。也许其他用户对此有更多的了解。
https://datascience.stackexchange.com/questions/18390
复制相似问题