我有一组预定义的分类(比如:汽车、女孩等等)。和一套简短的文本,我需要分配一个或几个类别的每一个文本。做这件事最好的方法是什么?我没有训练文本来进行监督学习分类。Word2Vec是最好的选择还是有更好的方法?
发布于 2016-12-10 23:22:53
如果您没有标签数据,Word2vec可以是一个解决方案。
也许可以看看FastText无监督 (最近由Facebook发布),它类似,但使用字符n-gram。字符n-图有助于考虑形态学,对排字更加健壮,并使计算未知单词的向量成为可能。
https://datascience.stackexchange.com/questions/15586
复制相似问题