如何利用句子中单词的向量来得到句子的向量。我曾经使用过这样的策略,比如-平均单个单词向量,或者TF-下手加权组合。这些黑客行得通,但也存在明显的问题。想知道做这件事的其他方法
发布于 2018-08-26 19:41:30
在这论文中,描述了一种最先进的方法(无监督平滑逆频率),可以找到该方法的一个实现这里。
发布于 2018-08-30 18:53:03
有一种doc2vec算法,它是对word2vec的修改--由同样的作者编写,论文:https://arxiv.org/pdf/1405.4053v2.pdf
它是在gensim https://radimrehurek.com/gensim/models/doc2vec.html中实现的
https://datascience.stackexchange.com/questions/37463
复制相似问题