我试着将单词归入同一类别。因此,我想使用Spacy Word2Vec。它已经可以使用像banana、apple和car这样简单的单词了。它显示了几乎相同的单词。
如果单词变得更具体,比如汽车,电池,蓄电池,帐户等等,如果是更技术性的,Spacy会发送Zero vectos。所以这些词并没有被收录在书目中。
你对我有什么建议吗?
此外,我必须用德语来做。
非常感谢Jokulema.
发布于 2020-01-26 15:51:41
文档中说,Word2Vec需要一个模型来处理各种单词。
他们还给出了一个包含约100万个单词的模型示例,并展示了如何下载它:
python -m spacy download en_core_web_lg
请阅读此处的文档:https://spacy.io/usage/spacy-101#vectors-similarity
发布于 2020-01-27 14:59:08
如果您需要模型中未包含的单词的单词向量,则必须执行以下任一操作:
中的用法的许多示例
https://stackoverflow.com/questions/59916393
复制相似问题