我用gensim的trained()函数用预先训练的模型计算了两句句子之间的距离。
现在,我希望它们之间有相似之处,并尝试使用n_similarity()函数,但是出现了键错误。
关键词错误:单词不在单词中
这显示了错误示例的截图。

有人对此有想法吗?
发布于 2020-03-22 05:51:19
当你得到一个单词不在词汇表中的错误时,它意味着这个词不在那个模型中。
任何查找它的尝试都会生成一个KeyError,以使您知道您正在尝试获取一个不存在的字向量。
在将令牌列表传递给n_similarity()之前,您应该对它们进行筛选,以便只包含有效的单词。
当然,这意味着您无法获得关于单词'selfie'的有意义的结果。对于模型来说,这是未知的无稽之谈,就好像你想要单词'asruhfglaiwurfliuawiufsdfsdfs'一样。
https://stackoverflow.com/questions/60785538
复制相似问题