我有一个数据集。此数据集仅由单词组成。我必须对这些单词进行矢量化。我已经搜索了单词矢量化算法。词袋,word2wec,tf-idf词袋,word2wec,tf-idf是对句子中的单词进行向量化的过程。但是我没有句子。我只想说几句话。那么我该如何实现向量化单词的过程呢?
发布于 2019-04-01 02:33:36
Spacy有一个库,可以获取300维度的词向量。您需要加载一个向量包,如代码所示。token.vector将为您提供一个单个单词的向量。
import spacy
nlp = spacy.load('en_core_web_md')
token = nlp('Basketball')
print(token.vector)https://stackoverflow.com/questions/55245687
复制相似问题