我使用word2vec将我的单词表示为向量。
text = np.loadtxt("file.txt", dtype=str, delimiter=" ")
word2vec = w2v.Word2Vec(text, size=100, window=5, min_count=5, workers=4)
print(len(word2vec.wv.vocab))文本是单词(字符串)的列表。这段代码不打印单词数,而是打印26 #英文字母。为了训练word2vec成为我的模型,我需要处理的是单词,而不是字母。我尝试过将文本转换为字符串,但没有成功。我做错了什么?
发布于 2017-07-14 15:23:14
我认为你需要传递一份单词列表:
word2vec = w2v.Word2Vec(text.reshape(-1, 1), size=100, window=5, min_count=5, workers=4)https://stackoverflow.com/questions/45106468
复制相似问题