文章/答案/技术大牛

发布

社区首页 >问答首页 >Word在TSNE图中多次出现

问Word在TSNE图中多次出现
EN

Stack Overflow用户

提问于 2019-08-05 08:02:22

回答 1查看 42关注 0票数 0

绘制嵌入TSNE结果的单词时，单词会多次出现。

我正在降低Word2Vec单词嵌入的维度，但是当我绘制最相似单词的子集的结果时(手动输入几个我想要的最相似的单词)，相同的单词会多次出现：

from sklearn.manifold import TSNE

words = sum([[k] + v for k, v in similar_words.items()], [])
wvs = model.wv[words]

tsne = TSNE(n_components=3, random_state=0, n_iter=10000, perplexity=29)
np.set_printoptions(suppress=True)
T = tsne.fit_transform(wvs)
labels = words

plt.figure(figsize=(16, 12))
plt.scatter(T[:, 0], T[:, 1], c='purple', edgecolors='purple')
for label, x, y in zip(labels, T[:, 0], T[:, 1]):
    plt.annotate(label, xy=(x+1, y+1), xytext=(0, 0), textcoords='offset points')

这是PCA和TSNE单词相似性降维的正常行为，还是我的代码有什么问题？有没有可能该图将每个相似的单词子集视为彼此独立的？

nlp

word2vec

word-embedding

matplotlib

scikit-learn

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-08-20 10:30:01

每个词都有两个向量:作为中心词和作为上下文词。Stanford University word2vec lecture从41:37开始。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/57350998

复制

相似问题

问Word在TSNE图中多次出现
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Word在TSNE图中多次出现EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Word在TSNE图中多次出现
EN