文章/答案/技术大牛

发布

社区首页 >问答首页 >为什么ELMo的单词嵌入比手套更能代表单词？

问为什么ELMo的单词嵌入比手套更能代表单词？
EN

Data Science用户

提问于 2018-12-05 03:09:24

回答 1查看 320关注 0票数 4

我读过ELMo的代码。

根据我的理解，ELMo首先为所有单词插入一个单词嵌入矩阵A，然后添加LSTM B，最后使用LSTM B的S输出来预测每个单词的下一个单词。

我想知道为什么我们可以输入每个单词在词汇，并得到最后的词表示从单词嵌入矩阵A经过培训。

似乎我们丢失了B的信息。

为什么嵌入可以在语言模型中包含我们想要的信息。

为什么训练过程可以将良好的单词表示信息注入到单词嵌入矩阵A中？

word2vec

word-embeddings

representation

deep-learning

nlp

回答 1

Data Science用户

回答已采纳

发布于 2018-12-13 07:18:26

我错了。ELMo还将LSTM的输出用于上下文相关的表示.

字嵌入的输出是上下文无关的表示.

为什么表示是有用的？

我认为这是因为，它是在学习单词之间的区别，而表象并不是单词的真正意义。

票数 1

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/42139

复制

相似问题

问为什么ELMo的单词嵌入比手套更能代表单词？
EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问为什么ELMo的单词嵌入比手套更能代表单词？EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问为什么ELMo的单词嵌入比手套更能代表单词？
EN