首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >为什么ELMo的单词嵌入比手套更能代表单词?

为什么ELMo的单词嵌入比手套更能代表单词?
EN

Data Science用户
提问于 2018-12-05 03:09:24
回答 1查看 320关注 0票数 4

我读过ELMo的代码。

根据我的理解,ELMo首先为所有单词插入一个单词嵌入矩阵A,然后添加LSTM B,最后使用LSTM B的S输出来预测每个单词的下一个单词。

我想知道为什么我们可以输入每个单词在词汇,并得到最后的词表示从单词嵌入矩阵A经过培训。

似乎我们丢失了B的信息。

为什么嵌入可以在语言模型中包含我们想要的信息。

为什么训练过程可以将良好的单词表示信息注入到单词嵌入矩阵A中?

EN

回答 1

Data Science用户

回答已采纳

发布于 2018-12-13 07:18:26

我错了。ELMo还将LSTM的输出用于上下文相关的表示.

字嵌入的输出是上下文无关的表示.

为什么表示是有用的?

我认为这是因为,它是在学习单词之间的区别,而表象并不是单词的真正意义。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/42139

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档