首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Doc2Vec与BERT的差异

Doc2Vec与BERT的差异
EN

Data Science用户
提问于 2022-01-11 18:20:49
回答 1查看 1.7K关注 0票数 0

我试图理解Doc2Vec和伯特之间的区别。我确实理解doc2vec使用一个段落ID,它也用作段落向量。不过,我不确定这个段落ID是否能更好地理解向量中的上下文?

此外,伯特对“银行”这类词的语境有着明确的理解,并赋予了不同的向量。例如,

  1. 我抢劫了一家银行
  2. 我坐在河边。

伯特会在这里为字库分配不同的向量。试图理解doc2vec是否也获得了这个上下文,因为在这里,段落id将是不同的(对于doc2vec)。有人能帮忙吗?

EN

回答 1

Data Science用户

回答已采纳

发布于 2022-01-12 09:23:09

它的主要区别在于,伯特包括注意机制,而Doc2Vec没有。

注意机制是用来检测词间语境的功能,即利用注意权重从词的位置学习。

这比传统的嵌入方法(如Doc2Vec )有更好的效果,这要归功于数据的上下文方法。

另一方面,伯特可以处理词汇外的词汇,因为它使用了子词(例如:“子”+“单词”+ "s")而不是完整的单词(例如:“子词”),从而提供了关于数据的更有意义的信息。

票数 2
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/106956

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档