首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >访问多个层的预训练DistilBERT模型的输出

访问多个层的预训练DistilBERT模型的输出
EN

Stack Overflow用户
提问于 2020-03-21 03:02:08
回答 1查看 309关注 0票数 0

我正在尝试访问来自预训练的"DistilBERT“模型的几个不同层的输出嵌入。("distilbert-base-uncased")

代码语言:javascript
复制
bert_output = model(input_ids, attention_mask=attention_mask)

bert_output似乎只返回输入标记的最后一层的嵌入值。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-03-21 03:16:30

如果您想获得所有隐藏层的输出,则需要将output_hidden_states=True kwarg添加到您的配置中。

您的代码将如下所示

代码语言:javascript
复制
from transformers import DistilBertModel, DistilBertConfig

config = DistilBertConfig.from_pretrained('distilbert-base-cased', output_hidden_states=True)
model = DistilBertModel.from_pretrained('distilbert-base-cased', config=config)

隐藏图层将以bert_output[2]的形式提供

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/60780181

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档