首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何阻止文本分类模型仅依赖于输入文本中的两个单词而不是整个句子?

如何阻止文本分类模型仅依赖于输入文本中的两个单词而不是整个句子?
EN

Data Science用户
提问于 2021-11-02 07:56:29
回答 2查看 65关注 0票数 2

我有一个文本分类深度学习模型,它接收一个文本并输出一个softmax概率。我使用手套嵌入来表示DL模型的数字形式的输入文本。

DL模型实际上也很简单。嵌入层是可训练的,没有权值传递给它。

训练结束后,当我用看不见的文字做预测时,我会意识到只有一个关键词在预测中有着巨大的重要性。为了确保这种情况,我改变了输入文本,只包括那些关键字和软件概率或多或少相同。

那么,我在我的模型中做了哪些改变,从嵌入技术到网络,或者无论如何,让模型不依赖于一些单词,并迫使它考虑整个句子?

EN

回答 2

Data Science用户

回答已采纳

发布于 2021-11-03 15:29:07

密集层特性依赖项

在你的实验中可能会发生一些事情。首先,你所看到的最重要的关键字可能与正确的预测有着内在的关联。

除此之外,通过以密集层的形式提供网络单词,这些单词被引入,没有内在的相互依赖,并且在前向传递中被视为正交的。

RNN层/特性逐步依赖

强迫它考虑整个句子

我想你可能要说的是,有些在你的文本的顺序或时间结构中有一些“意义”,你想把它作为你的数据的一个内在特征,当它被传递到你的网络时。以上正是一个递归层所要做的事情:在单词/特性之间施加一种逐步依赖,因为它们是在时间上发生的,并且只允许在这种特殊的重复结构中看到您的数据。通过这种方式,目标/输入序列的固定长度表示被向下投影到序列最后一步的隐藏状态向量中。

您的模型将根据输入文本的这一特定的最后隐藏状态进行调整,从而强制通过代理来查看整个句子。

如果您尝试此方法,请注意渐变消失;)

票数 1
EN

Data Science用户

发布于 2021-11-03 13:15:26

增加辍学辍学,在训练过程中随机省略单元,鼓励神经网络学习更健壮的表示。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/103713

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档