首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >不处理玩具问题的变压器结构

不处理玩具问题的变压器结构
EN

Data Science用户
提问于 2018-12-03 07:45:52
回答 1查看 66关注 0票数 2

我的变压器没在处理玩具问题。

玩具问题

输入:随机整数序列,一次热编码.例子:

代码语言:javascript
复制
[[0, 0, 0, 1, 0, 0, 0, 0, 0, 0],
 [0, 0, 1, 0, 0, 0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0, 0, 0, 0, 1, 0],
 [0, 0, 0, 0, 0, 0, 1, 0, 0, 0],
 [0, 0, 0, 1, 0, 0, 0, 0, 0, 0]
]

输出:如果第一个随机整数< 5,则为1,否则为0。对于给定的示例,输出为1。

问题

我的变压器在这个玩具问题上运行得很好。然而,以更大的规模运行( 800维上的一次热编码)不再有效:网络总是输出类似的结果,不管输入。

注意:为了获得类平衡,我确实将输出的条件更改为x < 800

为什么我的变压器体系结构不能处理玩具问题的这种变化?

另一个问题

我还尝试使用两个输入(使用size = 10类似地生成),并根据这两个输入生成输出(如果两个输入的第一个随机整数都小于5或两者都> 5,则为1),否则为0 )。

EN

回答 1

Data Science用户

发布于 2019-01-08 17:55:51

我不确定,但也许多余的零才是罪魁祸首。我想你得到的结果只是偏见的积累。我建议使用嵌入层将你的单一热向量转换成密集矢量。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/42016

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档