首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何研究每个数据对深层神经网络模型的影响?

如何研究每个数据对深层神经网络模型的影响?
EN

Stack Overflow用户
提问于 2017-07-13 06:09:49
回答 2查看 305关注 0票数 5

我正在用Python和Keras库训练一个神经网络模型。

我的模型测试准确率很低(60.0%),我试图提高它,但我做不到,我使用DEAP数据集(总共32名参与者)来训练模型。我使用的分裂技术是固定的。其内容如下:28名学员参加了培训,2名参加了验证,2名参加了测试。

对于我使用的模型,如下所示。

  • 序贯模型
  • 优化器= Adam
  • 使用L2_regularizer,高斯噪声,丢包和批归一化
  • 隐藏层数=3
  • 激活= relu
  • 编译损失= categorical_crossentropy
  • 初始化器= he_normal

现在,我用火车测试技术(也是固定的)来分割数据,我得到了更好的结果。然而,我发现有些参与者正以负面的方式影响训练的准确性。因此,我想知道是否有方法研究每个数据(参与者)对模型的准确性(性能)的影响?

诚挚的问候,

EN

回答 2

Stack Overflow用户

发布于 2018-04-13 10:10:07

在我的动手深入学习: CIFAR-10的图像分类教程中,我坚持要跟踪这两个方面:

  • 全局度量(日志丢失、准确性),
  • 示例(正确和错误地分类案例)。

后者可以帮助我们知道哪种模式是有问题的,并且在许多情况下帮助我改变了网络(如果是这样的话,可以补充培训数据)。

例如,它是如何工作的(在这里使用海王星,尽管您可以在木星笔记本中手动完成,也可以使用TensorBoard图像通道):

然后看看具体的例子,以及预测的概率:

完全免责声明:我与deepsense.ai、创建者或海王星-机器学习实验室合作。

票数 0
EN

Stack Overflow用户

发布于 2019-04-24 09:37:10

这也许是一个比你想要的更广泛的答案,但我希望它还是有用的。

神经网络很棒。我喜欢他们。但是,绝大多数高性能、高调优的模型都是集成的,它们结合了统计技术、神经网络等技术。造成这种情况的主要原因之一是有些技术能更好地处理某些情况。在您的例子中,您遇到了一种我建议您探索替代技术的情况。

在异常值的情况下,严格的价值分析是第一道防线。您还可以考虑使用主成分分析线性判别分析。你也可以尝试用密度估计近邻把他们赶出去。还有许多处理异常值的其他技术,希望您能够找到我所指向的工具(在它们的文档帮助下);sklearn倾向于很容易地接受为Keras准备的数据。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/45072636

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档