我在汽车行业工作,在那里机器推理的可靠性是关键问题,因为所有这些都是诉讼。神经网络(NN)现在非常流行,但是可靠性如何呢?他们说,它在1000个测试数据上进行了测试。嗯,这还不够,10000或更多呢?对于未经测试或看不见的数据,您能说些什么?
我的意思不仅仅是提出缺乏数据的问题,而是NN的黑箱性质。高斯过程是,我发现“更安全”,因为输出可以导出为某种分布(尽管这取决于您选择的内核),至少我知道未见的数据将返回与类似的已见数据类似的预测。那么NN呢?有没有很好的输出分布?当输入数据发生变化时,我可以安全地假设从NN获得连续的结果吗?谢谢。
相似主题How to prove the reliability of a predictive model to executives?
发布于 2017-05-22 15:25:39
很难说神经网络如何处理看不见的数据。就像你说的,神经网络是一个黑匣子,但这并不总是让它不可靠。
为了让神经网络真正看到模式,只需对数据进行过拟合,您需要实现dropout。这防止了过拟合,并刺激了对数据集中(大)模式的检测。
其次,您应该实现一个测试集。这将告诉你一个神经网络在没有经过训练的数据上表现得有多好。因此,如果你有1000个样本,那么800个用于训练,200个用于测试。在用这800个样本训练网络之后,您可以在200个看不见的样本上测试网络。
此外,您还可以生成一些样本:制作您期望从其中获得特定输出的样本。
但是,是的,,很难预测神经网络在10000个其他样本上的表现。例如,您不知道这10000个样本是否与您在其上训练的小1000个样本具有相同的模式。
https://stackoverflow.com/questions/44106707
复制相似问题