我正在做一个项目,其中神经网络(NN)的适用性将被评估,我是相当新的学科。更准确地说,神经网络应该取代一个分析模型。该模型基于位移数据计算结构的受力和扭矩。神经网络的任务是通过回归来逼近力/矩。
有些作者认为,由输入、一个隐层和输出层组成的神经网络可能就足以实现这一目的。因此,我构造了一个具有这些特征的神经网络。神经网络有12个输入、8个隐式和6个输出神经元。这12个输入代表了6个不同点的两个方向的变形。6输出表示施加的力和力矩(Fx,Fy,Fz,Mx,My,Mz)。
为了训练和验证第52号模型的测量,使用了每一个由12个变形和6个力/力矩组成的测量。随后,将数据扩展到174项测量。在这两种情况下,神经网络不能很好地概括,训练“损失”是巨大的。我尝试改变神经网络的各种参数(如隐神经元数、激活函数、优化器、数据…的缩放)。。所有这些都没有带来任何重大变化。之后,我试图通过减少输出变量的数量来降低问题的复杂性。还是没有什么成功。
我主要担心的是,可供培训的数据数量太少。你们有什么建议或建议吗?有人能证实我的担心吗?
发布于 2021-05-19 09:51:00
如果训练损失是“巨大的”,这意味着模型中存在缺陷,或者模型不够复杂。
不要把训练损失和概括混淆起来。泛化是通过测试集的准确性来衡量的。
关于培训数据,你试过数据增强吗?是否可以将转换应用于培训数据以派生新的示例。例如,如果我训练一个基于视频输入和控制输出的汽车驾驶模型,那么视频和控制输入就可以翻转成左转右转?
https://datascience.stackexchange.com/questions/94639
复制相似问题