神经网络(BP FF)能否自主学习如何控制螺旋桨以避免试飞和稳定?
神经网络类型:多层,反向传播前馈,乙状结肠激活。
为了简单起见,只采用垂直螺旋桨控制和垂直速度。
İnput:垂直速度。
输出:螺旋桨动力(目标只向下,所以只向上推)
由于反向传播神经网络从输出和期望输出的差异中得到误差,它如何在不知道期望输出的情况下教自己(实际上,它需要学习期望的输出)。
如果我把错误看作垂直速度(stopped=no错误),那么它会更合适,但是如何更改Encog的ResilientPropagation或BackPropagation类的错误函数?
我是否需要自己编写整个网络课程来实现这种学习?因为没有初步的训练数据。只有新创建的数据来自发动机的功率和速度。(如果我能生成训练数据,那么我就知道如何控制发动机,这样就不需要神经网络了)
最适合这份工作的神经网络类型是什么?
发布于 2013-09-19 15:25:47
正如@larsman在评论中所指出的那样,这可以通过强化学习范式来解决。在目前最流行的(也是唯一的)神经网络环境下?方法是使用两个神经网络:
这种方法被称为演员-评论家方法。另外,你需要做的就是设计加固功能。在您的情况下,这似乎很简单,因为它可以等于垂直速度,并附加惩罚偏离某些预定义的高度(否则,网络将学会等待一段时间,直到螺旋桨下跌和停止为自己)。
主要问题是调整所有参数才能正确工作,但是问题似乎很简单,所以可能不是很难。
https://stackoverflow.com/questions/18896380
复制相似问题