在阅读“基于触觉的活动对象识别和未知工作空间中的目标对象搜索”时,有一件事我无法理解:
本文仅利用触觉信息来寻找物体的位置和其他属性。在第4.1.2节中,提交人说,他使用探地雷达指导探索过程,在第4.1.4节中,他描述了他是如何训练他的探地雷达的:
的点。
在下面的链接中,您还可以看到演示:https://www.youtube.com/watch?v=ZiLq3i-BJcA&t=177s。在视频的第一部分(0:24-0:29)中,机器人进行了4次采样。然后在接下来的25秒内,机器人从相应的方向探索。我不明白这种小小的探地雷达初始化如何能够指导探索过程。有人能解释一下如何估计第一个探索部分的输入点(x,z)吗?
发布于 2020-01-22 22:22:00
任何回归算法都只是以特定算法特有的某种方式将输入(x,z)映射到输出y。对于一个新的输入(x0,z0),如果训练中包含了许多类似于此的数据点,该算法可能会预测一些非常接近真实输出y0的内容。如果在一个大不相同的地区提供培训数据,预测结果可能会非常糟糕。
探地雷达包括对预测的置信度,即方差。在以前没有培训数据的区域,差异自然会很大,与已经看到的数据点非常接近,差异很小。如果“实验”比评估高斯过程花费的时间长得多,你可以使用高斯过程来确定你对答案非常不确定的区域。
如果目标是充分探索整个输入空间,您可以绘制大量的(x,z)随机值,并评估这些值的方差。然后,您可以在y中最不确定的输入点执行昂贵的实验。然后,你可以重新训练探地雷达到目前为止所有已探明的数据,并重复这个过程。
优化问题的(不是OP问题)
如果您希望在输入空间中找到y的最低值,那么您对在您知道y值较高的区域进行实验并不感兴趣,但您只是不确定这些值会有多高。因此,与其选择方差最大的(x,z)点,不如选择y的预测值加上一个标准差。这种方法的最小值称为贝叶斯优化,这个特定的方案称为上置信界(UCB)。预期的改进(EI) --提高以前最好分数的概率--也是常用的。
https://stackoverflow.com/questions/59868933
复制相似问题