我正在将2d图像转换为3d环境。这些图像是从一段横向运动的视频中收集的。然后将图像一个接一个地放置,因此很容易找到两个图像之间的对应关系。这就是所谓的时空卷。


接下来,我从时空卷中取一片。这个切片被称为外极平面图像。

使用外极平面图像,我想计算场景中物体的深度,并创建一个3D环境。我已经列出了参考文献,但我还不能理解论文中描述的数学。有人能帮我解决这个问题吗?任何帮助都是非常感谢的。
参考文献
Epipolar-Plane Image Analysis: An Approach to Determining Structure from Motion* !
发布于 2015-07-28 19:32:50
在这种情况下,数学是简单而直接的。
首先,让我们定义两个坐标系统,两个重叠的图像由相同的相机拍摄,焦距
具有以下架构:

假设第一个相机位置定义如下:
而使用三个欧拉角的方向是:
通过使用这个定义,相应的旋转矩阵是单位矩阵
第二个摄像头位置可以定义如下:
由于方向与第一个摄影机相同,因此所有的Euler角度都保持为零:
这也意味着相应的旋转矩阵是单位矩阵。
如果图像重叠且方向相同,则图像空间中的情况如下:

这里,图像坐标及其测量精度定义如下:
这种几何情况可以通过使用Intercept Theorem来描述
如您所见,这并不复杂。但请注意,这种解决方案肯定不是最好的,因为它是所有方向角都相同的基本假设,在现实中是不可能实现的。
如果您需要精确,那么您必须执行捆绑调整。但是,此方程通常用于确定此几何情况的近似解,其中值用于线性化共线方程。
https://stackoverflow.com/questions/31638847
复制相似问题