我在学习视频压缩时遇到了运动补偿技术。在学习材料中,我用图片进行了解释,但有一些部分我不太了解。

当左侧帧为f0,右侧帧为f1时,两个帧之间的差异是篮球和新出现的手套的位置。
可以通过仅发送关于两个帧(f1-f0)之间的差的数据和特定对象的运动信息来减少传输数据。
此外,还写道,对于未出现在前一帧中的新部分,例如手套,最好不使用帧之间的差异而按原样发送数据。
但在这里,我不知道为什么需要f1-f0的数据,如果接收器有帧f0。难道我们不能只发送篮球运动信息的数据和新出现的手套的数据吗?我不知道为什么两个框架之间的差异是必要的。
如果在第f1帧中只有篮球在没有手套的情况下移动,那么是否可以通过仅发送运动信息来形成第f1帧?如果只发送移动信息是不正确的,我想知道为什么。
发布于 2021-10-07 18:27:26
是的,对于这个卡通例子,你只需要发送关于球的运动和手套外观的信息。然而,在一个真实的视频中,已经做到了这一点,现在在f1中暴露的球背后隐藏着什么?球看起来是完全一样的吗--它不是旋转了吗?场景中还发生了什么变化?
你要做的就是对物体从f0到f1的运动进行建模,将该模型应用于f0,现在你就得到了一个不完美的f1‘。现在,您还希望发送f1 - f1‘来获取其余的差异。这种差异将在心理视觉上进行压缩,只保留重要的内容。(差异将包括手套的外观。)对球的运动进行建模减少了差异,因此现在f1‘- f0加上球的范围和移动向量应该比f1 - f0需要发送的比特更少。
https://stackoverflow.com/questions/69485061
复制相似问题