背景
我正在从事一个项目,其中视频和音频是MKV源文件的算法解释,在该项目中,我使用ffmpeg、-ss和-t提取音频和视频的特定区域以分离文件。我在音频过程中使用视频中的场景变化(即视频场景上的音频变化),所以同步是至关重要的。
音频是48千赫,使用512个样本块。视频是23.976fps (我也尝试了24)。
我以累积块的形式将sceneChanges的帧开始存储在一个文件中:
blocksPerFrame = (48000 / 512) / 23.976
sceneOnsetBlock = sceneOnsetFrame*blocksPerFrame我在音频代码中使用这些块将与每个场景关联的样本作为一个组来处理。
当我将音频和视频组合回一起(目前使用ffmpeg在MKV容器中生成mp4(v) mp3(a) )时,音频和视频开始同步,但是越来越多地漂移,直到它结束于大约35秒。最糟糕的是音频滞后是非线性的!所谓非线性,我的意思是,如果我用时间滞后的位置绘制滞后图,我没有得到一条线,但是你在下面的图像中看到了什么)。由于这种非线性,我不能只是移动或缩放音频来适应视频。我无法找出这种非线性增加的音频延迟的原因;我已经双倍和三倍地验证了我的数学。

因为我知道场景更改的确切时间,所以我应该能够为mkvmerge生成“外部时间代码”(从上面的块)来完美地同步输出!
分问题:
谢谢!
发布于 2017-04-19 17:32:02
最后,我在代码中解决了问题的原因,所以我从来不需要遵循上面的想法。在与mkvmerge作者的讨论中,我确定了以下答案:
https://stackoverflow.com/questions/43359375
复制相似问题