不久前,我在一家德国公司的网站上看到了一系列有趣的视频演示。他们处理在播放时修改视频流,这种技术的准确性和流畅性给我留下了深刻的印象。在所有这些演示中,我认为one of them在动态播放视频中的文本混合方面相当吸引人。它允许你在视频播放时在文本框中输入字符串,并以逼真的准确性嵌入你在视频中编写的文本的转换变体。我的问题是,如果你碰巧知道这样的功能需要什么样的算法,我如何通过编程在视频流中嵌入实时文本和图像?有没有我应该查阅的研究论文或图书馆的详细信息?
PS。不要因为视频的内容而激怒我,我感兴趣的是编程技术,视频是我能找到的最好的例子。
发布于 2009-11-28 05:52:55
它被称为增强现实,有许多库和工具包可以实现这一点,例如artoolkit http://www.hitl.washington.edu/artoolkit/
发布于 2009-11-28 08:13:13
要做到这一点,您只需在渲染帧之前对其进行仲裁。
基本上:
修改frame
的
真的没有一个算法可以做到这一点。
发布于 2009-11-28 18:49:20
好的,我看了你的例子。由于这是预先录制的视频,他们可能只需手动将盒子的四个角描绘到目标表面上。然后渲染,你只需要做一个透视变换你的文本,到目标矩形。让它混合可能只是选择好的颜色,分层,颜色变换和透明度的艺术。这里没有什么特别神奇的东西,只是标准的photoshop风格的图形算法,其中大多数可能只是内置在flash中。
https://stackoverflow.com/questions/1810724
复制相似问题