首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Youtube内容识别技术?

Youtube内容识别技术?
EN

Stack Overflow用户
提问于 2009-03-16 02:56:22
回答 1查看 13K关注 0票数 31

我不确定Youtube是否是唯一有这种技术的网站,但YT (Content )中的内容识别基本上是一种自动识别和删除侵犯版权行为的技术。你可以在这里读到更多关于它的内容:

http://www.youtube.com/t/contentid

嗯,当我的一个视频(包含一个特定的音乐曲目)因为侵犯版权而被标记和删除时,我认为它的内容-ID系统可能是愚蠢的。所以我做了一些实验:没有一个欺骗了过滤器~

  • 在歌曲的中间加上了一连串的嗡嗡声
  • 通过这首歌几次改变了音高
  • 把音量改了几次
  • 调整速度
  • 添加了一个音频覆盖
  • 添加了一些音频效果

另一方面,我不知道有任何材料被错误地与版权相匹配。例如,一首歌曲的钢琴版本不会错误地触发审查人员。

我不是在抱怨我的视频被删除了。我只是惊讶于内容审查的效率有多高。我想知道算法如何正确地识别这首歌是侵犯版权的,即使在我努力规避它之后也是如此。任何直接匹配的尝试都会被彻底击败,任何涉及音符模式的算法都可能被蜂鸣声和音高变换所愚弄。

这与其说是一个紧迫的问题,不如说是我的好奇心。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2009-03-16 03:35:51

佩德罗·莫雷诺和Google/Youtube上的其他人都在做这方面的工作。他们使用有限状态换能器来识别音乐电话单元的序列,类似于自动语音识别中的音素。

查看这篇文章:

  • Eugene Weinstein,Pedro J. Moreno;加权有限状态换能器的音乐识别,国际声学、语音和信号处理会议记录,2007年。

如果你改变整个歌曲的速度或音高,我很惊讶这些算法仍然能识别这首歌。但也许他们能够规范音高和速度(利用节拍之间的时间)来识别覆盖的版本,而不仅仅是原始版本。但这并不奇怪,它可以忽略您添加的蜂鸣声,因为在您的音频流有足够的相似性,否则。

(实际上,基于有限状态的算法在我的iTunes库中应用是很棒的,可以正确标记文件。因为像MusicBrainz这样的服务或多或少地依赖于音频和数据库条目的精确散列匹配,而换能器方法在识别文件时似乎更宽容。)

票数 22
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/649116

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档