只是出于好奇因为我一直在想这件事。应用程序Shazam是如何工作的?我知道如何使用它,我说的是编程。应用程序如何聆听歌曲的任何部分,然后给出结果?很明显,它从数据库中接收到它的歌曲信息,但是没有方式可以输入数据库中人类知道的每一首歌。另外,为什么沙扎姆没有不断地更新?新歌不断发行,就像沙扎姆已经把未来的歌曲编在里面了。这对我来说简直是令人难以置信,我只想知道这一切到底是如何运作的。我知道这不是一个有帮助的问题,但谁能澄清一下呢?谢谢!
发布于 2012-07-24 06:10:02
他们在diciu发布的链接上没说多少。
该算法基于傅里叶波,允许将数学函数表示为谐波函数的线性和。这种转换允许时间到频率之间的映射,这正是您创建语音识别所需要的。
我很难相信Shazaam拥有傅氏变换的专利。但是如果你试图建造一个“第二沙扎姆”,你可能会失败,因为他们已经占领了整个市场.
发布于 2012-07-24 15:52:50
Shazam只从Fourier变换开始(这并不奇怪,因为几乎所有的音频处理都是这样工作的)。
如果你愿意的话,你可以读到王艾弗里的原稿。他是Shazam算法的发明者。我碰巧认为它最好被解释为最近邻技术,这就是为什么我们在“数据挖掘技术,第3版”的第9章中将它作为一个例子。
您可能对我们在那里要说的内容感兴趣(5)。
https://stackoverflow.com/questions/11624906
复制相似问题