我需要做一个Android应用程序,可以识别我创建的某些声音文件,并在识别时执行操作。所以类似于Shazam/Soundhound的东西,但有我自己的声音文件。有没有什么API或者SDK之类的东西?我读过关于Echoprint的文章,但我知道它适用于Windows和iOS,这对我来说似乎相当困难。这样行得通吗?或者还有其他选择吗?
PS:为了清楚,我不想要语音识别,或者文本到语音转换。我的声音文件可以有音乐,失真的声音,效果等
发布于 2014-08-04 19:17:11
一年后,我最终使用了为Android编译的Echoprint,正如here所解释的那样。它得到了一些结果,但一般来说,它的工作相当糟糕,特别是与自定义声音文件。Echoprint不是为OTA识别而设计的。我会推荐它用于测试/原型之类的事情,但不是用于生产。不幸的是,到目前为止,它是唯一一个允许你拥有自己的服务器和声音文件的软件。
发布于 2015-06-24 19:51:54
ACRCloud支持音乐/音频搜索引擎,支持5000万首歌曲/用户上传内容,支持iOS/Android/Linux版本,注册后即可下载(http://console.acrcloud.com/signup)。客户有三个层次:
适用于demo/prototyping
希望这能有所帮助
https://stackoverflow.com/questions/17207371
复制相似问题