我的主要问题是:给定一组引用语音文件(从语音短语中提取的特征列表)和一个查询语音输入,我需要从我的引用中找到一个最好的数学。重点是不要搜索所有的内容,而是尽可能地删除它们。有人能给我指出一个有效的算法来解决这个问题吗?或者有没有开源的代码来解决这些问题?谢谢
发布于 2013-01-08 07:37:23
我假设参考文件中所说的文本与查询文件中的文本相同。这样做的一种常见方法是简单地将每个引用文件与查询文件进行比较。通常,您将使用Dynamic Time Warping算法--维基百科上的文章有几个实现的链接,您自己实现它并不太难。基本思想是尝试对齐这两个文件,然后选择与查询最匹配的引用。
我知道你说过你不想比较每一个例子。在这种情况下,我的第一个想法是对引用文件进行集群。离线时,您可以将参考文件相互比较,并将相似的文件分组在一起。当涉及到查询时,您只能与每个集群中的一个示例进行比较。然后根据结果与最近的一个或多个群集中的所有文件进行比较。
这只是一个想法,我相信还有其他想法。
发布于 2015-06-10 04:51:16
一种常用且有效的方法是建立参考语音文件的索引作为有限状态转换器。参见Cyril Allauzen,Mehryar Mohri和木拉提·萨拉克拉尔(HLT-NAACL2004)的论文《加权自动机的通用索引:口语检索的应用》( http://acl-arc.comp.nus.edu.sg/archives/acl-arc-090501d4/data/pdf/anthology-PDF/W/W04/W04-2907.pdf
https://stackoverflow.com/questions/13987302
复制相似问题