我正在开发一个系统,我需要一个词或句子中的每个音素的起始框架,结束框架和分割分数。我一直在使用Sphinx-3命令: sphinx3_align,以获得以下结果(示例):
SFrm EFrm SegAScr Phone
0 21 -67327 SIL
22 37 -236740 AH SIL K b
38 41 -61028 K AH S i
42 56 -82368 S K EH i
57 67 -106366 EH S P i
68 86 -101908 P EH T i
87 106 -89226 T P SIL e
107 113 -82281 SIL
Total score: -827244问题是,我必须多次运行这个命令,这在我的服务器中消耗了大量内存。我尝试在一个控制文件中传递许多输入,但是这需要很长时间来处理,并且我的应用程序不能有很高的响应时间。
因此,为了减少维护响应时间的内存,我尝试在Sphinx-4中实现相同的系统。这样,我就可以在对齐后立即返回结果,而不必每次运行应用程序时卸载它。
我的疑问是,在狮身人面像-4中是否可能出现上述输出(类似于sphinx3_align)?
发布于 2012-10-22 21:38:27
在目前的状态下,这是不可能的。此功能未实现。
https://stackoverflow.com/questions/13016499
复制相似问题