我试图通过以下方法获得SpeechResult的信心分数
ConfidenceResult cr = scorer.score(result);
其中result是SpeechResult,scorer是ConfidenceScorer。结果发现这是不允许的。除了使用Result类型之外,还有什么方法可以避免这种情况吗?
发布于 2014-08-27 22:42:01
是的,你可以这样做,虽然有点迂回。自信的结果实际上是香肠(不,不是开玩笑的,这就是它的名字:狮身人面像:香肠 )。虽然它也被称为单词混淆网络,但它有时被称为香肠,因为它看上去像个香肠。见图1. 哈卡尼-图尔,et。阿尔。。这篇论文对于理解自信和语音识别是一个很好的参考,虽然它有点长,但我强烈建议阅读那些你可能会发现相关的章节,如果你对演讲感兴趣的话。它描述了Pivot算法,它用于狮身人面像4中的类:PivotSausageMaker)。
不管怎样,关键是你可以从你的SpeechResult中得到一个格子。格是一个图,它是识别器产生的所有假设的浓缩形式。您可以将您的格给一个SausageMaker,并调用SausageMaker.makeSausage(),这将给您一个香肠,它是一个ConfidenceResult (注意:调用SausageMaker.score(结果结果)只是从结果生成一个格,然后调用它自己的makeSausage方法)。不幸的是,ASR置信度值并不十分清楚,如何最好地计算、处理和理解它们是一个开放的课题。
另一种可能是你可以从你的SpeechResult中获得WordResult's中的信心分数。
希望这能帮上忙!
https://stackoverflow.com/questions/25517104
复制相似问题