我想知道与假说相关的数字/分数意味着什么。在我公认的结果中,它通常是一个负数,数量级为数万。例如,一个被解码的假设可能看起来像“什么是苹果”,分数是-70021。所以我想知道这个分数是否表明了这个假设的准确性/可信度。我观察到,这个数字可能包含一系列负数,这似乎与解码结果的置信度/概率/准确性无关。如果没有信心,我怎样才能设定一个假设的门槛,使不准确的结果被过滤掉,并促使使用者重复他的讲话。
ps。我用的是机器人上的口袋狮身人面像。我通过打电话给decoder.hyp().getBestScore()得到分数
发布于 2014-01-01 09:59:38
所以我想知道这个分数是否表明了这个假设的准确性/可信度。
分数是与模型匹配的音频的日志尺度分数(由模型生成的音频的估计)。这与准确性和/或信心无关。信心是可用的ps_get_prob API调用。
我观察到,这个数字可能包含一系列负数,这似乎与解码结果的置信度/概率/准确性无关。
这些数字是负的,因为它们是概率的对数。
如果没有信心,我怎样才能设定一个假设的门槛,使不准确的结果被过滤掉,并促使使用者重复他的讲话。
可以通过在subversion (分支/kws)中实现关键字点搜索来设置关键短语的验证阈值,并将很快发布。要启用它,您需要设置配置-kws“短语”-kws_threshold阈值。
https://stackoverflow.com/questions/20825654
复制相似问题