在维基百科中,ROUGE-SU度量的定义如下:
ROUGE-SU:跳过双图加基于单格的共现统计.
我的问题是,这个度量的精确公式是什么?鲁日-苏度量背后的直觉是什么?
提前谢谢你。
发布于 2017-01-24 15:04:13
S的意思是跳过bigram。它的意思是匹配两个非连词(即与其他词之间),这允许重新措辞和句子重组。由于ROUGE评分被认为是评价自动摘要,这是一个很好的点。
U的意思是单位,即1克,=计数普通单词。
因此,SU的意思是,我们同时计算跳过双格和方幂。重点是要制作一个软的跳过比格,我们可能不想给一个句子分配0的分数,仅仅因为它没有共享一个跳过的二进制数,而它有一个普通的单数。
你明白重点了吗?
无论如何,请注意,没有任何胭脂评分本身是完美的。你总是应该得到几个不同特征的值。
希望这能有所帮助
pltrdy
另外,我开发了一个脚本来计算两个文件之间的ROUGE分数。在这里找到它:https://github.com/pltrdy/files2rouge
https://stackoverflow.com/questions/41808030
复制相似问题