问BLEU代任务得分
EN

Stack Overflow用户

提问于 2018-04-10 17:34:33

回答 1查看 152关注 0票数 0

在使用LSTM或RNN生成新文本后，如何度量新text.can的质量?我使用BLEU评分，而BLEU则用于评价线对行生成任务，该任务侧重于两行之间的语义相关性。在这里，我没有目标来比较两个句子，因为我完全得到了一个新的文本。

回答已采纳

发布于 2018-04-16 13:08:42

BLEU评分只能用来评价一个或多个参考输出的候选文本输出。

从你的问题中根本不清楚你在尝试什么样的文本生成任务。如果您正在训练一个RNN语言模型，使用单语数据并从中抽取句子，您可以通过使用LM来计算测试文档的困惑程度来评估它，而您知道测试文档写得很好。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/49759797

复制

相似问题

问BLEU代任务得分EN