在使用LSTM或RNN生成新文本后,如何度量新text.can的质量?我使用BLEU评分,而BLEU则用于评价线对行生成任务,该任务侧重于两行之间的语义相关性。在这里,我没有目标来比较两个句子,因为我完全得到了一个新的文本。
发布于 2018-04-16 13:08:42
BLEU评分只能用来评价一个或多个参考输出的候选文本输出。
从你的问题中根本不清楚你在尝试什么样的文本生成任务。如果您正在训练一个RNN语言模型,使用单语数据并从中抽取句子,您可以通过使用LM来计算测试文档的困惑程度来评估它,而您知道测试文档写得很好。
https://stackoverflow.com/questions/49759797
复制相似问题