我在一个小的测试集(5个例子)上运行textsum解码,但是参考文件和解码文件都已经有几千行了。解码看起来似乎无限期运行,这是有原因的吗?它是否在重复处理同一组示例?后期的产出是否应该比之前的产出更好?
我很喜欢这方面的一些直觉;我还没有找到一个明确的解释。
发布于 2017-07-02 09:24:31
是的,你的想法是正确的,相同的输入被重复地用于生成输出。但是,您可以将输出限制为只有一个。不久前,我通过修改输出写入文件的seq2seq_attention_decode.py来做到这一点。我只给了一次输入,所以在一次输出之后,我想让它停止。
解码似乎无限期运行的原因是什么?:这只是我的直觉,它应该在不同的运行中给出不同的摘要。当在与训练机器不同的机器上运行decode时,它应该使用生成新模型,因此会给出不同的输出。随着训练过程的继续,这可能是一种监控输出变化的方法。
https://stackoverflow.com/questions/43417850
复制相似问题