我一直在关注this链接以使用textsum。我已经使用提供的命令训练了模型。但我在'textsum/log_root/‘目录中没有看到任何'train’文件夹。由于训练是在样本文件上进行的,因此该模型是否能够处理实时测试数据?如果没有,我如何制作训练数据和训练模型?最重要的是,我如何测试/使用模型来查看结果摘要?
发布于 2016-10-15 01:36:53
老实说,我不能回答如果您正确地传递了所有参数,为什么您在log_root目录中看不到列车文件夹。另一件需要注意的事情是确保你等待的时间足够长。因此,当您使用Textsum执行训练运行时,您是否看到任何详细的日志,指出有一些错误,如没有文件列表等。如果是这样,那么您传递给其中一个参数的路径可能是关闭的。它也是相对于您从中调用它的路径的,所以您需要确保您位于工作区文件所在的根路径。
另外,你使用的是CPU还是GPU?如果您使用的是CPU...it,则模型需要一段时间才能达到甚至能够写出数据的程度。现在,如果你使用的是图形处理器,这会快得多,但你需要等到你看到"average_loss“日志开始打印到你的屏幕上。一旦你注意到这些,你很有可能会看到你的“火车”文件夹中有数据。
至于“实时”测试数据,我自己仍然在研究这一点,现在我已经在模型中训练了我的当前数据,我也将开始这方面的工作。到目前为止,我所理解的方向是,一旦你训练了你的模型,并有了你的pickle文件或任何ti,你就可以使用这里的信息来“服务”它:https://tensorflow.github.io/serving/
在这一点上,你的模型已经训练好了,你可以对它进行查询并输入新的响应,这样随着时间的推移,你的模型就会变得更智能。同样,我还没有用一个例子来证明这一点,但这是我即将在这里开始的方法。
关于“测试模型”,您可以按照textsum git上提供的说明进行操作,重新生成vocab文件,然后进行训练。然后,在您将平均损失降低到足够小的分数后,您可以对数据运行解码。然后,在您的log_root解码文件夹中,您将看到生成的标题及其相关的参考文件(实际标题是什么)。希望这能帮上忙,祝你好运!
https://stackoverflow.com/questions/39206413
复制相似问题