我正在研究tensorflow的文本和模型,即文本摘要。我在github/textsum上遵循自述文件中指定的命令。它说,存在于数据文件夹中的名为“验证”的文件将在eval步骤中使用,但数据文件夹中没有验证文件。
我想自己做一个,后来意识到它应该是一个二进制文件。因此,我需要准备一个文本文件,它将被转换为二进制文件。但该文本文件必须具有特定的格式。是否与列车步长文件相同?我可以用同样的文件来表示火车步长和标准步长吗?我遵循的步骤顺序如下:
第一步:使用对玩具数据集的“更新”文件来训练模型。
第二步:训练持续了一段时间,在running_avg_loss: 3.590769被“杀死”
步骤3:我使用与训练相同的数据和声音文件来执行eval步骤。它在6到7之间继续使用running_avg_loss运行。
我怀疑步骤3,是否使用相同的文件。
发布于 2016-11-21 15:01:59
因此,除非您在训练之后测试您的模型,否则您不必运行eval,以确定培训如何针对它以前从未见过的另一组数据进行。我也一直在唱它,以确定我是否开始过分适合这些数据。
因此,通常您将使用20-30%的整体数据集,并将其用于eval过程。然后,根据您的培训数据进行培训。一旦完成,您就可以在需要的情况下立即运行解码,或者您可以针对从开始时保留的20% - 30%的数据集运行eval。一旦你对结果感到舒服,你就可以运行你的解码来获得结果。
二进制格式应与培训数据相同。
https://stackoverflow.com/questions/40646767
复制相似问题