发布于 2021-08-10 14:22:44
我理解“我看到的所有示例都有一些描述原始模型的推理模型”,您的意思是有一个函数可以对模型执行复杂的操作,而不仅仅是调用model.predict()。这种函数在链接示例中称为decode_sequence。
请注意,您不能只调用一次model.predict(),因为您没有任何输入可提供给解码器。
这种类型的seq2seq模型的特点是它们是自回归的。这意味着他们根据先前的预测来预测下一个令牌。因此,您需要一次预测一个令牌:首先,您预测第一个令牌,然后使用这样的预测再次调用模型,以获得下一个令牌,依此类推。这正是decode_sequence函数所做的:它只是调用model.predict()来获取下一个令牌,直到满足停止条件,即要么预测\n令牌,要么预测最大数量的令牌。
https://datascience.stackexchange.com/questions/99897
复制相似问题