文章/答案/技术大牛

发布

社区首页 >问答首页 >在keras seq2seq模型中，`model.predict()‘和推理模型有什么区别？

问在keras seq2seq模型中，`model.predict()‘和推理模型有什么区别？
EN

Data Science用户

提问于 2021-08-10 13:42:31

回答 1查看 86关注 0票数 1

我正在研究keras中的seq2seq模型，例如，来自keras或这的这个博客帖子。我看到的所有例子都有一些推理模型，描述了原来的模型。然后使用该推理模型进行预测。

我的问题是为什么我们不能直接做model.predict()。我的意思是，我们可以这样做，因为我已经使用了它，它可以工作，但是这两种方法之间有什么区别呢？使用model.predict()并为argmax做反向单词标记器是错误的吗？

keras

tensorflow

sequence-to-sequence

inference

回答 1

Data Science用户

回答已采纳

发布于 2021-08-10 14:22:44

我理解“我看到的所有示例都有一些描述原始模型的推理模型”，您的意思是有一个函数可以对模型执行复杂的操作，而不仅仅是调用model.predict()。这种函数在链接示例中称为decode_sequence。

请注意，您不能只调用一次model.predict()，因为您没有任何输入可提供给解码器。

这种类型的seq2seq模型的特点是它们是自回归的。这意味着他们根据先前的预测来预测下一个令牌。因此，您需要一次预测一个令牌:首先，您预测第一个令牌，然后使用这样的预测再次调用模型，以获得下一个令牌，依此类推。这正是decode_sequence函数所做的:它只是调用model.predict()来获取下一个令牌，直到满足停止条件，即要么预测\n令牌，要么预测最大数量的令牌。

票数 1

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/99897

复制

相似问题

问在keras seq2seq模型中，`model.predict()‘和推理模型有什么区别？
EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在keras seq2seq模型中，`model.predict()‘和推理模型有什么区别？EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在keras seq2seq模型中，`model.predict()‘和推理模型有什么区别？
EN