首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在keras seq2seq模型中,`model.predict()‘和推理模型有什么区别?

在keras seq2seq模型中,`model.predict()‘和推理模型有什么区别?
EN

Data Science用户
提问于 2021-08-10 13:42:31
回答 1查看 86关注 0票数 1

我正在研究keras中的seq2seq模型,例如,来自keras或的这个博客帖子。我看到的所有例子都有一些推理模型,描述了原来的模型。然后使用该推理模型进行预测。

我的问题是为什么我们不能直接做model.predict()。我的意思是,我们可以这样做,因为我已经使用了它,它可以工作,但是这两种方法之间有什么区别呢?使用model.predict()并为argmax做反向单词标记器是错误的吗?

EN

回答 1

Data Science用户

回答已采纳

发布于 2021-08-10 14:22:44

我理解“我看到的所有示例都有一些描述原始模型的推理模型”,您的意思是有一个函数可以对模型执行复杂的操作,而不仅仅是调用model.predict()。这种函数在链接示例中称为decode_sequence

请注意,您不能只调用一次model.predict(),因为您没有任何输入可提供给解码器。

这种类型的seq2seq模型的特点是它们是自回归的。这意味着他们根据先前的预测来预测下一个令牌。因此,您需要一次预测一个令牌:首先,您预测第一个令牌,然后使用这样的预测再次调用模型,以获得下一个令牌,依此类推。这正是decode_sequence函数所做的:它只是调用model.predict()来获取下一个令牌,直到满足停止条件,即要么预测\n令牌,要么预测最大数量的令牌。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/99897

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档