首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >H2O汽水允许以卡夫卡作为流媒体来源的在线培训吗

H2O汽水允许以卡夫卡作为流媒体来源的在线培训吗
EN

Stack Overflow用户
提问于 2019-03-27 21:30:38
回答 1查看 93关注 0票数 0

我目前正在试验Sparkling-Water的可能性。有一些可能的用例,包括H2O/Spark中的数据传递,模型构建和离线培训和在线流预测。我想知道是否也可以使用Sparkling-Water与Kafka Streaming Source一起进行在线培训?

EN

回答 1

Stack Overflow用户

发布于 2019-03-27 22:17:18

特别是深度学习模型,如果你不断展示新数据,它可以永远持续训练。所以你可以用它做在线训练。

像DRM和GBM这样的模型可以使用检查点从新数据“添加另一棵树”,尽管您确实不希望以无限树结束。

您可以保留一个数据窗口,并定期训练一个新的完整模型。(在运行时换入新的模型实例非常简单。因此,您可以在后台继续训练,并定期更新预测流数据的模型-例如每小时或每隔几分钟,或其他任何情况)。

或者,通过平均许多模型的预测来进行您自己的集成-定期丢弃旧模型,并在传送带类型的策略中添加新模型。类似于移动平均线。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/55378452

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档