文章/答案/技术大牛

发布

问带新样本的增量学习
EN

Data Science用户

提问于 2018-04-06 12:39:26

回答 2查看 1.7K关注 0票数 3

我有一个包含时间戳数据的非常大的数据集。到目前为止，我已经加载了整个数据集，以便使用python (statsmodels.api、statsmodels.formula.api、keras.models.Sequential)来训练一些模型。现在，我想用所有的历史数据一次训练模型，然后用新的数据更新模型(每天我都有新的样本)。使用这些python库是可能的吗？谢谢!

machine-learning

回答 2

Data Science用户

发布于 2018-04-06 13:02:29

这就是机器学习模型的用途.(根据输入的数据来预测他们认为在近期内会发生什么)。

一个简单的答案是

数据的前几天是最重要的，你需要对你的模型进行测量和监视。

和任何增量学习一样，你可以学习更多的新东西，但也比不学习新东西更不适合过去。因此，这就是为什么要对使用增量学习的模型执行监视(特别是在生产系统上)。

前提是其他事物与时间保持相似。(相同的预处理，相同的缩放等)

但是假设您每天都有大量的数据，那么几乎在月底时，模型可以完全针对最后几个月的数据进行培训，否则需要保留检查点。

票数 2

Data Science用户

发布于 2019-07-27 09:04:21

用所有的历史数据一次训练模型，然后用新的数据更新模型(每天我都有新的样本)

似乎你指的是增量ML算法--超越了“实验数据科学”的思维方式。

有关算法设计和使用的示例，请参阅https://scikit-learn.org/stable/auto_例子/分解/情节_增量式_pca.html上的“增量主成分分析”。

如果这有帮助的话，那么您可能想了解一下#ConceptDrift。

一些资源

“概念漂移:流媒体学习应用中的监控模型质量”https://www.lightbend.com/blog/concept-drift-monitoring-model-quality-in-streaming-ml-applications
“增量主成分分析精确实现和连续性修正”https://arxiv.org/abs/1901.07922

票数 0

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/29984

复制

相似问题

问带新样本的增量学习
EN

回答 2

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问带新样本的增量学习EN

回答 2

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问带新样本的增量学习
EN