首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >监控生产中的机器学习模型

监控生产中的机器学习模型
EN

Data Science用户
提问于 2019-12-13 12:15:59
回答 7查看 4K关注 0票数 20

我正在寻找工具,允许我监测机器学习模型,一旦他们去生产。我想监测:

  1. 长期变化:特征随培训时间的变化而变化,这将建议对模式进行再培训。
  2. 短期变化:特性中的错误(发行的根本变化)。
  3. 模型相对于给定指标的性能变化。

我一直在网上搜索,但我没有看到对任何案例的深入分析。你能为我提供技术,书籍,参考资料或软件吗?

EN

回答 7

Data Science用户

回答已采纳

发布于 2019-12-14 01:31:41

培训时间分布的变化有时被称为概念漂移。

在我看来,网上提供的关于概念漂移的信息并不多。您可以从它的维基百科页面或一些博客文章开始,比如

在研究方面,您可能想看看乔·的科学生产,或者他的书的第3章。

关于软件包,快速搜索会发现github上有几个python库,比如龙卷风概念漂移

更新:最近我遇到了漂流器,这是一个python库,它似乎符合scikit学习模型问题的要求。

票数 10
EN

Data Science用户

发布于 2020-10-15 07:40:01

读这个自然论文:树木的可解释人工智能:从局部解释到全球理解的时候。第2.7.4节“本地模型监视揭示了以前部署的机器学习模型中不可见的问题”,说明如下:

在实际中部署机器学习模型具有很大的挑战性,因为在部署之后,输入特性可能会发生变化。当发生这样的变化时,很难检测到,因此机器学习管道中的许多错误都没有被检测到,即使是在顶级科技公司78的核心软件中也是如此。我们演示了本地模型监视通过分解模型输入特性之间的损失来帮助调试模型部署,从而直接识别有问题的特性(如果有的话)。这比简单地推测全球模型性能波动的原因是一个重大的进步。

然后,他们用TreeExplainer提供的Shapley值做了3个实验

  1. 我们故意在整个数据集中交换了第6和第13手术室的标签--三分之二--以模仿一个典型的特性管道错误。模型预测的总体损失没有显示问题已经发生(图5A),而6号房间特征的SHAP监视图清楚地显示了标记错误开始的时间。
  2. 图5C显示在部署窗口开始后不久,全麻功能出现了一个峰值。该尖峰对应于受先前未发现的临时电子病历配置问题影响的程序子集(方法17)。
  3. 图5D显示了一个特性随时间变化的示例,而不是处理错误。在训练期间和部署初期,使用“心房颤动”特征可以降低损失;然而,随着时间的推移,这种特征逐渐变得不太有用,最终损害了模型。我们发现,这种漂移是由房颤消融过程持续时间的显著变化引起的,这是由技术和人员配置的变化造成的。

当前的部署实践是监视模型随时间的总体丢失,以及潜在的输入特性统计。TreeExplainer使我们能够直接在各个特性之间分配模型的损失

票数 4
EN

Data Science用户

发布于 2020-03-20 16:11:55

您所描述的是概念漂移,并且有相当多的软件初创公司为市场带来了解决方案(包括我们-很高兴向您展示我们所拥有的)。

  1. 一种非常简单的检测漂移的方法是使用Kolmogorov检验或沃瑟斯坦距离来监测预测数据集和训练数据集的分布之间的差异。
  2. 对于分布中的根本变化,您可能要做的是创建一个模型来理解数据集唯一的模式,并有一个异常点检测器来确定分布的真正根本性变化,而不是同时识别假阳性。
  3. 这是一个有趣的用例--您能够分享一个示例吗?
票数 2
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/64764

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档