首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >机器学习中的时态问题

机器学习中的时态问题
EN

Data Science用户
提问于 2018-04-17 15:11:00
回答 1查看 265关注 0票数 5

概念漂移是指模型试图预测的目标变量的统计特性随时间以不可预见的方式发生变化。

参考经典的房价预测用例:

随着时间的推移,房价会发生变化,因此,我今天使用的模型在未来可能毫无意义。

解决概念漂移的最佳方法是什么?

  • 我们是否不断更新过去的房价取代旧房价的投入?
  • 我们是否为“销售日期”添加了额外的功能--通过将一个时间方面作为具有较大数据集的特性来添加?
  • 我们是否最终会在训练期间改变模型的超参数,以建立一个更适合新数据的模型?
EN

回答 1

Data Science用户

回答已采纳

发布于 2020-10-18 15:30:52

从总体上讲,不可能使概念偏离。但对于房价的波动,我可以给出两个类似的答案:

  • 作为其他价格,漂移通常是很好的测量和研究。正如人们会修正通胀的价格一样,人们可以用一个住房指数(通常是美国的这个指数 )来修正过去的房价。它将帮助您的模型具有多年来可比较的价格。
  • 处理漂移的另一种方法是考虑具有类似漂移的相关变量的比率。就房价而言,这可能是该社区的中等收入。这会给你一个对整体漂移不那么敏感的变量。

正如您所看到的,这两种方法在实践中几乎是等价的,因为它主要包括纠正特性,并最终纠正目标。主要的区别在于,在第一种情况下,您直接谈论美元,而美元通常更面向业务。如果你试图用你的模型来预测未来,并且需要预测住房指数或工资中位数,那么这些方法的应用就会变得有点困难。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/30430

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档