首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >带约束的平滑和过采样

带约束的平滑和过采样
EN

Data Science用户
提问于 2019-06-28 13:39:01
回答 1查看 353关注 0票数 2

我正在尝试将SMOTE应用于具有时间限制的数据集。我有关于用户访问一个网站的信息。对于某些特性,有时间限制,例如第一次访问和最后一次访问网站,第一次访问(时间戳)总是低于或等于上次访问。如果我申请SMOTE(或SMOTENC的分类),我最终有合成样本,最后一次访问发生在第一次访问之前。这导致了一个在现实世界中不存在的样本,因此可能会对模型的性能产生负面影响。有没有一种方法可以运用打击炮和强制执行某些规则。或者,是否有过度抽样技术可以解决这一问题?

EN

回答 1

Data Science用户

发布于 2020-11-30 15:39:28

一种选择是做一些类似于自举的事情,因为这将是重新采样现有的数据。

另一种选择是生成额外的样本,然后根据约束进行剪枝。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/54690

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档