首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >关于特征工程的建议

关于特征工程的建议
EN

Stack Overflow用户
提问于 2019-04-11 08:35:25
回答 1查看 102关注 0票数 2

我在功能工程过程中遇到了一个问题。寻求一些建议。问题陈述:我有多个客户3天的使用数据。有些只使用1天,有些使用2天,有些使用3天。数据与每天发送的电子邮件/添加的联系人数量等相关。

我正在将此时间序列数据转换为列,即,客户在day1上发送的电子邮件数量作为一个功能,客户在day2上发送的电子邮件数量作为一个功能,等等。但问题是,对于不同的客户,使用可以是升序或降序。

例如,示例1:客户'A‘-->’1日发送的电子邮件数‘= 100。‘第2天发送的电子邮件数‘=0

示例2:客户'B‘-->’1日发送的电子邮件数‘=0。‘第二天发送的电子邮件数‘=100

示例3:客户'C‘-->’1日发送的电子邮件数‘=0。‘第2天发送的电子邮件数‘=0

示例4:客户'D‘-->’1日发送的电子邮件数‘= 100。‘第二天发送的电子邮件数‘=100

在前两种情况下,我的新特性将有"-100“和"100”作为值。我猜这对区分很有好处。但是问题出现在第3列和第4列,因为在这两种情况下,新的特征值都将是"0“。有没有人能建议一种方法来处理这个问题

EN

回答 1

Stack Overflow用户

发布于 2019-11-13 05:22:25

您可以提取以下特征:

  1. Simple分别对第二天和第三天的进行移动平均。这意味着与前一天相比,您现在有两个额外的columns.
  2. Percentage更改
  3. 百分比从第1天更改为第3天
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/55623095

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档