我在功能工程过程中遇到了一个问题。寻求一些建议。问题陈述:我有多个客户3天的使用数据。有些只使用1天,有些使用2天,有些使用3天。数据与每天发送的电子邮件/添加的联系人数量等相关。
我正在将此时间序列数据转换为列,即,客户在day1上发送的电子邮件数量作为一个功能,客户在day2上发送的电子邮件数量作为一个功能,等等。但问题是,对于不同的客户,使用可以是升序或降序。
例如,示例1:客户'A‘-->’1日发送的电子邮件数‘= 100。‘第2天发送的电子邮件数‘=0
示例2:客户'B‘-->’1日发送的电子邮件数‘=0。‘第二天发送的电子邮件数‘=100
示例3:客户'C‘-->’1日发送的电子邮件数‘=0。‘第2天发送的电子邮件数‘=0
示例4:客户'D‘-->’1日发送的电子邮件数‘= 100。‘第二天发送的电子邮件数‘=100
在前两种情况下,我的新特性将有"-100“和"100”作为值。我猜这对区分很有好处。但是问题出现在第3列和第4列,因为在这两种情况下,新的特征值都将是"0“。有没有人能建议一种方法来处理这个问题
发布于 2019-11-13 05:22:25
您可以提取以下特征:
https://stackoverflow.com/questions/55623095
复制相似问题