因此,我试图用R编写我的欺诈检测算法,我有一个数字值(欺诈性),与某个用户在向量中实施欺诈的可能性成正比。如何创建一个新列,说明它是高、中还是低,考虑到“欺诈性”的一些敏感性(即,如果state 6>‘舞弊’> 0.3,那么它是低的,如果在0.6到0.8 MED之间,而高如果它是0.8或更高。
这是我的输入和预期输出
灵敏度:极低- 0,低- 0.3,中等- 0.6,高- 0.8
输入(df)
ID fraudval
1 0.4
2 0.8
3 0.2
4 0.6输出(df)
ID fraudval test
1 0.4 LOW
2 0.8 HIGH
3 0.2 VERY LOW
4 0.6 MEDIUM提前谢谢!:D
发布于 2015-07-22 13:03:36
我会用cut
R> df$test <- cut(df$fraudval, c(0,.3,.6,.8,Inf),
+ c("VERY LOW", "LOW", "MED", "HIGH"), right=FALSE)
R> d
ID fraudval test
1 1 0.4 LOW
2 2 0.8 HIGH
3 3 0.2 VERY LOW
4 4 0.6 MEDhttps://stackoverflow.com/questions/31563853
复制相似问题