16 17 187 8 9 10 11 12第一行中的计算-一次只考虑两个矩阵中的四个元素(0表示填充):
(1-8)+(2-9)+(3-10)+(4-(2-9)+(3-10)+(4-11)+(5-12): This replaces 2 in initial matrix.(3-10)+(4-11)+(5-12)+(6-0): This replaces 3 in initial matrix.(4-11)+(5-12)+(6-0)+(0-0): This replac
我正在玩一个信用欺诈检测数据集在Kaggle。包含约0.1%欺诈交易的不平衡数据集。这些特性是由+ time & txn量完成的PCA练习中的28台PC,以及用于合法/欺诈txn的类变量0/1。然而,我发现个人电脑在欺诈案件中仍然是相关的(如果你将数据集分解成合法/欺诈案件)。对于使用朴素贝叶斯分类器进行欺诈检测,什么是最好的方法来最小化这种影响?然而,我似乎并不认为删除离群点是一个明智的选择,因为欺诈本身可能是一个离群点。在不删除