我正在建立一个基于银行违约分类的ML项目,获得56%的低精度分数和61%的精度。我知道这一点还可以进一步改进。请告诉我一些能提高分数的因素。
数据是关于贷款偿还,我不得不将客户归类为拖欠或非Defaulters.My的列车测试比率为70%:30%。
‘X=loan.drop("loan_status",axis=1) Y=loan“loan_status”Xtrain,Xtest,Ytrain,Ytest=train_test_split(X,Y,test_size=0.30,random_state=6) loan_model=LogisticRegression() Prediction=loan_model.predict(Xtest)分类报告:精确召回F1-分数支持
0 0.41 0.22 0.29 59
1 0.61 0.79 0.69 91微观avg 0.57 0.57 0.57 150宏avg 0.51 0.51 0.49 150加权avg 0.53 0.53 0.53 150混淆矩阵:[1346]准确度评分:准确性评分为: 0.5666666666666667
发布于 2019-10-16 21:10:27
在没有看到您的数据或代码的情况下,我们只能向您提供关于提高您的准确性的一般建议。以下是我脑海中想到的两个主要问题,
1-低精度的分类意味着您的类是,不能很好地与当前的特性分离。解决这个问题的方法是找到更多(更好)的特性。
2-如果你有足够的观察,尝试使用更复杂的决策边界的模型,例如SVM或具有深层和神经元的神经网络。
https://stackoverflow.com/questions/58403687
复制相似问题