假设我有一个数据集,我希望选择与预测结果相对应的特征比其他特征更好。我已经实现了一些功能排名测试,结果如下:

对于预测模型,我选择了具有最佳“均值”值的特征。
X = oil_10[['Sidetrack Code','Well Type Code','Well Status
Code','Producing Formation','Water Produced, bbl','County']]以下是带有“最佳选择特征”的预测模型结果:
RandomForestRegressor
0.390502562474以下是所有数据集特征的预测模型的结果,没有任何选择:
RandomForestRegressor
0.741878611892如何使用特征排名结果来实现最佳预测结果?
发布于 2017-11-02 22:49:02
好吧,我试着这样解决我的问题:我只是去掉了最不重要的特征(平均重要性值小于0.15),准确率仍然是75%,但现在预测模型的工作速度要快得多。
https://stackoverflow.com/questions/47059390
复制相似问题