我想使用递归特征消除(RFE)在我的数据库上使用随机森林的特征选择。我想出了一个密码:
from sklearn.feature_selection import RFE
# Create the RFE object and rank each pixel
clf_rf_3 = RandomForestClassifier()
rfe = RFE(estimator=clf_rf_3, n_features_to_select=6, step=1)
rfe = rfe.fit(X_train, y_train)
print('Chosen best 5 feature by rfe:',X_train.columns[rfe.support_])但是在执行之后,我得到了一个错误:
numpy.ndarray' object has no attribute 'columns'这是真的,因为X_train是一个'numpy.ndarray‘,没有列。
我想要的是找到所选功能的名称。但是大多数代码要么给出所选特性的数量,要么给出相对的列索引。
我尝试将代码X_train.columns[rfe.support_]替换为X_new.columns[rfe.support_] (在该代码中,X_ new是一个Dataframe,它包含了我的所有特性,然后我将它缩放并分割为训练和测试),我得到了一个结果。但我不确定我是否应用了正确的解决方案。
发布于 2022-10-27 08:19:44
这段代码片段似乎期待着熊猫的数据。对于numpy数组,X_train[:, rfe.support_]应该成功。
https://stackoverflow.com/questions/74214863
复制相似问题