首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Python - sklearn pipeline SVC f_regression -获取列名

Python - sklearn pipeline SVC f_regression -获取列名
EN

Stack Overflow用户
提问于 2017-06-21 12:15:25
回答 1查看 706关注 0票数 0

我正在尝试从这个代码片段中提取列名:

代码语言:javascript
复制
anova_filter = SelectKBest(f_regression, k=10)
clf = svm.SVC(kernel='linear')
anova_svm = make_pipeline(anova_filter, clf)
f_reg_features = anova_svm.fit(df_train, df_train_y)

我尝试了其他一些建议,比如这个,但我不能让它起作用:

How to get feature names selected by feature elimination in sklearn pipeline?

提前谢谢。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-06-21 23:48:33

使用eli5库(免责声明:我是作者之一),您可以这样做:

代码语言:javascript
复制
# the original example:
from sklearn.feature_selection import SelectKBest, f_regression
from sklearn import svm
from sklearn.datasets import make_classification
from sklearn.pipeline import make_pipeline
import pandas as pd

X, y = make_classification(n_features=5, n_informative=5, n_redundant=0)
df_train = pd.DataFrame(X, columns=['A', 'B', 'C', 'D', 'E'])
df_train_y = pd.DataFrame(y)

anova_filter = SelectKBest(f_regression, k=3)
clf = svm.SVC(kernel='linear')
anova_svm = make_pipeline(anova_filter, clf)
f_reg_features = anova_svm.fit(df_train, df_train_y)

然后:

代码语言:javascript
复制
import eli5
feat_names = eli5.transform_feature_names(anova_filter, list(df.columns))

它的工作方式类似于Vivek Kumar的建议;优点是统一的API -不需要为每个转换器记住这样的代码片段。

如果您将SVC(内核=‘线性’)替换为sklearn.linear_model.LinearSVM (这也应该更快),您可以这样做:

代码语言:javascript
复制
eli5.show_weights(anova_svm, feature_names=list(df.columns))

然后得到一个这样的表:

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/44666788

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档