首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >基于Logistic回归模型的特征重要性

基于Logistic回归模型的特征重要性
EN

Data Science用户
提问于 2019-11-12 13:04:58
回答 1查看 673关注 0票数 1

我在一个包含1000列的相当大的数据集上训练一个Logistic回归模型。

我确实使用MinMaxScaler对特性进行了缩放。

我想知道如何解释模型生成的系数,并在基于树的模型中找到类似于特征重要性的内容。

我是否应该将系数重新刻度回原来的比例,以便正确地解释模型?

如果有人能说明如何正确地解释Logistic回归系数,那就太好了。

EN

回答 1

Data Science用户

回答已采纳

发布于 2019-11-12 13:30:48

不,你不需要重新调整系数。相反,如果它们是缩放的,您可以使用它们来比较特性的重要性。

假设我们的logistic回归模型有系数{ a_i},与不同的(缩放)变量{x_i}有关。

\Delta x_i 在变量x_i 中的变化将导致log({\hat p_i \over {1-\hat p_i}}) a_i \Delta x_i 的增加(或减少,如果a_i为负值),即\hat p_i 洛吉特函数,其中\hat p_i 是第一个例子在正类中的预测概率。

因此,如果变量被缩放,你可以说如果a_i更大,那么x_i在模型中更重要。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/63045

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档