blocks|key|196629|text|不，你不需要重新调整系数。相反，如果它们是缩放的，您可以使用它们来比较特性的重要性。|type|unstyled|depth|inlineStyleRanges|entityRanges|data|196630|假设我们的logistic回归模型有系数{+a_i}，与不同的(缩放)变量{x_i}有关。|offset|length|style|CODE|196631|196632|\Delta+x_i+在变量x_i+中的变化将导致log({\hat+p_i+\over+{1-\hat+p_i}})+中a_i+\Delta+x_i+的增加(或减少，如果a_i为负值)，即\hat+p_i+的洛吉特函数，其中\hat+p_i+是第一个例子在正类中的预测概率。|196633|因此，如果变量被缩放，你可以说如果a_i更大，那么x_i在模型中更重要。|entityMap|0|INLINETEX|mutability|IMMUTABLE|teX|a_i|1|x_i|2|\Delta+x_i+|3|x_i+|4|log({\hat+p_i+\over+{1-\hat+p_i}})+|5|a_i+\Delta+x_i+|6|7|\hat+p_i+|8|LINK|MUTABLE|url|https://en.wikipedia.org/wiki/Logit|9|\hat+p_i+|10|11^0|0|M|3|12|3|M|3|0|12|3|1|0|0|0|B|E|4|P|Z|1P|F|2E|3|2N|9|35|9|0|B|2|E|4|3|P|Z|4|1P|F|5|2E|3|6|2N|9|7|2X|3|8|35|9|9|0|H|3|P|3|H|3|A|P|3|B^^$0|@$1|2|3|4|5|6|7|1F|8|@]|9|@]|A|$]]|$1|B|3|C|5|6|7|1G|8|@$D|1H|E|1I|F|G]|$D|1J|E|1K|F|G]]|9|@$D|1L|E|1M|1|1N]|$D|1O|E|1P|1|1Q]]|A|$]]|$1|H|3|-4|5|6|7|1R|8|@]|9|@]|A|$]]|$1|I|3|J|5|6|7|1S|8|@$D|1T|E|1U|F|G]|$D|1V|E|1W|F|G]|$D|1X|E|1Y|F|G]|$D|1Z|E|20|F|G]|$D|21|E|22|F|G]|$D|23|E|24|F|G]|$D|25|E|26|F|G]]|9|@$D|27|E|28|1|29]|$D|2A|E|2B|1|2C]|$D|2D|E|2E|1|2F]|$D|2G|E|2H|1|2I]|$D|2J|E|2K|1|2L]|$D|2M|E|2N|1|2O]|$D|2P|E|2Q|1|2R]|$D|2S|E|2T|1|2U]]|A|$]]|$1|K|3|L|5|6|7|2V|8|@$D|2W|E|2X|F|G]|$D|2Y|E|2Z|F|G]]|9|@$D|30|E|31|1|32]|$D|33|E|34|1|35]]|A|$]]]|M|$N|$5|O|P|Q|A|$R|S]]|T|$5|O|P|Q|A|$R|U]]|V|$5|O|P|Q|A|$R|W]]|X|$5|O|P|Q|A|$R|Y]]|Z|$5|O|P|Q|A|$R|10]]|11|$5|O|P|Q|A|$R|12]]|13|$5|O|P|Q|A|$R|S]]|14|$5|O|P|Q|A|$R|15]]|16|$5|17|P|18|A|$19|1A]]|1B|$5|O|P|Q|A|$R|1C]]|1D|$5|O|P|Q|A|$R|S]]|1E|$5|O|P|Q|A|$R|U]]]]

No, you do not need to re-scale the coefficients. To the contrary - if they are scaled, you can use them as a way to compare feature importance.

Let's assume that our logistic regression model has coefficients {$ a_i$}, relating to the different (scaled) variables {$x_i$}. 
A change of $\Delta x_i $ in the variable $ x_i $ will result in an increase (or decrease, if $a_i$ is negative) of $ a_i \Delta x_i $ in $ log({\hat p_i \over {1-\hat p_i}}) $, i.e. the <a href="https://en.wikipedia.org/wiki/Logit" rel="nofollow noreferrer">logit</a> function of $ \hat p_i $, where $ \hat p_i $ is the predicted probability that the i-th example is in the positive class.

So, if the variables are scaled, you can say that if $ a_i$ is larger, then $x_i$ is more important in the model.

I was training a Logistic Regression model over a fairly large dataset with ~1000 columns.

I did apply scaling of features using MinMaxScaler. 

I was wondering how to interpret the coefficients generated by the model and find something like feature importance in a Tree based model. 

Should I re-scale the coefficients back to original scale to interpret the model properly?

It will be great if someone can shed some light on how to interpret the Logistic Regression coefficients correctly.

Feature Importance based on a Logistic Regression Model

翻译质量差，导致语言生硬或混乱。

没有提供实际的解决方法或示例。

解答不清晰，无法理解或解决问题。

页面排版不美观，阅读体验差。

文章

问答

视频

教程

学习中心

腾讯云实验室

直播

竞赛

腾讯云代码分析专区

腾讯iOA零信任安全管理系统专区

腾讯云架构师技术同盟交流圈

腾讯云数据库专区

腾讯云智能顾问专区

腾讯云原生专区

腾讯混元专区

腾讯云TCE专区

腾讯云Lighthouse专区

腾讯云HAI专区

腾讯云Edgeone专区

腾讯云存储专区

腾讯云智能专区

腾讯轻联专区 

腾讯云开发专区

TAPD专区

腾讯轻量云游戏服专区

腾讯云最具价值专家

腾讯云架构师技术同盟

腾讯云创作之星

腾讯云开发者先锋

腾讯云AI代码助手

云原生构建

TAPD 敏捷项目管理

Cloud Studio

SDK中心

API中心

命令行工具

功能1上新10个字符

功能2描述100个字符功能2描述100个字符功能2描述100个字符功能2描述100个字符功能2描述100个字符功能2描述100个字符功能2描述100个字符功能2描述100个字符功能2描述100个字符。

功能2上新100个字符功能2上新100个字符功能2上新100个字符功能2上新100个字符功能2上新100个字符功能2上新100个字符功能2上新100个字符功能2上新100个字符功能2上新100个字符。

功能5描述100个字符功能5描述100个字符功能5描述100个字符功能5描述100个字符功能5描述100个字符功能5描述100个字符

功能5上新100个字符功能5上新100个字符功能5上新100个字符功能5上新100个字符功能5上新100个字符功能5上新100个字符功能5上新100个字符功能5上新100个字符功能5上新100个字符功能5上新100个字符

功能4上新

文章&问答评论现已支持表情

全新交互，全新视觉，新增快捷键、悬浮工具栏、高亮块等功能并同时优化现有功能，全面提升创作效率和体验

社区富文本编辑器全新改版！诚邀体验～ 

精选全网热门MCP server，让你的AI更好用 🚀

💥开发者 MCP广场重磅上线！

涵盖代码开发、场景应用、自动测试全流程，助你从零构建专属AI助手

一站式MCP教程库，解锁AI应用新玩法

聚焦“写作效率、视觉美观与运行性能”三方面进行全面升级，为您提供更高效、稳定的创作环境

社区富文本&Markdown编辑器全新改版上线，欢迎大家体验!

诚挚邀请您参与本次调研，分享您的真实使用感受与建议。您的反馈至关重要，感谢您的支持与参与！

社区新版编辑器体验调研

我在一个包含1000列的相当大的数据集上训练一个Logistic回归模型。我确实使用MinMaxScaler对特性进行了缩放。我想知道如何解释模型生成的系数，并在基于树的模型中找到类似于特征重要性的内容。我是否应该将系数重新刻度回原来的比例，以便正确地解释模型？如果有人能说明如何正确地解释Logistic回归系数，那就太好了。

问基于Logistic回归模型的特征重要性
EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问基于Logistic回归模型的特征重要性EN