我用3个不同的模型对64个变量进行了多元线性回归:
我实现了相同的调整R平方值对所有三个模型,但不同的重要变量。我该怎么理解呢?我该选哪一种型号?
会感谢您的任何建议!谢谢!
发布于 2019-06-10 10:51:50
发布于 2019-11-07 11:08:10
64个变量对于线性回归来说是一个很大的问题,我很担心共线性、相互依赖的变量等等。
虽然一个很好的基本假设是用最少的变量(调整后的R_2为相等)的模型,但我希望你们在这里更深入一些。
您以前是否对预测变量进行过因子分析或PCA,使用组件或因素的简化模型会表现得更强、更易于解释吗?
回归真的不是一个很好的模型,如果你只想扔袋子的话。根据问题背后的动机(正如@Spacedman所指出的),我也会尝试更多的替代模式。
为什么只使用RF进行特征选择,为什么不使用整个回归呢?如果你的目标是预测和预测质量,那么R 2将不是你要看的主要指标,你也可以尝试更多的算法,比如XGboost。
https://datascience.stackexchange.com/questions/53512
复制相似问题