我有24个因素,这些因素已经转化为370个变量,然后需要在一个四因素多元线性回归模型中建模(需要生成一个四因素模型的列表)。
减少运行时间的最佳方法是什么?有减少变量的方法吗?K均值聚类是应用的最佳技术吗?
我还需要同样的方法来生成一个包含2因素和3因素多元线性回归模型的列表。
在python中是否有与SAS中的Proc Varclus类似的包?
发布于 2019-07-14 16:19:48
您应该更多地研究主成分分析( PCA ),这通常是为了减少具有最大方差的维度。至于KNN集群,它确实取决于您的数据和您想要实现的目标。
https://stackoverflow.com/questions/57029041
复制相似问题