我试图计算数据集的PCA负载。我读到的越多,我就越困惑,因为“加载”在许多地方的用法不同。
我在python中使用sklearn.decomposition进行PCA分析,并使用R(使用factomineR和外因库),因为它提供了简单的可视化技术。以下是我的理解:
现在,我感到困惑的是:
我提到的这些第一和第二链接包含有说明的R代码和使我感到困惑的statsexchange论坛。
发布于 2021-05-09 10:26:27
好吧,经过大量的研究和研究,我有以下几点,
1.a:特征向量**2=主成分中的可变贡献。如果它接近1,那么一个特定的pc很好地解释了这个变量。
在python -> (pow(pca.components_.T))中,如果你想要百分比而不是比例,2)用100乘
4.a:平方加载矩阵的垂直和=本征值。(如步骤1所述,您已经使用了转座子)
4.b:平方加载矩阵的水平和=所有主成分-How解释的观测方差,所有pc在变换后都保留一个变量方差。(如步骤1所述,您已经使用了转座子)
在python-> loading = pca.components_.T * sqrt(pca.explained_variance_)中。
有关r的问题:
var$cor 2=var$cor(两个矩阵是相同的)。给定因子图上变量的坐标,它用一个特定的主成分表示得有多好。似乎是变量和主成分的相关性。
在r:(var.cos2 * 100) /(组件的总cos2 ) R链路中的主成分分析中
希望它能帮助那些对PCA分析感到困惑的人。
https://stackoverflow.com/questions/67445786
复制相似问题