文章/答案/技术大牛

发布

问sklearn PCA不工作
EN

Stack Overflow用户

提问于 2015-07-09 05:11:53

回答 1查看 1K关注 0票数 3

我一直在玩sklearn PCA，它表现得很奇怪。

from sklearn.decomposition import PCA
import numpy as np
identity = np.identity(10)
pca = PCA(n_components=10)
augmented_identity = pca.fit_transform(identity)
np.linalg.norm(identity - augmented_identity)

4.5997749080745738

请注意，我将维度的数量设置为10。范数不是应该为0吗？

任何关于它为什么不是的洞察力都会受到赞赏。

python

numpy

scikit-learn

pca

回答 1

Stack Overflow用户

发布于 2015-07-09 07:30:48

尽管PCA基于协方差矩阵计算正交分量，但sklearn中PCA的输入是数据矩阵，而不是协方差/相关矩阵。

import numpy as np
from sklearn.decomposition import PCA

# gaussian random variable, 10-dimension, identity cov mat
X = np.random.randn(100000, 10)



pca = PCA(n_components=10)
X_transformed = pca.fit_transform(X)

np.linalg.norm(np.cov(X.T) - np.cov(X_transformed.T))

Out[219]: 0.044691263454134933

票数 4

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/31303839

复制

相似问题

问sklearn PCA不工作
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问sklearn PCA不工作EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问sklearn PCA不工作
EN