文章/答案/技术大牛

发布

社区首页 >问答首页 >科学学习中随机主成分分析的结果解读

问科学学习中随机主成分分析的结果解读
EN

Data Science用户

提问于 2016-03-05 19:07:07

回答 1查看 947关注 0票数 7

我正在使用scikit--学习做一项全基因组的关联研究，其特征向量约为100 SNPs。我的目标是告诉生物学家哪种SNP是“有趣的”。

RandomizedPCA确实改进了我的模型，但是我很难理解结果。科学工具包能告诉我在每个组件中使用了哪些特性吗？

scikit-learn

pca

randomized-algorithms

feature-selection

回答 1

Data Science用户

回答已采纳

发布于 2016-03-08 02:34:58

是的，通过components_属性：

import numpy, seaborn, pandas, sklearn.decomposition
data = numpy.random.randn(1000, 3) @ numpy.random.randn(3,3)
seaborn.pairplot(pandas.DataFrame(data, columns=['x', 'y', 'z']));

sklearn.decomposition.RandomizedPCA().fit(data).components_

> array([[ 0.43929754,  0.81097276,  0.38644644],
       [-0.54977152,  0.58291122, -0.59830243],
       [ 0.71047094, -0.05037554, -0.70192119]])

sklearn.decomposition.RandomizedPCA(2).fit(data).components_

> array([[ 0.43929754,  0.81097276,  0.38644644],
       [-0.54977152,  0.58291122, -0.59830243]])

我们看到截断分解就是完全分解的截断。每一行都包含相应的主组件的系数。

票数 4

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/10540

复制

相似问题

问科学学习中随机主成分分析的结果解读
EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问科学学习中随机主成分分析的结果解读EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问科学学习中随机主成分分析的结果解读
EN