文章/答案/技术大牛

发布

问多柱蟒大熊猫的PCA分析
EN

Stack Overflow用户

提问于 2016-03-25 18:57:47

回答 1查看 1.4K关注 0票数 0

我有一个.vcf文件

column1 = chrom
column2 = pos
column3 = ID
column4 = reference
column5 = Alt
column6 = qual
column7 = filter
column8 = info
column9 = format    
column 10 - 99 = 100 columns that have a number of either zero or one

我在档案里读到：

#!/usr/bin/env python
import pandas as pd
vcf=open('/Users/cmdb/Desktop/Lab6_GWAS/variants.vcf', 'r')

还有这个不应该用的

for line in vcf:
    fields=line.strip().split()
    A01=fields[9]
    A02=fields[10]
    A03=fields[11]

但是，这将花费太长的时间，因为我想保存所有的零和 on ，以便以后可以通过Python运行PCA分析。主成分分析( PCA )我想使用pandas，但不确定如何在这么多列中使用。

python

pandas

pca

回答 1

Stack Overflow用户

发布于 2016-03-25 19:11:27

pandas没有实现PCA算法。

使用sklearn代替。

from sklearn.decomposition import PCA
pca = PCA(n_components=5)
pca.fit(df)

并访问如下组件：

pca.components_

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/36226197

复制

相似问题

问多柱蟒大熊猫的PCA分析
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问多柱蟒大熊猫的PCA分析EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问多柱蟒大熊猫的PCA分析
EN