文章/答案/技术大牛

发布

社区首页 >问答首页 >大熊猫数据序列GC含量的研究

问大熊猫数据序列GC含量的研究
EN

Stack Overflow用户

提问于 2015-04-27 18:06:23

回答 1查看 580关注 0票数 1

我有一个数据文件df

oligo_name  oligo_sequence

AAAAA       attttggggctggtaa

BBBBB       attttcccgaatgtca

诸若此类。为了计算每个序列的GC含量，我执行了以下操作

from Bio.SeqUtils import GC

df['GC content'] = GC(df['oligo_sequence'])

但我得到了以下错误：

KeyError: 'Level G must be same as name (None)'

你能建议一个修正或更好的方法来计算熊猫数据框架中的GC含量吗？谢谢

pandas

biopython

回答 1

Stack Overflow用户

回答已采纳

发布于 2015-04-27 18:47:35

以下几点对我有用：

In [23]:

df['GC content'] = df['oligo_sequence'].apply(GC)
df
Out[23]:
  oligo_name    oligo_sequence  GC content
0      AAAAA  attttggggctggtaa       43.75
1      BBBBB  attttcccgaatgtca       37.50

您不能将Series作为param传递给函数，除非它了解熊猫系列或数组类型是什么，因此您可以调用apply并将该函数作为param传递，该函数将对该系列中的每个值调用该函数，如上面所示。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/29902938

复制

相似问题

问大熊猫数据序列GC含量的研究
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问大熊猫数据序列GC含量的研究EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问大熊猫数据序列GC含量的研究
EN