我有可能是一个简单的任务,我尝试了几个解决方案,但似乎无法解决它。
我有一套包含基因名称和相应位置的集,如:
gene_nr_snp = {'gene1: {3,9}, gene2: {2,3,1}, gene3: {1}}我想返回一个带有基因名和相应的求和值的数据集。
我尝试了以下几点:
gene_values = {}
for gene, snp in gene_nr_snp.items():
for i in snp: # iterate the values in each set
snp_total = 0
snp_total += i
gene_values[gene].add(snp_total)这将返回相同的值集。
发布于 2017-04-23 12:52:45
您可以使用dict理解和 function
gene_values = {gene: sum(snp) for gene, snp in gene_nr_snp.items()}您的尝试失败了,因为您将snp_total变量设置为snp中的每个值的0,因此没有对任何值进行求和。然后,您似乎将gene_values[gene]视为一个集合,但字典开始为空,因此您将得到一个KeyError。一个工作版本是:
gene_values = {}
for gene, snp in gene_nr_snp.items():
snp_total = 0
for i in snp: # iterate the values in each set
snp_total += i
gene_values[gene] = snp_total但是,sum()函数使得内部循环比需要的更冗长;可以用gene_values[gene] = sum(snp)替换整个循环体。
https://stackoverflow.com/questions/43571404
复制相似问题