首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Python &生物学:使用python交叉数据集

Python &生物学:使用python交叉数据集
EN

Stack Overflow用户
提问于 2015-01-24 08:04:09
回答 3查看 219关注 0票数 0

喜欢这个网站。我是一位生物学家,接受简单的问题,让他们在蟒蛇中纠结,目前被一个相当简单的问题困住了。我有两个包含染色体('chr#')和位置(‘开始’,‘结束’)信息的元组的不平等列表:

list1: length=1499,tuples=(‘chr5 5’,'12345','12678')

list2: length=75220,tuples=(‘chr5 5’,'44','7777777')

如果有人能向我解释这段代码失败的原因,我可以自己解决这个问题:

代码语言:javascript
复制
list1 = [('chr1', '123', '345'), ('chr1', '567', '678'), ('chr2', '123', 234'),...)

list2 = [('chr1', '123', '567'), ('chr1', '777', '890'), ('chr2', '1', 288'),...)
newlist = []

for j,k,l in list1:
      if j == x for x,y,z in list2:
            if int(k) >= int(y) or int(l) <= int(z):
                 newlist.append(k)
            else:
                 pass
      else:
            pass

理由:我希望从两个字符串中比较所有元组中的整数,但只在两个元组的项匹配时才进行比较。我非常感谢您的帮助和建议,谢谢!

EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2015-01-24 09:08:36

如果您更改了代码中的第一个if语句,而不是在第二个for循环之前,则代码将运行:

代码语言:javascript
复制
list1 = [('chr1', '123', '345'), ('chr1', '567', '678'), ('chr2', '123', '234')]

list2 = [('chr1', '123', '567'), ('chr1', '777', '890'), ('chr2', '1', '288')]
newlist = []

for j,k,l in list1:
    for x,y,z in list2:
        if j == x:
            if int(k) >= int(y) or int(l) <= int(z):
                newlist.append(k)
            else:
                 pass
        else:
            pass
票数 0
EN

Stack Overflow用户

发布于 2015-01-24 08:24:01

代码语言:javascript
复制
if list1[0] == list2[0]:
  print 

这就是你要找的吗?)

如果您也需要比较数字:

代码语言:javascript
复制
if list1[0] == list2[0]:
    for i in range(1, min([len(list1), len(list2)]):
        if int(list1[i]) < int(list2[i]):
            print('Aha!')
票数 0
EN

Stack Overflow用户

发布于 2015-01-24 09:39:23

我的文章没有回答您的问题,但是我认为您的代码可以通过使用更多的pythonic结构来改进。朝着这个方向迈出的第一步是使用命名元组,这样染色体字段就可以通过它们的属性名称、开始和结束来访问。

代码语言:javascript
复制
from collections import namedtuple
Chromosome = namedtuple('Chromosome', ['name', 'start', 'end'])
chromo = Chromosome('chr1', 123, 345)
# You can access the fields as chromo.name, chromo.start and chromo.end

在第二步中,您可以使用列表理解来减少嵌套循环的数量:

代码语言:javascript
复制
from collections import namedtuple

Chromosome = namedtuple('Chromosome', ['name', 'start', 'end'])

list1 = [Chromosome('chr1', 123, 345), Chromosome('chr1', 567, 678), ]
list2 = [Chromosome('chr1', 123, 567), Chromosome('chr2', 1, 288), ]

newlist = []
for chromo1 in list1:
    # Build a list of chromosomes from list2 that
    #  * have the same name as chromo1
    #  * start before chromo1
    #  * end after chromo1
    matches = [chromo2 for chromo2 in list2
               if chromo2.name == chromo1.name and
               (chromo2.start < chromo1.start or chromo2.end > chromo1.end)]
    newlist.extend(matches)
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/28123534

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档