import pandas as pd

df = pd.read_csv('so58178958.bed', sep='\t', comment='t', header=None)
header = ['chrom', 'chromStart', 'chromEnd', 'name', 'score', 'strand', 'thickStart', 'thickEnd', 'itemRgb', 'blockCount', 'blockSizes', 'blockStarts']
df.columns = header[:len(df.columns)]

这只是一个非常简单的代码片段，将以't'开头的所有行作为注释处理。这应该是因为所有“chrom”字段条目都应该以'c'、's'或数字开头。

票数 1

Stack Overflow用户

发布于 2020-04-22 08:22:13

如果使用吡喃，则会为df指定名称和列适当的数据类型。

import pyranges as pr

df = pr.read_bed("your.bed", as_df=True)

它也有一些读者，例如gtfs和gff3s等杂乱的生物信息学格式。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/58178958

复制

相似问题

问将床文件读入熊猫数据仓库(windows)
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问将床文件读入熊猫数据仓库(windows)EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问将床文件读入熊猫数据仓库(windows)
EN