首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >用bed文件提取fasta序列时如何获取链

用bed文件提取fasta序列时如何获取链
EN

Stack Overflow用户
提问于 2020-06-29 21:39:44
回答 1查看 187关注 0票数 2

我正在尝试使用bed文件(自制)从基因组中提取fasta序列。bed文件如下所示(以制表符分隔):

代码语言:javascript
复制
LQNS02278165.1  13104710        13109495        +
LQNS02278165.1  9139127 9142308 +
LQNS02278165.1  13665793        13666495        +
LQNS02278165.1  9143024 9144041 +
LQNS02278165.1  9221339 9222957 -
LQNS02278165.1  9220085 9220713 -
LQNS02278165.1  12608731        12609200        +
LQNS02278165.1  9144041 9144734 +
LQNS02278165.1  13666286        13666752        +
LQNS02278165.1  13655380        13655764        +

我正在运行带有强制搁浅(-s)选项的床上工具getfasta,但这不起作用。我得到的输出没有像它应该考虑的那样考虑到链。有什么建议吗?

代码语言:javascript
复制
bedtools getfasta -s  -fo strand_genome.fa -fi genome.fa -bed f.blast_genome.bed -fullHeader
代码语言:javascript
复制
>LQNS02278165.1:13104710-13109495()
AAAAAAA....
>LQNS02278165.1:9139127-9142308()
AAAAAAA....
>LQNS02278165.1:13665793-13666495()
AAAAAAA....
>LQNS02278165.1:9143024-9144041()
AAAAAAA....
>LQNS02278165.1:9221339-9222957()
AAAAAAA....

谢谢!

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-06-29 22:21:28

根据bed format的说法,链在第6列,因此在您的示例中,只需将链移动到第6列:

代码语言:javascript
复制
cat test.fa
>chr01
ACCGGTT

cat test.bed
chr01   0   4   .   .   +
chr01   0   4   .   .   -

bedtools getfasta -s -fi test.fa -bed test.bed
>chr01:0-4(+)
AACC
>chr01:0-4(-)
GGTT
票数 4
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/62639429

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档