我有一个基因组DNA坐标(hg38)的列表,我想检索相应的mRNA序列200 up以上/下游的这些坐标的位置,和想法?
谢谢。
我已经尝试了表格浏览器,很容易得到所有的密码子序列的坐标,但我不知道在哪里设置参数200 bp上下流的这些坐标。
发布于 2022-11-30 21:00:32
使用bedtools getfasta。将输入坐标更改为bed格式,并使用任何脚本工具在两个方向上将间隔增加200 nt。从医生那里:
$ cat test.fa
>chr1
AAAAAAAACCCCCCCCCCCCCGCTACTGGGGGGGGGGGGGGGGGG
$ cat test.bed
chr1 5 10
$ bedtools getfasta -fi test.fa -bed test.bed
>chr1:5-10
AAACC
# optionally write to an output file
$ bedtools getfasta -fi test.fa -bed test.bed -fo test.fa.out
$ cat test.fa.out
>chr1:5-10
AAACC您可以安装bedtools,例如,使用conda
conda create --channel bioconda --name your_env_name bedtools参考资料:
conda:https://docs.conda.io/projects/conda/en/latest/user-guide/install/index.html
conda create:https://docs.conda.io/projects/conda/en/latest/commands/create.html
https://stackoverflow.com/questions/74633394
复制相似问题