首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >根据fasta标头重命名文件

根据fasta标头重命名文件
EN

Stack Overflow用户
提问于 2018-07-05 21:24:14
回答 1查看 63关注 0票数 1

我已经从NCBI下载了240个基因组,当它们下载时,它们会根据它们的组装编号得到一个文件名。我想根据它们的物种名称来重命名这些文件,而不是它们的汇编编号,因为这将使数据的解释变得容易得多。

我知道一些(非常少的) python,而且我真的不能用谷歌搜索自己来解决这个问题。

文件名示例: GCF_000014225.1_ASM1422v1_genomic.fna

fasta标题示例:>NC_008228.1假交替单胞菌亚特兰蒂卡T6c,完整基因组

显然,如果我能去掉NC_008228.1和完整的基因组,我会很高兴,但仅仅是fasta头文件名会让我的生活变得更容易(另一种选择是做manually...but,我知道它可以通过一些编码来完成)

提前谢谢你!

EN

回答 1

Stack Overflow用户

发布于 2018-07-05 21:48:04

这可能是可以使用sys,但我认为bash是一个更好的解决您的问题。类似于:

代码语言:javascript
复制
for file in /dir/*; do
header=$(cat $file | egrep ">.*\w([a-zA-z]\w[a-zA-z])\w.*)")
mv $file $header.fa
done
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/51192511

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档