fasta文件名: STD_PRO_1.fasta
fasta文件中有多个标题,如下所示:
甘露糖基转移酶,磷酸核糖基-ATP焦磷酸水解酶:磷酸核糖基-AMP环水解酶,部分cds..
甘露糖基转移酶,磷酸核糖基-ATP焦磷酸水解酶:磷酸核糖基-AMP环水解酶,部分cds..
在标题中只保留物种名称,如下所示:
大肠埃希菌
大肠埃希菌
发布于 2022-02-16 16:00:49
在此之前:
$ sed -n l test.fasta
>ENA|AB000176|AB000176.1 Escherichia coli DNA for mannosyl transferase$
GACCATATGATTGACGCCTATGTCAATCTCTACACTACATTGCTGGAAAGCAAATCCTGA GAGATGCTA$
$
>ENA|AB000178|AB000178.1 Escherichia coli DNA for mannosyl transferase$
GACCATATGATTGACGCCTATGTCAATCTCTACACTACATTGCTGGAAAGCAAATCCTGA GAGATGCTA$之后:
$ sed '/^>/{ s/[^ ]* />/; s/ DNA.*//; s/ gene.*//; }' test.fasta
>Escherichia coli
GACCATATGATTGACGCCTATGTCAATCTCTACACTACATTGCTGGAAAGCAAATCCTGA GAGATGCTA
>Escherichia coli
GACCATATGATTGACGCCTATGTCAATCTCTACACTACATTGCTGGAAAGCAAATCCTGA GAGATGCTAhttps://stackoverflow.com/questions/71141788
复制相似问题