建议的压缩算法(.xz、tar.gz、tar.bz2等)将用于压缩由fasta核苷酸序列组成的数据集?
这类数据的建议压缩机制是什么?
基于compression
发布于 2021-11-01 16:57:51
我见过gzip使用最频繁,所以我推荐gzip,正如CJR在评论中提到的那样。这是与协作者最兼容的选项,即使不是最有效的(取决于您对效率的定义)。
在某些情况下,在协作者和您可以安装专门的压缩工具的情况下,可能值得研究更有效的工具,例如,请参阅本文,本文使用几种不同的度量方法对其中许多工具进行比较(特别是图1):
Kirill Kryukov,Mahoko Takahashi Ueda,So Nakagawa,Tadashi Imanishi,序列压缩基准数据库-FASTA格式序列的无引用压缩器的全面评估,GigaScience,第9卷,第7期,2020年7月,giaa072,:https://academic.oup.com/gigascience/article/9/7/giaa072/5867695
https://stackoverflow.com/questions/69776890
复制相似问题