首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >生物信息学编码核苷酸序列

生物信息学编码核苷酸序列
EN

Stack Overflow用户
提问于 2021-10-30 04:54:23
回答 1查看 42关注 0票数 3

建议的压缩算法(.xz、tar.gz、tar.bz2等)将用于压缩由fasta核苷酸序列组成的数据集?

这类数据的建议压缩机制是什么?

基于compression

  • Adaptive字典的基于compression

  • LZW算法的压缩
EN

回答 1

Stack Overflow用户

发布于 2021-11-01 16:57:51

我见过gzip使用最频繁,所以我推荐gzip,正如CJR在评论中提到的那样。这是与协作者最兼容的选项,即使不是最有效的(取决于您对效率的定义)。

在某些情况下,在协作者和您可以安装专门的压缩工具的情况下,可能值得研究更有效的工具,例如,请参阅本文,本文使用几种不同的度量方法对其中许多工具进行比较(特别是图1):

Kirill Kryukov,Mahoko Takahashi Ueda,So Nakagawa,Tadashi Imanishi,序列压缩基准数据库-FASTA格式序列的无引用压缩器的全面评估,GigaScience,第9卷,第7期,2020年7月,giaa072,:https://academic.oup.com/gigascience/article/9/7/giaa072/5867695

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/69776890

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档