首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >储存一个人类基因组需要多少存储空间?

储存一个人类基因组需要多少存储空间?
EN

Stack Overflow用户
提问于 2012-01-22 00:22:53
回答 11查看 91.6K关注 0票数 97

我正在查找以字节为单位的存储量(MB、GB、TB等)。需要用来储存单个人类基因组。我在维基百科上读了一些关于DNA、染色体、碱基对、基因的文章,有一些粗略的猜测,但在透露任何东西之前,我想看看其他人是如何处理这个问题的。

另一个问题是人类DNA中有多少个原子,但这不是这个网站的话题。

我知道这是一个近似值,所以我在寻找能够存储任何人的DNA的最小值。

EN

回答 11

Stack Overflow用户

回答已采纳

发布于 2012-01-22 00:26:07

如果你相信这些东西,这里是维基百科宣称的(来自http://en.wikipedia.org/wiki/Human_genome#Information_content):

单倍体人类基因组的29亿个碱基对对应于最大约725兆字节的数据,因为每个碱基对可以由2位编码。由于单个基因组之间的差异不到1%,它们可以无损地压缩到大约4兆字节。

票数 76
EN

Stack Overflow用户

发布于 2012-01-22 00:32:13

你并不是将所有的DNA存储在一个数据流中,而是大部分时间都是通过染色体来存储的。

一个大的染色体大约需要300MB,一个小的染色体大约需要50MB。

编辑:

我认为第一个原因是它不是以每个碱基对2位的形式保存的,因为它会导致数据处理的障碍。大多数人不知道如何转换它。即使提供了转换程序,大公司或研究机构中的许多人也不允许/需要询问或不知道如何安装程序……

1 GB的存储空间是免费的,即使在100Mbitsps的情况下下载3 GB也只需要4分钟,而且大多数公司都有更快的速度。

另一点是,数据并不像你被告知的那样简单。

Craig_Venter发明的测序方法是一大突破,但也有缺点。它不能分离相同碱基对的长链,所以不总是100%清楚是有8个A还是9个A。

另一个例子是DNA methylation,因为您不能以2位表示形式存储此信息。

票数 27
EN

Stack Overflow用户

发布于 2012-01-22 00:33:29

基本上,每个碱基对需要2位(您可以使用00、01、10、11表示T、G、C和A)。由于人类基因组中约有29亿个碱基对,(2 *29亿)位~=为691兆字节。

然而,我不是专家,维基百科上的Human Genome页面声明了以下内容:

原始MB:

  • 男性(XY):770MB
  • 女性(XX):756MB

我不确定他们的差异是从哪里来的,但我相信你能弄清楚。

票数 15
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/8954571

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档