关于这的另一个问题突然让我想知道世界上最大的数据库是什么(以及它可能有多大)。谷歌的快速搜索结果显示:国安局呼叫数据库是由美国国家安全局创建的。据推测,这个数据库包含了超过的1.9万亿条记录,包含了从2001年起就通过AT&T和Verizon拨打的电话的详细信息。
有没有人知道这个数据库使用了什么样的DB系统?在我看来,1.9万亿条记录甚至比你典型的大型商业数据库都要多得多。但也许我错了。我也没有通过任何方式对此进行广泛的研究,因此,关于美国国家安全局电话数据库是世界上最大的数据库的说法也许是完全错误的。
尽管如此,我还是想知道什么样的DBMS (如果有的话)可以合理地处理这么多记录。
发布于 2011-02-11 03:05:03
1.9万亿行乘以8000字节/行是,嗯,15兆字节?我的算术做对了吗?这仅仅比几个著名的商业数据库大一个数量级。搜索"petabyte数据库“给了我
1.9万亿行在64位无符号int的范围内很容易(咳嗽)行寻址。
物理学家和天文学家似乎有着最大的目标。斯坦福大学需要为他们的大型天气测量望远镜管理大约155兆字节的数据。我在街上做的一个天文学项目每天能产生大约10千兆字节,但它们几乎不储存那么多。
见鬼,我差点忘了问题的重点。最常出现的是格林梅利和特拉塔。但我不认为任何人谁知道国安局的实际用途会谈论它。
@Tomislav Nakic-Alfirevic:一个每1000行打印一次的awk程序:
NR % 1000 == 0 {print $0}你觉得国安局会付钱给我吗?我的房子需要一个新屋顶。
https://stackoverflow.com/questions/2401637
复制相似问题