我有个奇怪的问题。我正在构建一个将信息存储在一个表中的服务。那张表有20列。我的数据库将有数十亿行。现在我正在使用Cassandra,但是返回22k行需要大约5秒,大约4mb的大小。
我试过优化它,但并不是那么容易。卡桑德拉的人说卡桑德拉对我的服务不好。所以我现在来了。
如果你能帮我找到一个完美的数据库,那会很有帮助的。
如果它是可伸缩的,可以容纳数十亿行,并且具有快速的阅读速度,那就太好了。
如果你决定否决这个问题,请告诉我你为什么这样做。
谢谢!
发布于 2014-03-11 09:42:40
这不是一个奇怪的问题。我每天都有同样的问题:如何让事情跑得更快、更快。我们使用2012,内存为512 GB,SAN为50 GB。我们大约有10个表,超过10亿行,我们最大的表是750亿行。
真正有帮助的是确保正确的数据类型被使用;在小批量操作时不使用bigints。没有varchar(5),当char(5)更好时,或者更确切地说,在事实表中根本没有varchars。将varchars保存在维度表中。
如果您希望聚合数据,您可以查看使用Analysis或其他类型的Cube。这将把问题转移到进程的写入位,而不是读位。
诚挚的问候,
亨里克
https://dba.stackexchange.com/questions/60611
复制相似问题