我正在尝试掌握Cassandra和关系数据库之间的一些性能差异。
据我所知,无论数据量如何,Cassandra的写入性能都保持不变。通过写性能,我假设这意味着在键匹配时添加新行和替换现有行(就像关系世界中的更新一样)。这个假设是正确的吗?
此外,据我所知,当表/分区变得更大时,关系数据库的更新会变慢。这是因为必须执行全表扫描来定位行,或者需要执行索引查找,并且随着表或分区的增长,这两种操作都将花费更长的时间。因此,根据表/分区的数据量,更新花费的时间会一直更长吗?
当新数据被插入到关系数据库中时,我知道任何索引都需要拥有新数据,但没有涉及到查找,对吗?那么,插入也会随着数据量的增加而变得永远变慢,还是与关系数据库保持不变呢?
谢谢你的建议
发布于 2011-05-29 07:58:54
如果表有索引,它们将变得更慢。不仅必须写入数据,而且还必须更新索引。在没有索引和约束的表中插入是非常快的,因为不需要执行任何检查。记录可以只写在表空间的末尾。
发布于 2011-06-25 05:39:33
在关系数据库方面,我一直在我们的RDBMS上做负载测试,我发现随着数据添加到数据库中,性能会呈指数级下降。

我仍在进行Cassandra设置,以便能够实现可比较的测试。同时,这个Cassandra演示文稿提供了一些关于Cassandra与MySQL的信息:http://www.slideshare.net/Eweaver/cassandra-presentation-at-nosql
https://stackoverflow.com/questions/6165091
复制相似问题