我正在使用带有默认Cassandra缓存设置的Hector从CF中读取行。这意味着密钥缓存是打开的。我正在使用j控制台监视键缓存的命中情况。
但是,即使在读取单个行(通过主键) 100次之后,缓存命中次数也不会增加。这一行最近更新了。
因此,当键缓存打开时,Cassandra读取的流是什么。是这样的吗?
但是使用cassandra-cli和cassandra-jdbc (CQL),我得到了不同的结果。也就是说,即使我最近更新了行,每次从行读取都会导致键缓存命中。比方说,我读了100遍,就有100次点击。
为什么会有这种差异?
嗯,我自己想出来了,但希望有人能确认..。
看起来,更新的结果只是获取要更新到MemTable中的列。因此,当我使用hector更新一行时,没有更新所有的列。只是一个列x,并且正在为读取操作读取相同的列x。因此,没有缓存成功,因为它已经在MemTable。
在运行CQL时,我只是运行了一个select * from cf,这也导致了另一个列y的获取。列y没有被更新,所以我假设它不会在内存(MemTable)中,从而导致缓存命中。
发布于 2012-08-15 01:30:11
当您读取一行时,Memtables和SSTables都会被选中,并且结果会合并在一起。密钥缓存只用于SSTables,而不是memtables (基本上是hashmap)。
如果您编写了一个新的行,然后不久就会读取它,那么memtable可能还没有被刷新,并且仍然保留着该行。在这种情况下,Cassandra甚至不需要查看键缓存,因为它可以快速检查SSTable bloom过滤器,以确定该行还没有出现在任何SSTables中。因此,在本例中,仅直接返回memtable中的行数据。
如果您强制对memtable进行早期刷新(使用nodetool),然后读取该行几次,您将看到密钥缓存开始被使用。
https://stackoverflow.com/questions/11923113
复制相似问题