我正在开发一个Cassandra数据模型来存储用户上传的记录。
潜在的问题是,一些用户可能会在5分钟内上传50-100 k行,这可能会导致分区密钥(user_id)的“热点”。(Datastax建议在每个分区超过10k行时重新考虑数据模型)。
如何避免在短时间内在分区键上有太多的记录?
我尝试过使用Datastax的时间序列建议,但是即使我有年、月、日、小时列,也可能会出现热点。
CREATE TABLE uploads (
user_id text
,rec_id timeuuid
,rec_key text
,rec_value text
,PRIMARY KEY (user_id, rec_id)
); 用例是:
发布于 2015-07-06 12:41:46
一些可能的想法:
https://stackoverflow.com/questions/31210871
复制相似问题