我们在HBase表中有很多数据。我是这个NoSQL世界的新手。我们希望只在固定的时间内保存数据。我们应该编写一个单独的清理脚本,还是依赖TTL配置?
我查阅了现有的文档,但不了解具体的行为。
发布于 2014-02-12 11:45:51
HBase 文档明确表示,HBase将自动删除比TTL更早的数据。
发布于 2014-02-12 16:51:30
记住,HBase不会删除数据,直到它完成压缩--重写所有的数据文件。一旦数据通过TTL,它将是不可见的,直到一个主要的压缩发生。
发布于 2014-02-12 18:43:04
它的行为方式是这样的,也就是说,在下一次主要压缩时,其时间戳大于配置的TTL的行中的所有值都将被删除。它是列族的一个属性。如果希望TTL应用于整个表,只需将其设置为表中每个列家族的相同值。这样,一旦你处理完数据,你就会把它处理掉。
https://stackoverflow.com/questions/21720586
复制相似问题