我正在使用HBase。我怀疑是行键导致了热点。在尝试对rowkey进行盐化之前,我想检查一下是否已经发生了热点。HBase中有没有办法分析地域服务器的数据分布情况,检查是否出现了热点?
谢谢,帕萨
发布于 2016-06-22 21:57:25
您可以使用HMaster Info Web UI来检测这一点。默认情况下应为http://master-address:16010。
如果它不可用,您可以检查在conf (hbase-site.xml)中是否没有禁用UI,并确保hbase.master.info.port没有设置为-1。
当你在上面的时候,你必须点击你想要检查的表格。你会出现在这个页面上
https://docs.prediction.io/images/cloudformation/hbase-32538c47.png
然后,如果您看到一个区域服务器的区域比其他区域服务器多得多,这是一个很好的提示,表明您的一个区域服务器可能是热点。这意味着行键作用域的这一部分中的区域被更频繁地拆分!每秒的请求数也可以作为一个指标,但根据我的经验,它并不总是很准确。
但这只是一个很好的提示,我所知道的确保热点正在发生的唯一简单的好方法就是让它成为替补。因为当发生这种情况时,写入性能会非常非常不同。因此,您应该检查具有相同数据的散列行键的吞吐量,然后进行比较。如果有热点,你很快就会看到。
https://stackoverflow.com/questions/37962977
复制相似问题