当我最初设置Elasticsearch集群时,建议在多个磁盘之间对数据进行“条带化”:
path.data: /disk1,/disk2,/disk3
但现在我需要添加更多的空间(更多的磁盘),我打算这样做:
path.data: /disk1,/disk2,/disk3,/disk4,/disk5
我一直未能找到任何权威的参考,以表明数据将如何重新平衡(或不)。这些年来,谷歌的行为似乎发生了一些变化,所以谷歌搜索是很困难的。所有的文档都这样说:"path.data设置可以设置为多个路径,在这种情况下,所有路径都将被用来存储数据“,这是相当模糊的。
我正在运行Elasticsearch 5.6。
我想了解当磁盘1,2,3超过85%的“低水印”(但还没有达到90%的值)时会发生什么,我介绍了两个新的磁盘。新索引是否只适用于2个新磁盘?
文档说:“一旦使用超过85%的磁盘,ES将不会将新的碎片分配给节点”。这是否意味着整个节点,或者仅仅是该节点上85%的磁盘?
我的索引是每日日志数据,每N天与馆长一起修剪一次,所以我想,在某一时刻,事情会变得平平,但可能需要一段时间。有什么方法可以主动地将碎片重新定位到不同的磁盘上,还是应该让它随着时间的推移自我平衡呢?
发布于 2021-02-22 06:49:18
使用多个磁盘(通过数据路径)不是条带。数据是通过碎片计数而不是磁盘空间使用情况在磁盘上分布的。即使单个磁盘通过水印,节点也会受到影响。因此,向数据路径添加新磁盘不会将数据分发到新磁盘。
要使用数据条带,至少要根据您的数据安全要求使用RAID0或其他选项。
参考数据存储体系结构
https://stackoverflow.com/questions/47542877
复制相似问题