我有5个碎片,我想把它们合并成一个碎片。每个碎片大约有30 has的数据。我可以使用"removeShard“命令逐个删除它们。但是这是浪费的,因为当我一个一个地移除碎片时,数据必须被重新分配多次。它将更有效地迫使数据移动到一个单一的碎片,我将保留在最后。
发布于 2014-11-30 02:52:47
这里没有快速的解决办法。您可以像第一个答案中指出的那样手动移动块,但是还有另一个选项。这不会更快,因为无论你现在做什么,平衡器(为你移动块)一次只能移动一个块。
您可以使用标签感知切分并标记您希望留给整个数据集的一个碎片。当涉及到平衡时,标记会在耗尽碎片之后立即进行评估,因此,指示整个数据集应该位于单个碎片上的标记大约相当于将所有碎片设置为耗尽。一旦完成,您就可以发出命令,删除所有已经完成的工作的碎片。
考虑到平衡器的开销和单线程性质,您可能需要考虑使用独头来转储整个数据集,然后恢复到单个碎片(假设您可以占用停机时间和足够的空间)。
发布于 2014-11-29 08:01:01
基本上,moveChunk命令用于手动块迁移。
使用config数据库,您可以使用类似于下面的脚本。
注意,您必须首先关闭平衡器。
var query = {"shard" : {$ne : "DESTINATION_SHARD_ID"} , "ns" : "YOUR_NAMESPACE"}
var cursor = db.chunks.find(query);
cursor.forEach(function(d) {
sh.moveChunk("YOUR_NAMESPACE", { "_id" : d.min._id }, "DESTINATION_SHARD_ID")
});其中:
DESTINATION_SHARD_ID是目标碎片idYOUR_NAMESPACE是格式的集合命名空间: db.collection这可能需要很长时间,这取决于块的数量,以及目标机器如何处理写操作。你也可以节流操作。例如,cron作业,它在非高峰时间每天传输10个块(通过将limit(50)添加到查询中)。
一旦碎片耗尽,您就可以发出(仍然是必要的)removeShard命令。
https://stackoverflow.com/questions/27195756
复制相似问题