在我使用DRBD的所有系统中,在验证日志中有许多消息后。
kernel: block drbd0: Out of sync: start=403446112, size=328 (sectors)在一些系统中,可能会认为它是由工作负载决定的,但也有一些团队几乎没有工作。
这些计算机连接在一个1 1Gb质量的网络中
这些消息并没有给我太多关于系统的可靠性,最终需要cron来检查计时,并重置错误块,当然,这会在异步系统中转换为同步系统。
这是正常的吗?有什么解决方案吗?有什么问题吗?
common {
protocol C;
handlers {
pri-on-incon-degr "/usr/lib/drbd/notify-pri-on-incon-degr.sh; /usr/lib/drbd/notify-emergency-reboot.sh; echo b > /proc/sysrq-trigger ; reboot -f";
pri-lost-after-sb "/usr/lib/drbd/notify-pri-lost-after-sb.sh; /usr/lib/drbd/notify-emergency-reboot.sh; echo b > /proc/sysrq-trigger ; reboot -f";
local-io-error "/usr/lib/drbd/notify-io-error.sh; /usr/lib/drbd/notify-emergency-shutdown.sh; echo o > /proc/sysrq-trigger ; halt -f"
}
syncer {
# rate after al-extents use-rle cpu-mask verify-alg csums-alg
verify-alg sha1;
rate 40M;
}
}
resource r0 {
protocol C;
startup {
wfc-timeout 15; # non-zero wfc-timeout can be dangerous (http://forum.proxmox.com/threads/3465-Is-it-safe-to-use-wfc-timeout-in-DRBD-configuration)
degr-wfc-timeout 60;
}
net {
cram-hmac-alg sha1;
shared-secret "XXXXXXXXXX";
after-sb-0pri discard-zero-changes;
after-sb-1pri discard-secondary;
after-sb-2pri disconnect;
}
on pro01 {
device /dev/drbd0;
disk /dev/pve/vm-100-disk-1;
address YYY.YYY.YYY.YYY:7788;
meta-disk internal;
}
on pro02 {
device /dev/drbd0;
disk /dev/pve/vm-100-disk-1;
address YYY.YYY.YYY.YYY:7788;
meta-disk internal;
}
}发布于 2013-02-21 15:14:21
这可能会时不时地发生,这是正常的。
只需断开连接并再次连接-然后不同步的块将被同步。
DRBD - online verify
发布于 2014-03-19 14:53:53
关于这一点(http://www.gossamer-threads.com/lists/drbd/users/25227)有一个很长的故事,我仍然不确定这是可以(或者应该)由DRBD开发人员修复的,还是我们需要修复上层行为(在我的例子中是KVM)。
https://stackoverflow.com/questions/14301769
复制相似问题