文章/答案/技术大牛

发布

社区首页 >问答首页 >恢复后坐骑断裂

问恢复后坐骑断裂
EN

Server Fault用户

提问于 2022-01-14 19:32:37

回答 1查看 385关注 0票数 1

我正在和Open-iSCSI玩，遇到了一些麻烦。当我的发起者和目标之间的网络链接失败时，iscsid将恢复连接，这是很好的。但我的坐骑坏了，并产生I/O error，直到它被重新安装。

是否有一个干净的解决方案来自动重装lun？比如恢复后的钩子或配置设置，但我不知何故错过了？我试图避免使用轮询脚本或类似的内容:)

iscsid log

Jan 14 08:03:45 localhost iscsid[1415]: iscsid: Kernel reported iSCSI connection 1:0 error (1022 - ISCSI_ERR_NOP_TIMEDOUT: A NOP has timed out) state (3)
Jan 14 08:04:22 localhost iscsid[1415]: iscsid: connect to 10.0.2.100:9999 failed (No route to host)
[...]
Jan 14 08:38:43 localhost iscsid[1415]: iscsid: connect to 10.0.2.100:9999 failed (No route to host)
Jan 14 08:38:47 localhost iscsid[1415]: iscsid: connection1:0 is operational after recovery (195 attempts)
Jan 14 08:39:52 localhost iscsid[1415]: iscsid: Kernel reported iSCSI connection 1:0 error (1020 - ISCSI_ERR_TCP_CONN_CLOSE: TCP connection closed) state (3)
Jan 14 08:40:11 localhost iscsid[1415]: iscsid: connection1:0 is operational after recovery (2 attempts)

fstab

UUID=cf3d20cd-a8cd-4a9a-acbf-1c61289a37bb /data xfs defaults,_netdev,x-systemd.requires=iscsid.service 0 0

mount

iscsi

open-iscsi

回答 1

Server Fault用户

发布于 2022-04-19 15:37:17

总之，不，没有神奇的清洁的解决方案。最干净的恢复是重新启动。

问题是，当连接超过iscsid的replacement_timeout时，文件系统就开始获取I/O错误。除非您有一个非常特殊的应用程序，否则通常不会从I/O错误中返回。它对服务造成了各种各样的破坏。你几乎总是更好的重新启动，而不是你试图理清所有的程序如何停止工作。

话虽如此，你能做的就是把replacement_timeout推到你喜欢的地方。您将在web上找到对应用程序的引用，比如建议超时一个小时(3600秒)或更长时间的数据库。这就把问题推到了像NFS硬安装卡一样的东西上。如果您需要设计一个系统，在这个系统中人类必须进行干预才能修复它，那么更长的超时时间是件好事。系统只是挂起，直到链接回来。

可以在/etc/iscsi/iscsid.conf中为整个系统设置默认值。编辑这一行：

node.session.timeo.replacement_timeout = 120

票数 0

页面原文内容由Server Fault提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://serverfault.com/questions/1090058

复制

相似问题

问恢复后坐骑断裂
EN

iscsid log

fstab

回答 1

Server Fault用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问恢复后坐骑断裂EN

iscsid log

fstab

回答 1

Server Fault用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问恢复后坐骑断裂
EN