我有一个VmWare解决方案,运行在一个带有Lefthand的上。该环境中目前有两台VmWare主机。
我有两个Debian共享一个ISCSI磁盘(与ocfs2共享),它使用open直接从san挂载。所有这些操作都很完美,但是昨天,一个客户端一旦想要在共享的ocfs2分区上写什么东西,就会崩溃。
我尝试将一些ISCSI参数设置为更保守的值,但没有效果。只有(v-)将客户端移动到另一个VM主机才解决了这个问题。今天,将另一个客户端移动到有问题的主机会引发相同的错误:
connection1:0: ping timeout of 5 secs expired, recv timeout 5, last rx 4294971299, last ping 4294966612, now 4294973799
connection1:0: detected conn error (1011)
iscsid: Kernel reported iSCSI connection 1:0 error (1011 - ISCSI_ERR_CONN_FAILED: iSCSI connection failed) state (3)
kernel: [ 328.558970] connection1:0: detected conn error (1020)
iscsid: connection1:0 is operational after recovery (1 attempts)
[repeat until hard reset]它似乎与VM主机相关,wich的配置与另一主机完全相同。作为刀片,他们使用相同的网络硬件,一个flex-10互连。
有人知道这和什么有关吗?我想找出原因,因为两台VM主机都可能出现相同的问题(因此,我不得不切换到联网磁盘,看起来更稳定,不太容易出现硬重置)。
发布于 2015-07-02 17:35:24
此错误与写消息的超时有关。有人建议使用vlan来获得更好的吞吐量来传输数据。因此,问题涉及到:主机: IP协议栈、适配器、网络交换机、NetApp网络适配器等。
您可以做的另一件事是增加磁盘写入的超时时间。
echo 180 > /sys/block/sdX/device/timeout在iscsi启动器配置中,我用来配置:
node.session.iscsi.InitialR2T = No这些参数将增加iscsi日志。只在必要时使用:
# echo 1 > /sys/module/libiscsi/parameters/debug_libiscsi_session
# echo 1 > /sys/module/libiscsi/parameters/debug_libiscsi_eh
# echo 1 > /sys/module/libiscsi/parameters/debug_libiscsi_conn
# echo 1 > /sys/module/libiscsi_tcp/parameters/debug_libiscsi_tcp
# echo 1 > /sys/module/iscsi_tcp/parameters/debug_iscsi_tcphttps://serverfault.com/questions/577011
复制相似问题