我有一个RHEL5.5 5.5 x86_64服务器,2 HBA连接到EMC和HP存储阵列。EMC PowerPath之所以安装是因为我的EMC供应商坚持这样做。
我的问题是,HP存储上的卷经常会出现日记错误(见下文),并进入只读模式。
是SAN问题还是OS问题?我怎么解决这个问题?
May 27 14:16:57 cvoddv01 kernel: journal_bmap: journal block not found at offset 6156 on dm-7
May 27 14:16:57 cvoddv01 kernel: Aborting journal on device dm-7.
May 27 14:16:57 cvoddv01 kernel: ext3_abort called.
May 27 14:16:57 cvoddv01 kernel: EXT3-fs error (device dm-7): ext3_journal_start_sb: Detected aborted journal
May 27 14:16:57 cvoddv01 kernel: Remounting filesystem read-only
May 27 14:16:57 cvoddv01 kernel: __journal_remove_journal_head: freeing b_frozen_data
May 27 14:16:57 cvoddv01 kernel: __journal_remove_journal_head: freeing b_committed_data
May 27 14:16:57 cvoddv01 kernel: __journal_remove_journal_head: freeing b_frozen_data
May 27 14:17:36 cvoddv01 kernel: ext3_abort called.
May 27 14:17:36 cvoddv01 kernel: EXT3-fs error (device dm-7): ext3_put_super: Couldn't clean up the journal我的modprobe.conf是:
alias scsi_hostadapter mptbase
alias scsi_hostadapter1 mptspi
alias scsi_hostadapter2 cciss
alias scsi_hostadapter3 ata_piix
alias scsi_hostadapter4 qla2xxx
alias eth0 e1000e
alias eth2 e1000e
alias eth1 e1000e
alias eth3 e1000e
alias eth4 bnx2
alias eth5 bnx2
#Added by HP rpm installer
alias scsi_hostadapter_mptscsih_module mptscsih
#Added by HP rpm installer
alias scsi_hostadapter_mptsas_module mptsas
options qla2xxx ql2xmaxqdepth=16 ql2xloginretrycount=30 qlport_down_retry=64
options lpfc lpfc_lun_queue_depth=16 lpfc_nodev_tmo=30 lpfc_discovery_threads=32
###BEGINPP
include /etc/modprobe.conf.pp
###ENDPP/etc/fstab是:
/dev/VolGroup00/LogVol00 / ext3 defaults 1 1
LABEL=/boot /boot ext3 defaults 1 2
tmpfs /dev/shm tmpfs defaults 0 0
devpts /dev/pts devpts gid=5,mode=620 0 0
sysfs /sys sysfs defaults 0 0
proc /proc proc defaults 0 0
/dev/VolGroup00/LogVol01 swap swap defaults 0 0
#/dev/sdae1 /mnt/sda1 ext3 defaults 0 0
#/dev/sdaf1 /mnt/sdb1 ext3 defaults 0 0
#/dev/sdag1 /mnt/sdc1 ext3 defaults 0 0
#/dev/sdah1 /mnt/sdd1 ext3 defaults 0 0
/dev/vg01/lvu02 /u02 ext3 defaults 0 0
/dev/vg01/lvu03 /u03 ext3 defaults 0 0
/dev/vg01/lvu04 /u04 ext3 defaults 0 0
/dev/vg01/lvu05 /u05 ext3 defaults 0 0
/dev/vg02/lvu06 /u06 ext3 defaults 0 0
/dev/vg02/lvu07 /u07 ext3 defaults 0 0
/dev/vg02/lvu08 /u08 ext3 defaults 0 0
/dev/vg02/lvu09 /u09 ext3 defaults 0 0
shmfs /dev/shm tmpfs rw,size=22g 0 0uanme -a
Linux cvoddv01.globetel.com 2.6.18-194.el5 #1 SMP Tue Mar 16 21:52:39 EDT 2010 x86_64 x86_64 x86_64 GNU/Linux发布于 2011-05-27 08:39:00
您应该同时使用或PowerPath,而不是同时使用。
来自PowerPath管理指南:
PowerPath与本地Linux设备映射程序(DM)不兼容。在同一主机上配置两个产品可能会导致系统不稳定。EMC建议您不要在将要安装PowerPath的主机上配置本机设备映射器。
发布于 2011-05-27 07:36:40
你试过删除和重建日记了吗?有几篇文章解释了如何重新创建你的EXT3日志。如果重新创建日志仍然会给您带来错误,那么我将研究硬件/驱动程序。-对不起,我在这里不能说得更详细。
发布于 2011-05-27 07:39:29
附加日志中受影响的设备是dm-7,所以我希望您对HP存储使用multipathd,对吗?如果您这样做,也请附加您的多点配置。
内核名称中的el5建议RHEL 5,如果您有支持合同,请尽快与他们联系,他们将能够帮助您。
我们从数据中可以确定的是,访问日志的尝试已经失败,操作系统做了它唯一能做的事情,即冻结文件系统,以避免任何写操作破坏它。
故障可能发生在以下任何组件中:
我不认为它会是ext3代码中的一个bug,因为它已经存在了一段时间了,但是您使用过任何外来的挂载选项吗?你的储藏室里有4K块吗?有什么异国情调吗?
服务器工作正常吗?如果是的话,你能说出导致它开始失败的变化吗?
如果您要自己解决问题,那么您最好的选择是制定一组使系统失败的最小选项。更实际的方法可能是重新组织您的存储,以便您只使用一个供应商的存储在任何给定的服务器。这可以为你节省供应商之间的乒乓球。
你最好的选择,不过,会联系你的操作系统供应商,让他们驱动的情况,我认为。
https://serverfault.com/questions/274357
复制相似问题