首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Ext3不断地获取日志错误并成为只读。

Ext3不断地获取日志错误并成为只读。
EN

Server Fault用户
提问于 2011-05-27 06:47:24
回答 3查看 6.5K关注 0票数 2

我有一个RHEL5.5 5.5 x86_64服务器,2 HBA连接到EMC和HP存储阵列。EMC PowerPath之所以安装是因为我的EMC供应商坚持这样做。

我的问题是,HP存储上的卷经常会出现日记错误(见下文),并进入只读模式。

是SAN问题还是OS问题?我怎么解决这个问题?

代码语言:javascript
复制
May 27 14:16:57 cvoddv01 kernel: journal_bmap: journal block not found at offset 6156 on dm-7
May 27 14:16:57 cvoddv01 kernel: Aborting journal on device dm-7.
May 27 14:16:57 cvoddv01 kernel: ext3_abort called.
May 27 14:16:57 cvoddv01 kernel: EXT3-fs error (device dm-7): ext3_journal_start_sb: Detected aborted journal
May 27 14:16:57 cvoddv01 kernel: Remounting filesystem read-only
May 27 14:16:57 cvoddv01 kernel: __journal_remove_journal_head: freeing b_frozen_data
May 27 14:16:57 cvoddv01 kernel: __journal_remove_journal_head: freeing b_committed_data
May 27 14:16:57 cvoddv01 kernel: __journal_remove_journal_head: freeing b_frozen_data
May 27 14:17:36 cvoddv01 kernel: ext3_abort called.
May 27 14:17:36 cvoddv01 kernel: EXT3-fs error (device dm-7): ext3_put_super: Couldn't clean up the journal

我的modprobe.conf是:

代码语言:javascript
复制
alias scsi_hostadapter mptbase
alias scsi_hostadapter1 mptspi
alias scsi_hostadapter2 cciss
alias scsi_hostadapter3 ata_piix
alias scsi_hostadapter4 qla2xxx
alias eth0 e1000e
alias eth2 e1000e
alias eth1 e1000e
alias eth3 e1000e
alias eth4 bnx2
alias eth5 bnx2
#Added by HP rpm installer
alias scsi_hostadapter_mptscsih_module mptscsih
#Added by HP rpm installer
alias scsi_hostadapter_mptsas_module mptsas
options qla2xxx ql2xmaxqdepth=16 ql2xloginretrycount=30 qlport_down_retry=64
options lpfc lpfc_lun_queue_depth=16 lpfc_nodev_tmo=30 lpfc_discovery_threads=32
###BEGINPP
include /etc/modprobe.conf.pp
###ENDPP

/etc/fstab是:

代码语言:javascript
复制
/dev/VolGroup00/LogVol00 /                       ext3    defaults        1 1
LABEL=/boot             /boot                   ext3    defaults        1 2
tmpfs                   /dev/shm                tmpfs   defaults        0 0
devpts                  /dev/pts                devpts  gid=5,mode=620  0 0
sysfs                   /sys                    sysfs   defaults        0 0
proc                    /proc                   proc    defaults        0 0
/dev/VolGroup00/LogVol01 swap                    swap    defaults        0 0
#/dev/sdae1             /mnt/sda1               ext3    defaults        0 0
#/dev/sdaf1             /mnt/sdb1               ext3    defaults        0 0
#/dev/sdag1             /mnt/sdc1               ext3    defaults        0 0
#/dev/sdah1             /mnt/sdd1               ext3    defaults        0 0
/dev/vg01/lvu02         /u02                    ext3    defaults        0 0
/dev/vg01/lvu03         /u03                    ext3    defaults        0 0
/dev/vg01/lvu04         /u04                    ext3    defaults        0 0
/dev/vg01/lvu05         /u05                    ext3    defaults        0 0
/dev/vg02/lvu06         /u06                    ext3    defaults        0 0
/dev/vg02/lvu07         /u07                    ext3    defaults        0 0
/dev/vg02/lvu08         /u08                    ext3    defaults        0 0
/dev/vg02/lvu09         /u09                    ext3    defaults        0 0
shmfs                   /dev/shm                tmpfs   rw,size=22g     0 0

uanme -a

代码语言:javascript
复制
Linux cvoddv01.globetel.com 2.6.18-194.el5 #1 SMP Tue Mar 16 21:52:39 EDT 2010 x86_64 x86_64 x86_64 GNU/Linux
EN

回答 3

Server Fault用户

回答已采纳

发布于 2011-05-27 08:39:00

您应该同时使用或PowerPath,而不是同时使用。

来自PowerPath管理指南

PowerPath与本地Linux设备映射程序(DM)不兼容。在同一主机上配置两个产品可能会导致系统不稳定。EMC建议您不要在将要安装PowerPath的主机上配置本机设备映射器。

票数 2
EN

Server Fault用户

发布于 2011-05-27 07:36:40

你试过删除和重建日记了吗?有几篇文章解释了如何重新创建你的EXT3日志。如果重新创建日志仍然会给您带来错误,那么我将研究硬件/驱动程序。-对不起,我在这里不能说得更详细。

票数 0
EN

Server Fault用户

发布于 2011-05-27 07:39:29

附加日志中受影响的设备是dm-7,所以我希望您对HP存储使用multipathd,对吗?如果您这样做,也请附加您的多点配置。

内核名称中的el5建议RHEL 5,如果您有支持合同,请尽快与他们联系,他们将能够帮助您。

我们从数据中可以确定的是,访问日志的尝试已经失败,操作系统做了它唯一能做的事情,即冻结文件系统,以避免任何写操作破坏它。

故障可能发生在以下任何组件中:

  1. 存储--重装后文件系统是否正常?你能做一个完整的fsck,看看日志的问题是否是唯一出错的地方,或者你可能有很多沉默的腐败,只有当错误击中日志时,它才会变得可见。
  2. 这个特殊的伦。您能(如:它是可行的)格式化它,恢复数据,看看它是否再次发生?
  3. 您能否在同一个数组上创建另一个LUN并查看是否可以重现错误?同一存储空间中不同数组上的一个LUN?
  4. Multipathing --如果您直接访问存储,仅通过一条路径(这需要更改SAN分区或存储处的lun掩蔽),您是否可以再现错误。
  5. powerpath和本机多线程之间的驱动程序冲突。如果没有安装powerpath,可以在相同的LUN上复制错误吗?

我不认为它会是ext3代码中的一个bug,因为它已经存在了一段时间了,但是您使用过任何外来的挂载选项吗?你的储藏室里有4K块吗?有什么异国情调吗?

服务器工作正常吗?如果是的话,你能说出导致它开始失败的变化吗?

如果您要自己解决问题,那么您最好的选择是制定一组使系统失败的最小选项。更实际的方法可能是重新组织您的存储,以便您只使用一个供应商的存储在任何给定的服务器。这可以为你节省供应商之间的乒乓球。

你最好的选择,不过,会联系你的操作系统供应商,让他们驱动的情况,我认为。

票数 0
EN
页面原文内容由Server Fault提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://serverfault.com/questions/274357

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档