我发现我的服务器的文件系统一直在进入只读模式。raid1数组有一些问题,但是我已经从数组中删除了坏磁盘。但是,它仍然物理地插入到系统中,因为我还没有机会转到数据中心,我怀疑udev和系统内核仍然在拾取坏磁盘并抛出错误。在/var/log/消息中,存在如下错误:
Mar 2 06:53:14 nocloud kernel: ata1: exception Emask 0x10 SAct 0x0 SErr 0x4010000 action 0xe frozen
Mar 2 06:53:14 nocloud kernel: ata1: irq_stat 0x00400040, connection status changed
Mar 2 06:53:14 nocloud kernel: ata1: SError: { PHYRdyChg DevExch }
Mar 2 06:53:14 nocloud kernel: ata1: hard resetting link
Mar 2 06:53:20 nocloud kernel: ata1: link is slow to respond, please be patient (ready=0)
Mar 2 06:53:21 nocloud kernel: ata1: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
Mar 2 06:53:21 nocloud kernel: ata1.00: configured for UDMA/133
Mar 2 06:53:21 nocloud kernel: ata1: EH complete这种情况在一天中相当随机地发生,直到文件系统最终变成只读。当这种情况发生时,我的系统就变得不可操作了,这就违背了拥有raid1的目的。注意,ata1是坏磁盘(我认为ata1对应于/dev/sda,因为它们都排在第一位)。
在mdadm下,不再使用/dev/ and 1,2,但当我不再使用/dev/and 1 2并抛出这些错误时,我不能阻止系统内核继续查询该磁盘。
是否有办法防止我的文件系统自动进入只读模式?此外,这样做是否安全?
提前谢谢。
编辑:其他信息: cat /proc/mdstat的输出
md1 : active raid1 sdb2[1]
976554876 blocks super 1.1 [2/1] [_U]
bitmap: 5/8 pages [20KB], 65536KB chunk
md0 : active raid1 sdb1[1]
204788 blocks super 1.0 [2/1] [_U]从挂载输出:
/dev/mapper/VolGroup-LogVol00 on / type ext4 (rw,noatime)
proc on /proc type proc (rw)
sysfs on /sys type sysfs (rw)
devpts on /dev/pts type devpts (rw,gid=5,mode=620)
tmpfs on /dev/shm type tmpfs (rw,rootcontext="system_u:object_r:tmpfs_t:s0")
/dev/md0 on /boot type ext4 (rw)
none on /proc/sys/fs/binfmt_misc type binfmt_misc (rw)
sunrpc on /var/lib/nfs/rpc_pipefs type rpc_pipefs (rw)EDIT2: pvdisplay输出:
--- Physical volume ---
PV Name /dev/md1
VG Name VolGroup
PV Size 931.32 GiB / not usable 2.87 MiB
Allocatable yes (but full)
PE Size 16.00 MiB
Total PE 59604
Free PE 0
Allocated PE 59604发布于 2012-03-03 04:00:14
EXT4 3/4文件系统(对ext2不确定)可以配置为只在检测到某种形式的错误时翻转到读取,但通常会有类似于“EXT4 4-fs (sdb1):在日志中重新安装文件系统只读”的消息。
tune2fs给你看了什么?运行tune2fs -l /dev/md1列出文件系统当前值。您所寻找的设置是“错误行为”。可以使用tune2fs来更改错误行为,但在第二个驱动器出现问题之前,您确实应该替换驱动器。
https://serverfault.com/questions/365797
复制相似问题