我的服务器每隔几分钟就会经历非常高的负载平均峰值(>10,有时甚至>20)。
top显示CPU没有在使用,而是在等待I/O操作:
top - 17:42:28 up 8 days, 8:10, 1 user, load average: 9.01, 10.16, 6.54
Cpu0 : 0.0%us, 0.0%sy, 0.0%ni, 0.0%id,100.0%wa, 0.0%hi, 0.0%si, 0.0%st
Cpu1 : 0.0%us, 0.0%sy, 0.0%ni, 0.0%id,100.0%wa, 0.0%hi, 0.0%si, 0.0%stdmesg一遍又一遍地显示这个输出(我不明白它的意思):
ata2.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x2
ata2.00: BMDMA stat 0x26
ata2.00: cmd ca/00:08:74:c4:24/00:00:00:00:00/ef tag 0 dma 4096 out
res 51/84:01:7b:c4:24/84:00:10:00:00/ef Emask 0x30 (host bus error)
ata2.00: status: { DRDY ERR }
ata2.00: error: { ICRC ABRT }
ata2: soft resetting link
ata2.00: configured for UDMA/33
ata2: EH complete
sd 3:0:0:0: [sdb] 625142448 512-byte hardware sectors (320073 MB)
sd 3:0:0:0: [sdb] Write Protect is off
sd 3:0:0:0: [sdb] Mode Sense: 00 3a 00 00
sd 3:0:0:0: [sdb] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA有什么想法吗?
服务器上运行着FreeRADIUS,我怀疑任何一个RADIUS网络适配器都可能导致问题。在某些高峰期间,tcpdump显示发送/接收的RADIUS包数量增加(但我指的是每分钟数十个包,而不是数千个包)。
当我停止半径的情况变得更好,但仍然有周期性的负荷平均峰值(更可容忍)。
有没有人知道导致这种行为的原因,以及我如何确定它的半径、网络适配器或其他什么东西?
谢谢
发布于 2011-12-09 17:51:28
不,这要么是一个磁盘,要么是一个磁盘控制器濒临死亡。这与您正在运行的软件或网络适配器无关。
如果你还没有做备份-现在就做一个,并开始寻找替代硬件。
发布于 2011-12-09 17:57:21
一个几乎相同的问题,像这个已张贴在苏
在重新启动或修改设置之前-执行备份(并且奇偶校验!)尽快。
https://serverfault.com/questions/339492
复制相似问题