我在amazon ec2 ubuntu 11.04大型实例上安装了150GB的数据库(ext4).
cpu使用率非常低,但现在大约一天的负载平均值一直保持在2.0.我以前在40GB卷上有数据库分区,没有这个问题.
iostat告诉我,我们花了很多时间等待io:
:~$iostat 1 2 Linux 2.6.38-11-virtual (flashgroup) 04/05/2012 _x86_64_ (2 cpu) avg-cpu: %user %nice %system %iowait %steal %idle 7.16 0.09 2.62 1.11 2.09 86.92 Device: tps kB_read/s kB_wrtn/s kB_read kB_wrtn xvdap1 3.45 0.88 18.59 9137065 192742888 xvdb 4.47 2.84 24.17 29479675 250638760 xvdh 10.62 19.95 88.05 206811124 912892410 xvdf 0.18 0.00 1.93 1378 19971464 xvdg 0.00 0.00 0.00 656 0 avg-cpu: %user %nice %system %iowait %steal %idle 5.22 0.00 1.92 42.58 3.02 47.25 Device: tps kB_read/s kB_wrtn/s kB_read kB_wrtn xvdap1 0.00 0.00 0.00 0 0 xvdb 43.00 0.00 172.00 0 172 xvdh 0.00 0.00 0.00 0 0 xvdf 49.00 0.00 288.00 0 288 xvdg 0.00 0.00 0.00 0 0
我该如何调试呢?
编辑:
事实证明,没有一个卷表现出高延迟,系统的所有其他方面似乎都很健康. Wikipedia tells me linux中包含处于不可中断状态的进程的平均负载. ps告诉我有两个挂载命令处于这种状态:
ps auxww | grep " D" root 21557 0.0 0.0 9904 760 ? D Apr03 0:00 umount db /dev/xvdh root 26428 0.0 0.0 16456 912 ? D Apr03 0:00 mount /dev/xvdh /mnt/db
我害怕杀掉这些(如果我尝试的话,可能甚至都不会工作)所以我认为这个实例病了,需要重启.谢谢你的帮助!
事实证明,系统的所有其他方面似乎都很健康.
Wikipedia tells me linux中包含处于不可中断状态的进程的平均负载. ps告诉我有两个挂载命令处于这种状态:
原文链接:https://www.f2er.com/ubuntu/348543.htmlps auxww | grep " D" root 21557 0.0 0.0 9904 760 ? D Apr03 0:00 umount db /dev/xvdh root 26428 0.0 0.0 16456 912 ? D Apr03 0:00 mount /dev/xvdh /mnt/db
重新启动实例摆脱了这些挂起的处理,并且负载平均值恢复正常.