它在过去3个月里一直运行顺畅,但最近我们注意到两个奇怪的错误.
一个.服务器挂起,今天是第二次.悬挂的本质很奇怪.
我可以ping到服务器服务器,它发送回响应很好.但是sshd,apache,mysql等所有其他服务根本不响应.
工作时
telnet servername 22 Escape character is '^]'. SSH-2.0-OpenSSH_5.X Debian-5ubuntu1
其他网络服务运行良好.当它挂起时,我可以将tcp连接到22以及80,但根本没有响应.
telnet servername 22 Escape character is '^]'.
我该如何调试这个问题?是否有可以运行的守护程序会定期记录状态?请告诉我如何处理它.
湾另一个奇怪的问题是,最近我无法传输大于100KB的文件,大约1-2 KB工作文件的较小文件.
scp anotherserver:filename .
要么
wget http://www.example.com/file
会卡住.仍有大约6GB的空间,所以我不认为这是一个问题.我应该研究哪些指针?
解决方法
你这样使用它:
显示处理器活动(默认)
sar -p(或者只是sar)
显示27日的内存统计信息
sar -r -f / var / log / sysstat / sa27
请注意,路径因安装而异.在基于redhat的系统上,文件通常位于/ var / log / sa /中,而如果安装了atsar软件包,它们将位于/ var / log / atsar / – 但模式是文件将以数字结尾,表示收集数据的当月.
某些版本(如atsar)允许您只指定日期:sar -n 27.检查安装附带的联机帮助页,以找出正确的语法以及可以检索的数据.
一旦你安装并运行了(你可能已经这样做了!),你可以使用它收集的信息来了解崩溃之前发生的事情.例如,如果报告显示您的内存已耗尽且可用交换空间倒计时为零,那么您将非常清楚要查找的内容.
有了这些信息,您可以设置其他报告,以便更好地了解错误:例如,您可以编写一个简短的bash脚本来检查某些系统统计信息(例如/ proc / meminfo或/ proc的内容) / loadavg)并且如果满足触发条件,可能会将适当的调试信息(如ps auwwxf的输出)附加到文件中,或者将信息通过电子邮件发送给您.