您使用什么策略来监控服务器硬盘的运行状况?你安排自动chkdsk与报告?你怎么警告失败?
磁盘子系统中实际上有很多需要监控的东西:
原文链接:https://www.f2er.com/windows/366209.html> Filesystem Health:chkdisk或fsdisk(文件系统与物理阵列的运行状况不同 – 但当然物理问题通常会导致FS损坏).
> RAID运行状况:包括raid控制器上任何raid配置和电池的状态.例如,有一个磁盘从阵列中退出,是否正在重建?
>每个磁盘的预测磁盘故障:请参见S.M.A.R.T
>工作温度(不是特定于磁盘,但很重要).
>最新的固件/驱动程序
您可能还想监视磁盘子系统的性能:
>读/写操作的平均时间
>读/写量
>磁盘操作队列
像Nagios这样的系统有各种插件,可以根据这些故障发出警报.通常,您需要Dell openmanage或MegaCLI等实用程序来通过SNMP监控RAID的状态.这些工具通常也会提醒您自己,但这不是集中的.