本文最后更新于194 天前,其中的信息可能已经过时,如有错误请发送邮件到big_fw@foxmail.com
1通过监控软件发现出现故障 |
2通过堡垒机连接故障机器,确定是否有故障 |
3定位cpu导致还是io导致 |
3.1top命令的%CPU部分如果us(user)或sy(system)高,表示 CPU占用导致的负载高 |
3.2top命令的%CPU这行的wa(iowait)系统的进程正在进行 读写操作,排队,表示磁盘读写导致. |
4定位到具体的进程. |
4.1如果是CPU导致,top命令cpu排序,ps aux.过滤排序 |
4.2如果是io导致,iotop -o |
5找出凶手后(问题进程),根据进程找出服务,查看服务. |