实战

uptime
# 10:23:45 up 23 days,  4:12,  2 users,  load average: 0.45, 0.52, 0.61

字段:

当前时间    已开机时长     在线用户   负载均值(1 / 5 / 15 分钟)

load average 解读

"过去 N 分钟内,平均等待运行 + 正在运行的进程数。"

判断:

单核机器 → load 持续 > 1   = 跑满了
8 核机器 → load 持续 > 8   = 跑满了
load 持续 > 核数 × 2       = 严重过载

短期高(突发)不要紧;持续高 = 真问题

三个数字看趋势

load average: 5.20, 3.80, 2.10
              1分    5分    15分
  • 1 分钟 > 15 分钟 → 负载正在上升
  • 1 分钟 < 15 分钟 → 正在下降

看简短的开机时长

uptime -p
# up 23 days, 4 hours, 12 minutes

uptime -s
# 2026-04-16 06:11:33      ← 上次开机时间

也可以从其他命令拿

# 来自 /proc
cat /proc/loadavg
# 0.45 0.52 0.61 2/234 12345
#                ↑ ↑    ↑
#       运行/总进程  最新 PID

# w 命令含 uptime
w
# 10:23:45 up 23 days, ...
# USER    TTY  FROM  LOGIN@  IDLE  WHAT
# ...

  • "load" 包含等 IO 的 D 状态进程——磁盘 IO 卡也会让 load 飙高,不一定是 CPU 不够
  • 高 load 不等于慢——要看 CPU / 内存 / IO 综合
  • 监控告警通常用 5 分钟或 15 分钟的——1 分钟数字波动太大