实战
uptime
# 10:23:45 up 23 days, 4:12, 2 users, load average: 0.45, 0.52, 0.61
字段:
当前时间 已开机时长 在线用户 负载均值(1 / 5 / 15 分钟)
load average 解读
"过去 N 分钟内,平均等待运行 + 正在运行的进程数。"
判断:
单核机器 → load 持续 > 1 = 跑满了
8 核机器 → load 持续 > 8 = 跑满了
load 持续 > 核数 × 2 = 严重过载
短期高(突发)不要紧;持续高 = 真问题。
三个数字看趋势
load average: 5.20, 3.80, 2.10
1分 5分 15分
- 1 分钟 > 15 分钟 → 负载正在上升
- 1 分钟 < 15 分钟 → 正在下降
看简短的开机时长
uptime -p
# up 23 days, 4 hours, 12 minutes
uptime -s
# 2026-04-16 06:11:33 ← 上次开机时间
也可以从其他命令拿
# 来自 /proc
cat /proc/loadavg
# 0.45 0.52 0.61 2/234 12345
# ↑ ↑ ↑
# 运行/总进程 最新 PID
# w 命令含 uptime
w
# 10:23:45 up 23 days, ...
# USER TTY FROM LOGIN@ IDLE WHAT
# ...
坑
- "load" 包含等 IO 的 D 状态进程——磁盘 IO 卡也会让 load 飙高,不一定是 CPU 不够
- 高 load 不等于慢——要看 CPU / 内存 / IO 综合
- 监控告警通常用 5 分钟或 15 分钟的——1 分钟数字波动太大