🔍 VPS 全量巡检报告

2026-06-03 21:00 UTC+8 · Network Agent · 14 台节点全覆盖

📋 结论

14/14
在线节点
7
需要重启
2
Failed 服务
2
Fail2ban 未启用
68
总待更新包

📊 资源总览

节点IP运行时间内存磁盘负载Failed待更新重启
AR 129.146.59.53 3天22小时 7025/23975MB (29%) 46G/116G (40%) 0.06 0 4 需要
DE 47.254.140.158 4周4天 477/1613MB (30%) 24G/40G (63%) 0.00 1 2 需要
JPA 13.112.210.201 1周 471/911MB (52%) 7.3G/38G (20%) 0.08 0 4
JP 64.118.144.182 3周1天 375/849MB (44%) 3.9G/9.8G (42%) 0.11 1 0
JPB 13.193.126.87 23分钟 206/414MB (50%) 3.2G/19G (17%) 0.00 0 52
KR 131.186.27.212 4周5天 474/954MB (50%) 4.2G/48G (9%) 0.00 0 5 需要
KRB 161.118.130.5 4周5天 462/954MB (48%) 3.3G/45G (8%) 0.16 0 3 需要
SG 52.220.159.135 1周1小时 791/1907MB (41%) 6.3G/58G (11%) 0.01 0 3 需要
US 186.241.84.19 1天21小时 814/3915MB (21%) 12G/29G (42%) 0.15 0 0
HKA 38.76.188.244 1天4小时 721/3915MB (18%) 13G/29G (44%) 0.01 0 4
HKY 185.155.235.171 3周6天 206/957MB (22%) 1.8G/9.8G (19%) 0.24 0 3
USB 161.153.95.69 4周5天 485/954MB (51%) 5.2G/48G (11%) 0.06 0 1 需要
UK 167.71.140.103 20小时 199/458MB (43%) 2.3G/8.7G (27%) 0.04 0 1 需要
AU 134.199.173.24 20小时 199/458MB (43%) 2.3G/8.7G (27%) 0.07 0 0 需要

🔒 安全状态

节点SSH 端口Fail2ban防火墙XrayNginxHermes GWDocker
AR22运行中关闭未安装运行中运行中运行中
DE22运行中关闭运行中运行中未安装未安装
JPA22未启用关闭运行中未安装运行中未安装
JP22运行中未知运行中运行中未安装未安装
JPB22未启用关闭运行中未安装未安装未安装
KR22运行中未知运行中运行中未安装未安装
KRB22运行中未知未安装运行中未安装未安装
SG22运行中关闭运行中未安装未安装未安装
US22运行中开启未安装运行中未安装运行中
HKA22运行中关闭未安装运行中未安装运行中
HKY22运行中未知未安装运行中未安装未安装
USB22运行中未知运行中运行中未安装未安装
UK22运行中关闭未安装未安装未安装未安装
AU22运行中关闭未安装未安装未安装未安装

⚠️ 异常与风险详情

JP64.118.144.182 certbot failed
问题:certbot.service 状态 failed
影响:SSL 证书自动续期中断,证书过期后 HTTPS 将不可用
24h 错误日志:157 条
建议:检查 certbot 日志,确认域名证书状态,手动运行 certbot renew 测试
DE47.254.140.158 aegis failed 磁盘 63% 需重启
问题1:aegis.service failed(阿里云安全代理残留)
影响:非业务影响,但日志持续报错(24h 152 条)
问题2:磁盘使用 63%,为全队最高
问题3:内核更新后未重启
建议:清理 aegis 残留;磁盘清理或扩容;安排重启
JPA13.112.210.201 fail2ban 未启用
问题:fail2ban 未安装或未启动,SSH 暴力破解无防护
建议:apt install fail2ban && systemctl enable --now fail2ban
JPB13.193.126.87 fail2ban 未启用 52 个待更新
问题1:fail2ban 未启用
问题2:52 个包待更新(刚接管,系统较旧)
建议:安装 fail2ban;分批更新系统包
UK / AU24h 高错误日志 需重启
UK 错误数:159 条/24h(内核相关为主)
AU 错误数:147 条/24h(内核相关为主)
原因:DigitalOcean 小内存实例内核日志噪声,非业务故障
建议:重启清理内核告警;配置 journald 限制日志大小

📝 日志健康(24 小时)

节点Journal 大小24h 错误数主要来源
JP30.9M157sshd
JPA137.2M44sshd
KR72.8M0
USB48.2M34sshd
DE92.4M152systemd
AR260.6M23systemd
KRB242.0M27sshd
SG24.0M4sshd
US100.4M38kernel
HKA38.1M40kernel
HKY1.1M30sshd
UK16.6M159kernel
AU12.1M147kernel
JPB16.0M0

🎯 下一步优先建议

  1. 安装 fail2ban(JPA + JPB):两台暴露在公网的 SSH 节点没有暴力破解防护,优先级最高。
  2. 修复 JP certbot:证书自动续期失败,需要检查 certbot 日志并手动续期一次确认域名可用。
  3. 批量重启 7 台待重启节点:KR、USB、DE、KRB、SG、UK、AU 都有内核更新等待生效,建议按 DE→KR→SG→KRB→USB→UK→AU 顺序逐台重启。
  4. JPB 系统更新:52 个包待更新,刚接管的节点建议先完成基础更新。
  5. DE 磁盘清理:63% 使用率,建议清理 aegis 残留目录、apt 缓存和旧日志。