Hermes 第三方插件稳定性核查

生成时间:2026-05-19 21:56:10 CST

总体稳定性为“可用但需治理”:核心 Master、Web UI、Report Center、CLIProxyAPI、Worker/Stock/Health 运行正常;主要风险是 Network/News/Sub 的 systemd 状态与 Web UI 子进程运行状态不一致,以及外置记忆 sidecar 带来的资源与端口管理复杂度。

0failed systemd units
50%根分区使用率
18GiB可用内存
3/4已配置外置记忆 profile 在线

结论

服务状态

服务状态角色证据/备注
cliproxyapi.serviceactive核心模型代理运行 2+ 天;本地 /v1/models 无 key 返回 401,说明鉴权入口正常
hermes-gateway.serviceactiveMaster/默认网关运行 1天4小时;内存 1.5G,峰值 3.0G,需关注但未崩溃
hermes-web-ui.serviceactiveWeb UI本地与公网均 200;内存 431M,峰值 784M
report-center.serviceactive报告中心服务 active,公网 /reports/ 200;本地 /health 404 属无该路由,不代表故障
hermes-gateway-worker.serviceactiveWorker刚接入外置记忆后 active;8421 health ok
hermes-gateway-stock.serviceactiveStock刚接入外置记忆后 active;8422 health ok
hermes-gateway-health.serviceactiveHealth刚接入外置记忆后 active;8423 health ok
hermes-gateway-network.serviceinactive(systemd)Networksystemd 单元 dead,但 Web UI 子进程中 network gateway 正在运行;运行路径不统一
hermes-gateway-news.serviceinactive(systemd)Newssystemd 单元 dead,但 Web UI 子进程中 news gateway 正在运行;运行路径不统一
hermes-gateway-sub.serviceinactive(systemd)Subsystemd 单元 dead,但 Web UI 子进程中 sub gateway 正在运行;运行路径不统一

外置记忆状态

Agent端口状态证据/备注
Network8420downsystemd Network dead;Web UI 子进程在跑,但未看到 8420 sidecar health
Worker8421ok{"status":"ok","vectorStore":true,"embeddingService":false}
Stock8422ok{"status":"ok","vectorStore":true,"embeddingService":false}
Health8423ok{"status":"ok","vectorStore":true,"embeddingService":false}
News8424not configured/downprofile memory.provider 为空
Master8425not configured/downdefault profile memory.provider 为空

HTTP / 控制面探测

目标URLHTTP耗时/备注
Web UI localhttp://127.0.0.1:16060/2000.0017s
Web UI publichttps://hermes.loveason.com/2000.788s
Report Center publichttps://www.loveason.com/reports/2000.611s
CLIProxyAPI models no-keyhttp://127.0.0.1:8317/v1/models401预期鉴权失败

主要风险清单

级别问题影响
网关管理路径不统一Network/News/Sub 的 systemd 单元 inactive,但 Web UI 下存在对应子进程。后续排障时容易误判“已停止/已运行”,也可能产生重复 gateway 或抢 bot lock。
Master 内存占用偏高default gateway 当前 1.5G RSS、峰值 3.0G;第三方插件和外置记忆 sidecar 增多后,需监控内存趋势。
TencentDB sidecar 端口冲突噪音Worker/Stock/Health 烟测出现 EADDRINUSE,但 health 正常;属于多进程尝试启动同一 profile sidecar 的已知噪音。
cron/x_search import 错误历史News 日志中出现 AmbiguousJobReference 与 x_search import 错误,可能影响定时任务/工具加载;24h 内未在当前 active 服务重复出现。
API Server 无 key 警告Worker/Stock/Health gateway 日志提示 API_SERVER_KEY 未配置;若 API server 未公网暴露则风险较低,但应确认 Web UI/本地控制面边界。
FTS5 不可用TencentDB memory SQLite FTS5 不可用时降级到内存评分,影响召回质量但不是可用性故障。

建议处置顺序

  1. 统一 Network/News/Sub 的运行归属:确认这些 profile 是否应由 Web UI 托管,还是恢复 systemd 单元;避免双启动、假离线、bot lock 冲突。
  2. 为外置记忆加监控:定时检查 8421/8422/8423 health、数据文件增长、stderr 中持续 EADDRINUSE/ERROR;Network 8420 单独决定是否恢复。
  3. 观察 Master 内存:设置每日 RSS/峰值趋势检查,若持续增长再定位插件、LSP、sidecar 或会话压缩。
  4. 修复历史 import 错误:重点检查 cron.jobs 的 AmbiguousJobReference 与 x_search_tool 的导入错误是否仍影响 News/cron。
  5. 确认 API Server 暴露边界:若 API server 只在本机/Web UI 内部使用可暂缓;若有公网路径,必须补 API key 或访问控制。

本次未执行的动作