审计时间:2026-05-26 20:31 CST|范围:Master/default、Worker、Network、Health、Stock、News/Sub 配置与当前注入链路
可用
Master 本轮已成功注入 persona、scene navigation、外置记忆搜索工具。
1ms
本轮 Master TencentDB keyword recall 日志显示总召回耗时约 1ms。
5/5
8420–8424 五个 TencentDB sidecar 健康接口均返回 status: ok。
3
Master 当前 Scene Blocks:Telegram调用与模型恢复、内置记忆迁移承接、健康数据与热量核验。
| 层级 | 当前职责 | 证据 | 评价 |
| L0 原始会话 | 按 profile 写入 conversations/YYYY-MM-DD.jsonl,保留原始用户/助手片段。 | Master 最新 2026-05-26.jsonl 存在;Health、Stock 等也有各自 conversations。 | 正常 捕获链路存在,但不同 profile 活跃度不同。 |
| L1 结构化记忆 | 抽取 episodic records,供搜索与后续 L2 聚合。 | Master records/2026-05-26.jsonl 已记录“226 kcal 不应计入消耗”。 | 正常 但记录偏事件化,仍有重复摘要。 |
| L2 Scene Blocks | 把高热度/跨会话主题收敛成场景块,并在 prompt 中注入索引。 | Master scene navigation 注入 3 个场景;内置记忆迁移承接.md heat=9。 | 有效 已承担长背景迁移职责。 |
| L3 Persona | 生成用户叙事画像,给交互风格与长期偏好提供背景。 | 本轮 prompt 注入完整 user narrative profile;日志显示 persona loaded 1763 chars。 | 有效 但注入正文较长,要继续避免和内置 profile 重复膨胀。 |
| 内置 MEMORY/PROFILE | 只保留高频规则、路径、禁忌、术语陷阱。 | 当前 MEMORY 约 32%,USER PROFILE 约 92%。 | 部分紧张 Memory 很健康;Profile 接近上限,需要后续瘦身。 |
| Skills | 保存 runbook 与可复用流程,不承载项目流水账。 | 存在 agent-memory-governance 与 TencentDB rollout/rebalance 参考。 | 健康 流程知识放置正确。 |
| 优先级 | 问题 | 影响 | 证据 | 建议 |
| P1 | Master 进程内存很高。 | 不是记忆链路不可用,但 gateway 常驻 10.7G、峰值 13.2G,长期可能挤压系统资源。 | hermes-gateway.service Memory 10.7G;其 cgroup 下包含多个 LSP 与 5 个 TencentDB Node sidecar。 | 拆分/托管 sidecar 为独立 systemd 或减少 gateway 内衍生进程;先做资源治理,不急着改记忆逻辑。 |
| P2 | hermes memory status 显示 provider none,与实际运行矛盾。 | 容易误导运维判断,以为只剩 built-in。 | status 命令显示 “Provider none”;但 config/provider discovery/sidecar/注入日志都证明 Master 使用 TencentDB。 | 后续修 CLI 状态命令 profile/env 识别,或在 runbook 标注“以 config+health+日志为准”。 |
| P2 | News/Sub 未接入 TencentDB。 | News 可接受;Sub 若承载长期订阅/财务习惯,则会缺少长期偏好沉淀。 | news/sub config provider 为空;无对应 data root。 | News 暂不动;Sub 视使用范围决定是否灰度接入独立端口。 |
| P2 | USER PROFILE 接近上限。 | 未来新偏好难以写入;重复 persona 注入可能增加噪音。 | 当前 profile 约 92%。 | 把“叙事型偏好”继续迁出到 L3/scene,内置 profile 只留决策简报、HTML、重启上下文等硬偏好。 |
| P3 | L1 记录存在重复/事件流水倾向。 | 长期会增加召回噪音,尤其邮件报告、升级过程等一次性事件。 | Master 2026-05-23 records 中多条邮件报告摘要高度相似。 | 提高去重/合并策略;完成型任务不要过度 durable 化。 |
| P3 | embedding disabled。 | 语义召回能力弱于向量召回,但当前 keyword FTS5 很快、低风险。 | 所有 health endpoint embeddingService=false。 | 保持现状,等 L1/L2 去重稳定后再评估 embedding,不建议现在引入复杂度。 |