Hermes Agent(龙虾)运维、诊断、救援和安全加固技能
基于 5次实际救援经验 编写,覆盖 Gateway 崩溃救援、Agent自杀防护、venv保护、API配置迁移、路径迁移、pydantic依赖修复、配置安全审计等完整运维场景。
- 🏥 一键诊断 — 9大检查项,支持本地和远程SSH
- 🔒 venv加固 — chattr +i + setfacl + chmod 三管齐下防破坏
- 🛡️ 防自杀体系 — 四层防护架构(提示词→命令过滤→文件系统→环境)
- 📋 故障手册 — 5种已知死法+修复方案+飞牛OS踩坑
- 🚀 迁移工具 — 一键路径迁移(V1→V3 等)
- 🔧 安全模板 — blocklist/env/SOUL.md/systemd/cron 完整配置模板
将本仓库克隆到你的 WorkBuddy skills 目录:
# 用户级安装(推荐)
git clone https://github.com/YOUR_USERNAME/hermes-agent-maintainer.git ~/.workbuddy/skills/hermes-agent-maintainer
# 或项目级安装
git clone https://github.com/YOUR_USERNAME/hermes-agent-maintainer.git .workbuddy/skills/hermes-agent-maintainer在 WorkBuddy 对话中直接说:
- "龙虾死了" → 自动进入救援模式
- "帮我诊断龙虾" → 运行一键诊断
- "加固龙虾venv" → 执行venv写保护
- "帮我迁移龙虾路径" → 进入迁移流程
# 本地
python3 scripts/hermes_diagnose.py
# 远程SSH
python3 scripts/hermes_diagnose.py --ssh-host 192.168.31.65 --ssh-user cmp6021 --ssh-pass YOUR_PASSWORD
# JSON输出
python3 scripts/hermes_diagnose.py --jsonpython3 scripts/harden_venv.py --venv-path /path/to/.venv| # | 死因 | 症状 | 修复 |
|---|---|---|---|
| 1 | 自改config.yaml | Gateway重启循环 | 从备份恢复config |
| 2 | 清空.env | API调用全失败 | 从备份恢复.env |
| 3 | pip install破坏pydantic | OpenAI client初始化失败 | 降级pydantic-core |
| 4 | 删除.venv | ImportError全爆 | 从PyPI重建venv |
| 5 | 升级pydantic-core不兼容 | TLS/HTTP全废 | 锁定pydantic版本对 |
详见 references/failure_modes.md
┌─────────────────────────────┐
│ Layer 4: 环境层 │ 删除SUDO_PASSWORD + 清空allowlist
├─────────────────────────────┤
│ Layer 3: 文件系统层 │ chattr +i site-packages(内核级不可变)
├─────────────────────────────┤
│ Layer 2: 命令过滤层 │ hardline_blocklist 54+项 + tirith
├─────────────────────────────┤
│ Layer 1: 提示词层 │ SOUL.md第13节禁止行为清单
└─────────────────────────────┘
关键认知: Agent 是 config.yaml 的 owner,可以修改配置删除 blocklist。所以 系统层防护(chattr +i)是最后一道也是最重要的防线。
| 坑 | 说明 | 解决方案 |
|---|---|---|
| ACL架空chmod | 文件系统自动添加ACL,chmod a-w无效 | 先 setfacl -b 清空ACL |
| 路径含空格 | systemd ExecStart不支持 | 用wrapper script |
| PyPI不稳定 | 从NAS访问pypi.org超时 | 用清华镜像源 |
| 微信Session过期 | ilinkai平台限制 | 只能扫码重新登录 |
hermes-agent-maintainer/
├── SKILL.md # 技能定义(AI自动读取)
├── README.md # 本文件
├── LICENSE # MIT协议
├── scripts/
│ ├── hermes_diagnose.py # 一键诊断脚本
│ └── harden_venv.py # venv保护加固脚本
└── references/
├── failure_modes.md # 5次救援故障模式手册
├── security_templates.md # 安全配置模板
└── operations.md # 标准化运维操作流程
欢迎提交 Issue 和 Pull Request!特别是:
- 新的故障模式+修复方案
- 飞牛OS新踩坑记录
- 其他NAS平台的适配经验
MIT License - 自由使用、修改和分发