Hermes Agent 完全手册
自进化 AI 智能体框架 · 开源自主 · 越用越强
自进化 AI 智能体框架 · 开源自主 · 越用越强
Hermes Agent 是由 Nous Research 在 2026 年 2 月发布的开源自主 AI 智能体框架(MIT 协议),GitHub 仓库 NousResearch/hermes-agent。它不是绑定在 IDE 上的代码补全工具,而是一个真正的数字员工——拥有自己的服务器、记忆、技能,越用越强。
唯一内置学习闭环的智能体。从经验中创建技能(Skills),在使用中改进技能,主动持久化知识,搜索过往对话,并在跨会话中逐步构建对用户的深度理解。
支持从 $5 VPS、树莓派、笔记本到企业级 HPC 等多种环境。可在本地、Docker、SSH、Daytona、Modal 等 6 种后端运行。空闲时几乎零成本。
在 CLI、Telegram、微信、飞书、企微、钉钉等 23 个平台上共享同一套记忆和技能。一个统一的网关管理所有接入点。
Hermes Agent 的代码结构被清晰地划分为五个层次,每层只依赖内层。以下是完整的架构俯瞰——来源:架构深度解剖
| 模块 | 代码量 | 核心职责与设计亮点 |
|---|---|---|
| 基座层 agent/*.py | ~20K 行 | 多提供商适配器(适配器模式),自动故障转移,配置系统 |
| 工具层 tools/*.py | ~44K 行 | 自注册插件架构(AST 预扫描自动发现),Toolsets 逻辑分组 |
| 代理层 run_agent.py | ~3.8K 行(v0.15+ 缩减76%) | AIAgent 核心循环,ReAct 模式,上下文自动压缩,迭代限制检查 |
| 网关层 gateway/*.py | ~51K 行 | BasePlatformAdapter 抽象,会话编排,UTF-16安全截断,SSRF防护 |
| CLI/配置 hermes_cli/*.py | ~50K 行 | CLI 界面、配置管理、安装向导、桌面应用 |
来源:官方文档 · Features Hub
三层记忆体系:会话记忆(SQLite+FTS5)、长期备忘(MEMORY.md+USER.md)、技能(SKILL.md)。跨会话持久化,随使用增长。
v0.1从经验中自动创建技能 → 使用中改进 → 定期保存知识。使用越多越准确,正反馈循环。
v0.123 个消息平台统一管理:Telegram/Discord/Slack/WhatsApp/Signal/微信/飞书/钉钉/企微/QQ/Teams等。
v0.1 → v0.14SKILL.md 结构化知识(步骤+陷阱+验证)。自学闭环:自动创建 → 自动修正 → 自动更新。Skills Hub 92,520+技能。
v0.1delegate_task 工具,生成隔离的子代理处理并行工作流。上下文完全隔离,主代理不膨胀。
自然语言调度(非代码)。支持结果投递到任何消息平台。静默脚本监控 + 固定验证机制。
v0.1Playwright 驱动,视觉识别屏幕内容,结构化数据提取,网页操作。
v0.1既是 MCP Host(调用外部 MCP Server),又是 MCP Server(被其他应用调用)。tool_filter 安全控制。
v0.16 种后端:Local / Docker / SSH / Daytona / Singularity / Modal。安全隔离代码执行。
v0.1SQLite 驱动持久化看板,8 种协作模式。任务持久化 + 自愈 + 可审计。18 个 Agent 并行演示。
v0.13+纵深防御:输入清洗(10+模式) → 工具守卫(路径/SSRF) → 执行边界(子代理限制) → 数据保护(脱敏/PII哈希)。
v0.1200+ 模型支持(OpenRouter/Anthropic/OpenAI/Gemini/本地LLM等),按任务/预算路由,自动故障切换,凭据池轮询。
v0.192,520+ 可安装技能,12 个注册表。标准 agentskills.io 格式,跨平台兼容。社区开发活跃。
v0.4+内置强化学习流水线 Atropos,用于轨迹导出和工具调用模型训练。研究就绪。
v0.1语音转文字 + 文字转语音。支持语音备忘录转写、语音克隆(xAI Custom Voices)。
v0.13+Hermes Desktop (Electron):macOS/Linux/Windows。拖拽文件、Cmd+K、状态栏模型选择器、多 Profile 并发。
v0.16来源:GitHub Releases · 核心作者 teknium1
本节由玄机V3.0九层深度推理工程输出。核心结论:Hermes多AI协同采用五运行时递进体系,Kanban持久化编排是生产级王牌,8种协作模式+企业级容错,业界首创。——来源:Kanban官方文档 · Kanban完整指南
delegate_task(简单委派)→ 子代理(上下文隔离)→ /goal(长任务循环)→ Kanban(生产级编排)→ send_message(点对点通信)
| 机制 | 模式 | 持久化 | 容错 | 审计 | 依赖管理 | 适用场景 |
|---|---|---|---|---|---|---|
| delegate_task | RPC同步 | ❌ 无 | ❌ 无 | ❌ 无 | ❌ 无 | 简单子任务,3并发默认 |
| 子代理(Subagent) | 隔离委派 | ❌ 无 | 父中断全丢 | ❌ 无 | ❌ 无 | 复杂委派,嵌套orchestrator |
| /goal | 目标循环 | ✅ SessionDB | 重启丢失 | ✅ 状态日志 | ❌ 无 | 长任务自治,Judge闭环 |
| Kanban 看板 | 持久化队列 | ✅ SQLite | ✅ 断路器+崩溃恢复 | ✅ 完整事件溯源 | ✅ DAG依赖 | 生产级多Agent流水线 |
| send_message | 点对点通信 | ❌ 无 | ❌ 无 | ❌ 无 | ❌ 无 | Agent间信息交换 |
delegate_task 是同步RPC(进程内,父中断丢失),Kanban 是持久化工作队列(SQLite,进程外,可恢复)。Kanban 的每一次交接都是任何代理或人类在数据库行级别可见和可编辑的。
triage → todo → ready → running → done → archived
running → blocked → ready(异常/恢复路径)
关键:Dispatcher 自动将依赖满足的 todo→ready
1. 回收过期 claim → 2. 检测崩溃 Worker → 3. 自动分解 triage →
4. 提升依赖就绪 → 5. 原子性 claim + 生成 Worker → 6. 等待
Orchestrator 不执行实际工作,只做"分解+路由"。严格规则:
不 scope creep、每个子任务用 kanban_create、依赖全部自动管理。
独立 OS 进程,环境变量注入身份。6步 SOP:
定位 → 工作区 → 心跳 → 阻塞 → 完成(结构化) → 衍生。
N个同角色并行处理同类任务。50个社交账号舰队管理,一个 Profile 管理 N 个主体。
角色链式协作:侦察员→研究员→编辑→写手→质检。依赖链自动推进。
N个成员并行,聚合器裁决。3个研究员提供方案,1个评审者选择最佳。
同一角色 + 共享目录 + Cron 定时。定期往知识库写入日志。
Agentkanban_block()→ 自动暂停 → 人工处理 → kanban unblock 恢复。
评论中使用@profile_name即时路由。一个Agent在评论中"@reviewer 请审查"。
工作代理循环模式,裁判独立LLM持续评估,直到达标或预算耗尽。保守策略:宁可多跑不错判。
一个专家管理N个主体。监控12个服务、管理50个社交账号。
粗糙想法进入Triage列,LLM自动扩成完整任务(含目标+方案+验收标准)。用户说"写篇AI博客",自动生成调研/大纲/写作子任务。
| 安全机制 | 说明 | 技术实现 |
|---|---|---|
| 任务所有权门 | Worker只能操作分配给自己的任务 | _enforce_worker_task_ownership() CAS锁 + 环境变量验证 |
| 幻觉卡片门 | Worker声明的 created_cards 必须真实存在且属于自己 | SQLite 存在性校验 + Profile 血缘追踪 |
| 断路器 | 连续失败达上限后自动阻塞 | consecutive_failures ≥ failure_limit(默认2次)→ 阻塞 |
| 崩溃恢复 | Worker进程意外死亡后自动回收 | kill(pid, 0) 探活 + 60秒内感知 + 历史错误日志传递给新Worker |
来源:Hermes官方 · 18 Agent并行
核心技术栈:MCP + Kanban + Gateway 三件套。从信息抓取→分析→构建→视频→人工审批全自动。
来源:Akshay Pachaar · 2026-06-04
PM+后端+前端+测试,Telegram一条消息开工。基于Kanban依赖链+Pipeline模式,SOUL.md定义身份,Skills提供能力,Kanban协调执行。
来源:知乎实战 · 2026-05-11
搜索→编辑→写手→质检,含熔断保护+人工介入审批闸。基于Kanban P2 Pipeline + P5 Human-in-the-loop 混合模式。
来源:Skills Hub 官方 · Top 20 推荐清单
Hermes 的技能是包含 SKILL.md 的结构化知识文件,描述了完成特定任务的步骤、常见陷阱和验证方法。技能遵循 agentskills.io 开放标准,跨平台兼容。
学习闭环:当 Agent 完成复杂任务后,会主动提议将过程保存为技能 → 再次遇到类似任务时加载并使用 → 如果在执行中发现技能过时或不完整,Agent 会立即 patch(修正)它 → 这是一个"使用越多,技能越准确"的正反馈循环。
按安装优先级分四层:P0 内置必保留 → P1 新环境优先 → P2 按业务选装 → P3 谨慎安装
| # | 技能名称 | 类型 | 场景 | 层级 |
|---|---|---|---|---|
| 1 | plan | 内置 | 任务规划拆分 | P0 |
| 2 | writing-plans | 内置 | 写作计划 | P0 |
| 3 | systematic-debugging | 内置 | 系统化排障 | P0 |
| 4 | test-driven-development | 内置 | TDD开发 | P0 |
| 5 | requesting-code-review | 内置 | 代码审查 | P0 |
| 6 | subagent-driven-development | 内置 | 大任务拆解 | P0 |
| 7 | github-pr-workflow | 内置 | GitHub PR流程 | P1 |
| 8 | native-mcp | 内置 | MCP工具链扩展 | P1 |
| 9 | hermes-agent | 内置 | Hermes运维 | P1 |
| 10 | Obra Superpowers | 外部 | 开发效率提升 | P1 |
| 11 | Browser Use | 外部 | 浏览器自动化 | P1 |
| 12 | Defuddle | 外部 | 网页内容清洗 | P1 |
| 13 | youtube-content | 内置/外 | YouTube内容处理 | P2 |
| 14 | obsidian | 内置/外 | 知识库集成 | P2 |
| 15 | Playwright | 外部 | Web E2E测试 | P2 |
| 16 | arxiv / blogwatcher | 内置 | 学术研究 | P2 |
| 17 | SEO / GEO | 外部 | 内容站优化 | P2 |
| 18 | Composio | 外部 | SaaS办公自动化 | P2 |
| 19 | hermes-agent-skill-authoring | 内置 | 自定义技能开发 | P2 |
| 20 | Skill Factory | 外部 | 技能批量生产 | P3 |
hermes skills install <技能名> · 浏览技能:hermes skills browse · 添加注册表:hermes skills tap add <GitHub源>
Hermes Agent 可作为 MCP Host,连接任意 MCP Server 获取工具能力。通过 tool_filter 进行白名单/黑名单安全控制。支持 stdio 和 SSE 两种传输模式。
Hermes Agent 自身也可作为 MCP Server 暴露能力,被 Claude Desktop、其他 AI 工具或应用程序调用。
知微 MCP Server(端口 6005)基于 FastMCP 框架,暴露 16 个工具(kg_search/kg_get/kg_neighbors 等)。Hermes Agent 可以通过以下方式集成:
https://wiki.kddauto.com/mcp/hermes skills install 安装知微知识图谱查询技能来源:官方 README
| 后端 | 适用场景 | 安全等级 | 成本 |
|---|---|---|---|
| Local | 开发测试、个人使用 | ★★ | 零(本机) |
| Docker | 生产环境隔离 | ★★★★ | 低(已有机) |
| SSH | 远程服务器执行 | ★★★ | 低(VPS $5/月) |
| Daytona | Serverless 开发环境 | ★★★★ | 按需计费 |
| Modal | Serverless GPU 计算 | ★★★★ | 按需计费 |
| Singularity | HPC 高性能计算 | ★★★★★ | 高 |
# Linux / macOS / WSL2 curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash # 初始化 hermes setup --portal # 运行(CLI模式) hermes run # 启动消息网关 hermes gateway start # 从 OpenClaw 迁移 hermes claw migrate
硬件要求:最低 $5/月 VPS(1核/512MB),推荐 2核/4GB + 20GB 存储
以下展示 Hermes Agent 如何与款多多多 AI 协同体系中的各子系统深度集成
灵枢(scripts/ling_shu/)是知微系统内的 Hermes 原生 Agent 工厂框架,纯 stdlib 实现(零 LangChain/CrewAI 依赖)。重要:灵枢就是款多多多AI协同体系中基于 Hermes 原生系统的实现。
Sequential 编排模板 → Kanban 流水线
Concurrent 模板 → Kanban 扇出
GroupChat 编排模板 → Agent间通信
Handoff 模板 → 会话转移
18 维质量门禁 → 纵深防御
安全检查 → Tirith 安全层
来源:架构深度解剖
检测 Prompt Injection(10+ 种模式)、不可见字符、上下文文件扫描。
路径安全、SSRF 防护、危险命令审批(如 rm -rf)。
子代理工具限制(不能递归委派、发消息)、工具调用预算、执行超时、沙箱隔离。
敏感信息脱敏、PII 哈希、凭证文件隔离、Bitwarden Secrets Manager 集成(v0.15+)。
所有内容均标注来源,确保"出处可查、原文可溯"
hermes_intel_collector.py 每 6 小时全球搜索最新信息。
本节将 Hermes Agent 与全球顶级多AI协同平台进行全面对比,涵盖国际开源/商业方案和国内主流平台。帮助理解各平台差异化定位和Hermes的核心竞争力。——来源:2026 Multi-Agent框架终极对比 · Multi-Agent架构全景调研
| 框架 | 开发商 | 编排模型 | 状态持久化 | 模型锁定 | 最佳场景 | Stars(2026.6) |
|---|---|---|---|---|---|---|
| Hermes Agent | Nous Research | Kanban+DAG+6阶段Dispatcher | ✅ SQLite+事件溯源 | ❌ 200+模型 | 持久化多Agent流水线 + 跨平台网关 | 172K+ |
| LangGraph | LangChain | 有向图+条件边 | ✅ Checkpoint+Time Travel | ❌ 无 | 复杂分支/HITL/工业流程 | ~150K |
| CrewAI | CrewAI Inc. | 角色+Seq/Hierarchical | ❌ Flow-based | ❌ 无 | 内容创作/标准化任务 | ~100K |
| OpenAI Agents SDK | OpenAI | Handoff+Guardrails | ❌ Context Variables | ✅ OpenAI only | OpenAI原生栈/快速构建 | ~50K |
| AutoGen/AG2 | Microsoft | 对话GroupChat/Actor | ❌ Event sourcing | ❌ 无 | 研究/代码执行/自由对话 | ~80K |
| Google ADK | 层级Agent树+A2A | ✅ Session State | ✅ Gemini优化 | 多模态+搜索集成/Google云 | ~30K | |
| Anthropic Claude SDK | Anthropic | Orchestrator-Worker | ❌ Via MCP | ✅ Claude only | 安全关键应用/长任务 | ~40K |
| MetaGPT | DeepWisdom | SOP角色流水线 | ❌ 无 | ❌ 无 | 软件公司模拟/代码生成 | ~45K |
| Deep Agents | LangChain | Orchestrator-Worker | ✅ Filesystem+Checkpoint | ❌ 无 | 长任务/编码/研究 | ~10K |
生产中最常见(~70%)。中央协调者分解→分发→聚合。Hermes Kanban Orchestrator模式、Anthropic Research System、Salesforce Agentforce均属此。
Agent按序执行,前出后进。MetaGPT/ ChatDev/ CrewAI Sequential。Hermes Kanban P2 Pipeline 原生支持。
平等Agent直接辩论。CAMEL/ Multi-Agent Debate。Hermes通过send_message支持点对点通信。
运行时动态调整拓扑。AgentVerse/ DyLAN(2025-2026前沿)。Hermes Kanban Triage Specifier (P9) 已支持动态任务分解。
动态传递控制权。OpenAI Swarm/ Google ADK(A2A)。Hermes v0.14引入/handoff实现实时会话转移。
多Agent独立处理→投票/加权聚合。AI NeuroSignal。Hermes Kanban P3 Voting 原生支持。
| 平台 | 公司 | 核心能力 | 多Agent协同 | 优势场景 | 局限性 |
|---|---|---|---|---|---|
| Agentforce | Salesforce | CRM+AI+低代码Agent | 编排器+专业Worker | 销售/服务/营销自动化 | 锁定Salesforce生态/高昂 |
| Copilot Studio | Microsoft | Copilot+低代码Agent | Copilot编排/插件扩展 | Office 365/Teams/Dynamics | 锁定Azure/模型选择有限 |
| Bedrock AgentCore | AWS | 基础模型+代理框架 | 知识库+动作+多渠道 | AWS生态集成/企业合规 | 开发成本高/无社区版 |
| Vertex AI Agent | Google Cloud | Gemini+搜索+多模态 | A2A协议跨Agent通信 | 多模态/搜索增强/零售 | 锁定GCP/无开源 |
| Gemini Enterprise | Gemini 2.5+Workspace | 有限(Gemini内置协作) | Workspace集成/文档分析 | 非独立Agent平台 | |
| SAP Joule | SAP | SAP业务AI | 在SAP流程内嵌Agent | ERP/供应链/HR | 仅限SAP生态/开放度低 |
| ServiceNow AI | ServiceNow | ITSM+CSM+Agent | 工作流+Agent决策 | IT运维/客服工单 | 仅限Now平台 |
| 平台 | 公司 | 核心定位 | 多智能体协同 | 优势 | 局限性 |
|---|---|---|---|---|---|
| Dify | Dify.AI | 开源LLM应用开发平台 | ✅ GraphEngine编排 + 工作流 | 开源/私有化/工作流强大 | 多Agent协同需技术开发 |
| 扣子 Coze | 字节跳动 | 零代码AI Bot搭建 | ✅ 工作流+技能商店+Bot组 | 零代码最快上手/插件丰富 | 多Agent浅层/平台绑定 |
| 阿里百炼 | 阿里云 | 大模型+AI应用平台 | ✅ Agent编排+任务分解 | 阿里云生态/函数计算集成 | 需技术能力/依赖阿里云 |
| 百度千帆 | 百度 | 大模型+Agent开发平台 | ✅ 多智能体协同+工作流Agent | 中文理解领先/文心生态 | 模型选择有限/企业版贵 |
| 腾讯元器 | 腾讯 | 零代码AI聊天机器人 | ⚠️ 有限(偏向单Bot) | 微信生态/快速入口 | 多Agent能力弱/非编排 |
| 华为盘古 | 华为 | 行业大模型+全栈自主 | ⚠️ 大模型+小模型协同 | 全栈自主/安全合规/政企 | 开放性弱/专注行业 |
| BetterYeah AI | BetterYeah | 企业级AI Agent平台 | ✅ Multi-Agent协同引擎 | 智能任务分发/企业级 | 社区小/生态不成熟 |
| 蚂蚁数科Agentar | 蚂蚁集团 | 可信智能体平台 | ✅ 可信智能体技术 | 安全/金融场景可信 | 场景局限/面向金融 |
基于本次全维度对标分析,款多多多AI协同体系(知微)的差异化竞争路径:
LangGraph的复杂有向图 · Copilot Studio的Office集成 · Agentforce的CRM · 国产平台的零代码便利
中文知识图谱深度 · Hermes原生Kanban编排 · 款多多即时零售场景绑定 · 天枢AI协同闭环 · Skills Hub技能定制
天枢↔Kanban桥接 · 知微技能发布Skills Hub · 灵枢模板Kanban原生化 · 对标BetterYeah AI的任务分发