Hermes Agent 评测:自我进化 AI Agent、持久记忆与多入口自托管

Nous Research · 开源社区高速迭代

把持久记忆、多入口消息和自生成 Skills 装进同一套自托管栈:能力很强,治理也很真——“一个 Agent 多入口”的故事讲到了能跑起来的程度。

评测更新:2026 年 6 月 14 日 · 方法论与 BestClaw 排行榜对齐

7.5/10

BestClaw 综合分(28 维)

#10 本周期统一榜单

开源MIT持久记忆多渠道自托管

概览

Hermes Agent 来自 Nous Research,定位不是“再做一个 ChatGPT 壳”,而是让一个 Agent 长期驻留在你自己的服务器上,跨会话保留记忆,并可以从 Telegram / Slack / Discord / WhatsApp / 邮件 / CLI 等多个入口与同一个 Agent 继续对话。一个上下文、一个人格、多个入口。

它的产品线不是单点功能堆叠,而是一条相对完整的自托管 Agent 路径:持久记忆把对话与项目偏好做长期沉淀;自生成 Skills把问题求解过程沉淀为可复用的 Skill;子 Agent 并行支持把复杂任务拆给多个子 Agent 共同推进;浏览器和工具调用让它能跨工具收尾。MIT 协议加自托管,让“数据主权”这件事不只是 PR 话术。

BestClaw 看到的真实使用面:个人开发者把它当“随时叫得动的常驻助手”,研究团队把它当“研究自动化的实验台”,运营 / 自媒体角色用它把信息流和写作流串起来。它落到企业大规模采购仍偏早期,更适合愿意为部署、权限、运维买单的小团队。

对比维度上,Hermes 的差异化是“一个 Agent 多入口 + 长期记忆”,这是 OpenClaw 那套 Skill 生态不太覆盖的方向。如果你要的是企业治理边界稳定、SLA 明确,先把它放进 AB 对比,再和 ArkClaw 这类云端方案做并排取舍。

关键信息一览

部署形态
自托管:VPS / GPU 服务器 / WSL2 / 部分 serverless 后端;常驻进程为主
许可 / 源码
MIT 开源,可审计、可 fork、可商用扩展
核心差异
持久记忆 + 自生成 Skills + 多入口消息网关 + 子 Agent 并行
入口覆盖
Telegram / Slack / Discord / WhatsApp / 邮件 / CLI / Webhook
模型与运行
多模型路由:OpenAI / Anthropic / OpenRouter / 本地推理;可按任务切换
生态阶段
高速迭代中,社区热度高;文档与默认治理仍在补全
更适合
想要常驻 Agent、研究 Agent 记忆闭环、自建消息型自动化的开发者与小团队
风险焦点
长期凭证 + 多入口 + 常驻运行的组合,治理面比一次性 Chatbot 大很多

优点与局限

优点

  • “一个 Agent 多入口”的体验在同类里几乎没有对手,CLI、聊天工具、邮件可以串成同一上下文。
  • 持久记忆和自生成 Skills 让它真正像一个“一直在工作的同事”,不是每次对话都从零开始。
  • MIT 协议 + 自托管,对数据主权、可审计、私有部署敏感的团队是直接答案。
  • 子 Agent 并行、浏览器自动化、多模型路由都已经落到可跑通的程度,不是 demo 级别。
  • 社区迭代速度快,问题修复与新能力推进都比传统开源项目活跃。

局限

  • 高速演进意味着默认治理策略、文档、长期兼容性都还在补全,不适合需要稳态的企业采购流程。
  • 自托管不等于省心:模型 API 账单、常驻资源、消息入口运维都是真实成本,组合起来不便宜。
  • Telegram / Slack / 邮件这些入口一旦接进来,长期凭证 + PII + audit 立刻变成主要工作量。
  • 子 Agent 并行能力强,但缺少团队规范时容易出现“agent 自己开 agent”的失控曲线。
  • 如果你要的是 SLA + 商务签约的企业托管方案,Hermes 目前不是最稳妥的路径。

能力拆解(含短板)

  • 持久记忆与用户模型

    跨会话保留记忆、检索历史上下文,并逐步形成对项目和用户偏好的长期理解;这部分是 Hermes 区别于普通聊天型 Agent 的核心。

  • 多入口消息网关

    同一个 Agent 跑在 Telegram / Discord / Slack / WhatsApp / 邮件 / CLI 之间;适合作为“随时叫得动”的常驻助手。

  • Skill 自生成与改进

    项目鼓励把问题求解过程沉淀为可复用 Skill,并在后续使用中持续改进,让平台逐渐“自己长出能力”。

  • 子 Agent 并行

    复杂任务可以拆给多个子 Agent 同步推进;能力强,对编排、隔离、可观测性的要求也成倍上升。

  • 浏览器与工具调用

    支持浏览器自动化与外部工具调用,能跨工具收尾“信息检索 → 处理 → 反馈”的链路。

安全 —— 上线前请读完

Hermes 真正的安全风险,不在于“它是不是开源”,而在于它会拿到长期有效的凭证、接入多个消息入口,并且常驻运行在你自己的主机上。上线前请把以下五件事写进运维清单:

  • 凭证治理:Telegram / Slack / 邮件 token 放进 secret manager,长期凭证按季度轮换并审计。
  • 暴露面:Webhook 入口走 HMAC 校验;公网入口加 WAF + 速率限制;管理操作按角色门禁。
  • 记忆数据:明确哪些记忆条目可写、可读、可导出、可删除;个人 PII 默认不进长期记忆。
  • 子 Agent 范围:默认禁止 Agent 自动生成新 Agent;需要时白名单 + 显式审批。
  • 更新与回滚:高速迭代意味着版本节奏快,部署前明确升级窗口和回滚路径。

结论

Hermes Agent 是 BestClaw 当前“个人 + 实验型团队 + 持久记忆 + 多入口”这条赛道最有代表性的开源选择。把它当成常驻助手 + 自动化实验台,性价比相当好。如果你要企业级 SLA / 商务路径 / 最少运维,先看 OpenClaw LaunchArkClaw,再把 Hermes 作为研究 / 实验侧的并行栈。AB 对比能帮你和 OpenClawNanoClaw 一起做并排取舍。

得分与排名遵循已公开的 BestClaw 方法论;Hermes Agent 处于高速迭代阶段,后续会随版本、社区验证与安全观察持续更新,但不会因商业合作改变评分结论。

用户评测与评分

本页用户评价与 BestClaw 方法论综合分、榜单排序相互独立。

用户评分来自本页提交与审核后的反馈;不参与排行榜改分,也不改变方法论得分(7.5 / 10)。

4.4
/ 5

基于本页 92 条星级评价

星级分布

  • 5
    45%
  • 4
    33%
  • 3
    13%
  • 2
    6%
  • 1
    3%

维度侧重点(来自评论归纳)

  • 持久记忆与子 Agent 协作4.6 / 5
  • 多入口消息网关4.4 / 5
  • Skills 自生成 / MCP 接入4.5 / 5
  • 长期凭证治理3.7 / 5
  • 模型 / 网关运维成本3.5 / 5
Maya R.已验证用户
应用研究 · 早期创业
5.0 / 5

终于像一个一直在工作的同事

持久记忆 + 子 Agent 并行让我第一次愿意把多步骤研究全交出去。Skills 自生成不是宣传,但要给提示词留预算。

认为有用 · 41

Dimitri H.已验证用户
平台工程 · SaaS
4.0 / 5

能力强,但治理是真的活

Telegram / 邮件 / Webhook 全开后,长期凭证、PII 留存和 audit log 一下子变成主要工作。模型 API 费用比预期高 20%。

认为有用 · 27

Yuki S.已验证用户
研究运营 · 大学实验室
4.0 / 5

适合小组长,不适合直接给本科生

“能改自己的 prompt”这件事对资深人很爽,对新人会迅速失控。我们最后用一个白名单 Skills 子集作为入口。

认为有用 · 18