大家好,我是袋鼠帝。
最近几天,不管是国内的开发者社群,还是国外的X,又有一个开源项目的热度简直高得离谱。
根据开源项目飙升榜的数据,它在一个月内的增长率达到了惊人的百分之1237。

仅仅过了两个月时间,它的标星数量就已经突破了40K大关。
在技术社区里,很多人甚至直接把它称为 OpenClaw 的第一个真正竞争对手。

这个爆火的开源项目,叫做 Hermes Agent,地址:https://github.com/NousResearch/hermes-agent

是由 Nous Research 团队倾力打造的开源Agent。

今天,我们就来看看,这个号称会自我成长的个人专属Agent,到底凭什么还能在竞争白热化的智能体赛道里(前有Claude Code、CodeX,后有OpenClaw),硬生生杀出一条血路。
不过,在聊 Hermes Agent 之前,我们先来看看目前的行业现状。
大家平时用得最多的各类智能工具,不管是网页端的聊天框,还是各种挂在后台跑自动化任务的程序,都有一个很大的问题,那就是健忘。
比如,你今天手把手教它处理了一份格式非常复杂的财务报表,它按部就班地做得很完美。
但是到了明天,当你扔给它一份格式完全相同的新报表时,它像是失忆了一样,又做不好了,你不得不把昨天教过的事情,再教一次...
目前的常规解决办法,通常是有一堆规则文件,或者去skill市场里下载、安装别人写好的skill。
这就好比你招了一个干活特别麻利的实习生,但他从来不记笔记。
每次你交办类似的任务,你还得亲自把操作步骤写一份给他🤣。这根本不叫自动化,这叫emm,赛博折磨。
我感觉openclaw的学习能力还欠佳,我也会遇到明明类似的任务,第一次处理的很好了,但过两天它又不会了...
Hermes Agent 之所以能在短时间内爆火出圈,根本原因在于它从底层架构上就解决了一个核心痛点:它拥有内置的学习循环。
应该是目前市场上唯一一个真正做到从经验中自我评估并自我进化的智能体。
Hermes Agent 工作逻辑是这样的:
当它完成了一个包含5次以上工具调用的复杂任务后,系统会触发一个自我评估检查点。
它会自动停下来,问自己一个问题:我刚才做了什么?成功了吗?这个解决问题的套路值得被记住吗?

如果答案是肯定的,它就会自动生成一份结构化的技能文档,把刚才的成功经验固化下来,存入自己的能力库中。
这就好比那个原本不记笔记的实习生,突然开窍了。他不仅顺利干完了活,还自己总结并记录了一套标准操作流程。下次你再让他干同样的活,他直接拉出这份流程照着做就行了。更厉害的是,如果在后续的工作中,他发现了更省时间的捷径,他还会偷偷修改那份流程文档,让这项技能不断自我迭代。
这种闭环设计带来的效率提升是非常惊人的。
根据社区用户的真实反馈,当 Hermes 在两小时内自动生成了三份技能文档后,处理同类重复性研究任务的速度直接提升了百分之40。
为了支撑这种强大的自我学习能力,研发团队给它塞进了一套非常硬核的四层记忆架构。这套架构很有意思

第一层是持久化笔记:这部分主要存放你明确要求它记住的关键事实和偏好信息。它就像是助理随身携带的备忘录,永远不会弄丢。
第二层是会话历史系统:它在底层使用了全文搜索技术,能够跨越不同的聊天窗口和时间线,精准翻找以前的对话记录。
第三层就是刚才提到的程序性记忆:也就是它自己从无数次摸索和试错中,建立起来的自动化技能文件集合。
最后一层最妙,叫做用户建模:它会通过专门的建模技术,深度分析你的说话习惯、沟通风格和潜在偏好。
这四层记忆紧密咬合叠加在一起,让它变成一个随着时间推移,越来越懂你脾气秉性的专属管家。
看到这里,很多朋友肯定会问,既然市面上已经有了一个火爆过的生态极其繁荣的 OpenClaw,为什么大家还要去折腾 Hermes?
主要是这两者的产品定位和底层哲学截然不同。
OpenClaw 的架构是网关中心式的,它像是一个企业的总控台,非常适合团队协作和确定性的流水线工作。
ClawHub目前已经拥有将近5万个社区插件,主打一个生态庞大、拿来即用。
它的核心诉求是:能干各种活儿的专属助理

而 Hermes 采用的则是以执行循环为中心的同心增长式架构。
核心是:如何让这个大脑变得越来越强。
用一个我们日常生活中的例子来类比:OpenClaw 就像是去逛大型的五金超市,你需要螺丝刀或者扳手,就自己去货架上挑,然后买回来按部就班地干活。如果你找不到趁手的工具,任务可能就卡住了。
而 Hermes 就像是一个聪明的铁匠学徒,你不需要去外面买工具,你只要让他看着你干几次活,他自己就能在后院把你需要的那把扳手锻造出来,甚至还会根据你的手型改良扳手的握把。
抛开落地场景谈技术,都是毫无意义的。
在这短短两个月里,全球的极客们已经用它跑出了很多让人惊讶的案例。
最出圈的案例之一,是Nous Research使用Hermes Agent写了一部8万字的AI小说 《The Second Son of the House of Bells》

它甚至还包揽了后期的排版、封面图片生成、有声书录制,以及最终落地推广网页的搭建。
还有人把它当成代码审查专家。在它逐渐熟悉了开发者的审查偏好后,后续提交代码时,根本不需要再写冗长繁琐的背景介绍,它会自动带着之前的上下文记忆进行精准的代码纠错。
对于 Linux 和 macOS 用户来说,安装Hermes Agent只需要在终端输入一行命令:
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
1分钟左右就能完成全部安装。
它甚至提供了一键迁移openclaw数据的流程

安装好后,跟openclaw的启动、配置方式很像

支持这些模型供应商:

然后,一上来它就知道我叫袋鼠帝了,真无缝迁移openclaw~

但是这个黄色的回复文字,在Mac终端白色背景下几乎快看不出来了。。。
然后它跟openclaw差不多,都不吃配置,安装在一台只要 5美元/月 的入门级服务器上就能流畅运行了。
当然,作为一个还在快速迭代期的年轻项目,它目前也有一些客观存在的局限性。
首先是老生常谈的 Token 消耗过大的问题。因为要时刻维持学习闭环的运转,并且频繁调用底层的全文检索和记忆系统,它的思考过程非常吃算力。
根据社区的实测反馈,仅仅是轻度使用两个小时,就可能消耗掉大约400万个 Token。
针对这个问题,社区也整理出了一些省钱的实用建议。比如,你可以手动删除掉系统自带的但你根本用不上的娱乐类skill,一定程度减轻它的记忆负担。
另外,强烈建议使用性价比更高且支持提示词缓存的模型,这样能极大地压低日常调用的成本。
其次是操作系统兼容性。它目前在 Mac 和 Linux 系统上运行最为完美。
但对于广大的 Windows 用户来说,它的原生支持还不稳定,经常会出现各种离奇的报错。Windows 用户如果想顺畅体验,目前必须借助 WSL2 虚拟环境。
最后是学习曲线。虽然安装只要一行代码,但如果你想把它调教得完全符合你的心意,深入理解它的记忆机制和技能生成逻辑,对小白来说还是有一定的门槛。
它的社区规模目前也还在发展阶段,遇到偏门问题时,可供参考的现成资料不如openclaw那么多。

比如说上面这样,偶尔还会出现一些报错,虽然没有影响使用,但总感觉它不稳定。
在经历过之前openclaw的安全漏洞事件后,现在大家对于把系统控制权交给程序的行为已经比较警惕了。
但 Hermes 在安全防护上交出了一份相当扎实的答卷。
坚决不偷偷上传用户的任何操作数据,把隐私权完全交还给用户。
对于文件删除、系统级终端执行等高危命令,它引入了严格的平台按钮审批机制,必须严格由人类亲自点击确认后才能放行。
再加上底层的容器化隔离执行环境,以及明确的外部工具黑白名单控制,它把安全防线的纵深拉得非常长。
最值得敬佩的,是这个团队极其纯粹的极客态度。整个项目采用极其宽松的 MIT 开源协议。
MIT 协议(MIT License)是最宽松、最简洁的开源软件许可协议之一

「最后」
2026年,整个AI行业的发展发生了质的改变。
大家不再只盯着哪家大模型的参数又多了几百亿,哪个跑分榜单又刷了新纪录。
无论是开发者还是普通用户,都开始把更多的目光,投入到如何让AI真正落地融入人类的日常工作流中。
大家越来越关注它们是否具备反思错误、沉淀记忆和自主进化的能力。
一个不会总结经验、永远停留在出厂设置的工具,即便给它再多的工具,也永远只能是个被动的工具,停滞不前。
只有当一个系统长出了学习的神经,能够像人类一样从每一次失败和成功中提取养分,它才真正配得上智能体这个称号。
我觉得所有养虾的朋友都可以试试Hermes Agent,反正几乎是无感迁移,说不定能比openclaw更好养呢。
我是袋鼠帝,一个致力于帮你把AI变成生产力的博主。我们下期见~
能看到这里的都是凤毛麟角的存在!
如果觉得不错,随手点个赞、在看、转发三连吧~
如果想第一时间收到推送,也可以给我个星标⭐
谢谢你耐心看完我的文章~
文章来自于微信公众号 "袋鼠帝AI客栈",作者 "袋鼠帝AI客栈"
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!
项目地址:https://github.com/coze-dev/coze-studio
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0