最近心血来潮折腾了一个月的Hermes,想做成一个高级的AI Agent。花费的时间里,80%都是在折腾各种配置,真正用Hermes干活的时间可能只有20%。这篇文章分享我调教Hermes遇到的坑和一些经验,以及Hermes能真正帮到我什么。或许我的经历能给你一些启发,帮你少走几步弯路。
配置篇
启动程序是第一道坎
Hermes 没有稳定的原生 Windows 版,必须在 Windows 的 Linux 子系统(WSL)里运行。这意味着得自己配 WSL 环境、装依赖、设环境变量。如果有其他AI Agent,比如Claude code,安装会比较简单,但如果没有,就很痛苦了。
装好之后,作为一个Windows老用户,我最喜欢的启动方案是双击一个东西。但Hermes没有,所以得自己做一个。听起来不难,写个bat脚本,把启动命令行封装进去。但最大的问题是Windows和WSL之间的跨环境交互,经常出bug。有了启动按钮,最好还有一个关闭按钮,也会遇到同样的问题。我试图做一个关闭+启动的重启按钮,问题就更多了。每次都需要让Claude code帮我修复半天。有时今天能用的东西,第二天又不能用了。
重启的主要目的是为了让Hermes在修改完配置后重启生效。那么是否可能让Hermes自己重启呢?很可惜,没有这个原生功能。我试图让Hermes调用已有的重启脚本,但每次一重启,Hermes的进程就被杀掉,Hermes根本不记得自己运行了什么,也不知道自己又活了。于是我又做了一个Hermes重启脚本,让Hermes知道自己正在重启,并且重启后还能收到一条消息,让它继续工作。
思路很简单,真正麻烦的是让工具能够稳定运行。我遇到过重启成功但对话丢失、显示重启失败但实际上成功、显示重启成功但实际没重启等等,每个问题都不致命,因为有Claude code救场,但每个都要花时间排查。
和重启类似的事情还有很多:环境变量、API Key 管理、MCP 工具注册、网络代理配置。单独拎出来都不是大事,但堆在一起就是一道不低的门槛,有时候搞得人心烦,想一键删除算了。
记忆系统的理想与现实
Hermes 宣传"自我进化"——它设计了一套多层记忆框架(Memory、User、Soul、Skill、Agents),让 AI 能不断学习和沉淀。这个概念很吸引人,但实际用下来的感觉是:AI 并不知道什么东西该记在哪里。它看到什么都想往 Memory 里塞,skill又乱写各种杂项,高级的框架基本用不起来。
解决办法比较朴素:我自己写了一个 Skill,专门告诉 AI 哪些信息存到哪个层级。等于手动给这个"自我进化"系统打了一个补丁。
后来还基于这个 Skill 做了一个定时任务——每天凌晨 3 点自动整理记忆,类似openclaw的"做梦机制",把memory这些记忆文件都整理归档,该删的删,该合的合。效果说不上惊艳,但至少比放着不管要好。
Hermes 与 Claude Code 的分工
用了一段时间后,我发现 Hermes 在处理日常事务和统筹调度上很好用,但写复杂代码的能力不如专用工具。于是我灵机一动:能不能让Hermes调用claude code写代码呢?
听起来是一个多Agent协调的典型案例,项目经理 + 技术专家的模式。但落地很不顺。Hermes运行在WSL,Claude Code运行在Windows,直接用命令行经常会出错。为了让 Hermes 能方便地调用 Claude Code,我专门做了一个桥接工具,想让Hermes能稳定调用,但实践效果也很差,命令行会出的bug,包装为脚本一点也不会少:上下文丢失、消息发不出去、发出去收不回来、任务运行超时。每次都搞半天。最后还是回到朴素的方案:本地文档通信。Hermes先把任务要求写到本地md文档,然后一条命令行让CC读取文档,完成工作后CC再写一个文档回复,Hermes定时检查有没有文档出来。
双电脑同步:失败的尝试
我在家里和公司办公室各有一台电脑,于是很自然的想法就是把两台电脑的Hermes配置同步,这样就只用调教一遍。
两台电脑共用一套配置,听起来很合理。我尝试了用云盘同步文件夹来实现,结果遇到了三层问题。
第一层,Hermes 的配置文件默认不在同步目录里,需要用软链接把它们链过去。软链接本身就是一重不确定性——路径跳转后很多Hermes原生工具没法使用,比如更新记忆、更新skill。需要先找到软连接指向的文件,再直接修改底层文件。
第二层,同步目录里放了启动脚本、重启工具、Claude Code 的桥接脚本。但这些脚本依赖的路径和环境在两台电脑上不完全相同——目录结构、网络配置、环境变量都有差异。同一个文件要适配两台机器,每次修改都得小心翼翼。
折腾了一圈之后,我基本放弃了同步方案。两台电脑各自装在默认位置,只建了一个共享文件夹放一些不依赖环境的文档。两台 Hermes 通过共享目录写 Markdown 文件来通信,反而比同步方案稳定得多。
接入个人知识库
我平时做的投资研究、写的小说、收藏的文章等都会存到思源笔记里,积累下来已经有几百万字。Hermes内置的记忆体系只能记住非常有限的东西,显然不可能把这些东西都塞进Hermes。
很自然的,就想把我的思源笔记作为知识库开放给Hermes,它需要的时候按需读取、编辑修改。但思源笔记的底层数据格式很特殊,AI无法直接读取、修改,只能通过思源提供的API接口。但API有上百个,直接暴露出去,AI得晕死。但搜了一圈没看到现成的MCP工具,于是开始了自己造轮子的旅程。
借助Codex的帮助,第一版MCP半个下午就做出来了,叫做思源桥,最开始只有读取功能,花了几天时间完善,预期是让AI能像写代码那样自然的读写笔记,但实测下来,读取功能还行,编辑和写入功能就非常不稳定,经常失败。后来看到有人写了类似的MCP工具,叫做siyuan sisyphus,比我的好用些,于是就放弃了思源桥,去给sisyphus提PR了。
但受制于思源本身的限制,sisyphus也不太好用,编辑和修改功能也经常出错,效果一般。现在还在探索Obsidian是否有可能成为AI和人类的共同知识库载体,欢迎催更后续。
场景篇
如果只有上面的那些东西,Hermes对我而言就只是一个大玩具,除了好玩之外没什么价值。但这怎么能行呢。于是开始寻找自己工作和生活里能够用得上Hermes的场景。还确实有一些立刻就能用的:
深度研究报告
作为投资研究员,我经常需要就一个话题进行兼具深度和广度的研究分析。最开始是用搜索引擎,GPT出来后开始用网页版GPT,现在开始逐渐转向Hermes。用 Hermes 做这件事最大的好处是:它记得上下文。不是那种"同一轮对话里记得"的上下文,而是"你上周聊过一个什么方向、关注过什么信息"的长期记忆。我可以和它反复讨论同一件事,每次都能从上次结束的地方接上。
虽然效果没有想象的好,但主动提醒它看文档看资料,AI也能够大致跟上。并且Hermes可以接入很多MCP,所以能直接读取我最新的报告,并做一些简单的知识库维护。能接入不同的搜索引擎,获取更丰富的资料。甚至还能写个简单的脚本做财务建模。
相比之下,网页版AI就差很多了。记忆体系单薄,工具调用受限,每次更新都得重发一遍才行。想要操作本地电脑的其他文件?根本没机会。
个人网站维护
我蛮早以前一时兴起,见了个人网站,但建起来后就没什么动力去维护了。因为发布的过程太麻烦:写好文章之后要整理为markdown格式,复制到指定目录,还需要调格式、处理图片路径、commit 发布等等,感觉比直接发微信公众号麻烦很多。于是网站就基本荒废了。
但Hermes可以把我在思源笔记里写好的东西导出为文档,完成剩余的所有工作。发布流程变成了一句话的事。网站需要做些细微的调节,也可以不用专门坐到电脑前,直接手机发个消息就可以。
持续对话与共享知识库
Hermes 的一个独特优势是"持续在线"。我可以通过手机飞书、电脑飞书随时和它交流,不需要每次重新解释我是谁、在做什么。
它还有一个很大的缺点变成了优点:Hermes 没有自己的知识库,所以我让它直接使用我电脑上的思源笔记作为共享知识库。我平时写的笔记、记录的想法、积累的资料,它都能读取和引用。等于我和它共享同一个知识体系。这一点用久了不觉得特别,但换回网页版 AI 的时候,落差感非常明显。
网页版没有我的知识库,所以想让它读什么东西都得自己手动发,而讨论了一个小时后,成果也只是散落在聊天记录里,没有任何形式的总结,自己也看不到。
最后
这段时间用下来,我最深的感受是:现在各类AI Agent都还处在相当早期的探索阶段。从"大玩具"到"小助理"还有很长的路要走。现在想要用起来,需要愿意折腾、愿意自己打补丁、愿意接受一些不稳定。
不过AI的发展也同样迅速,也许明年,后年,市场上就会出现完全不同的东西,到时候可能也不再需要折腾,开箱即用,稳定可靠,聪明懂你。
但折腾了这么久的AI,发现最重要的仍然是场景。能不能找到一个让AI干活、创造价值的场景,满足自己真实的需求。对我来说,能让我有动力去维护个人网站、能和一个 AI 持续讨论深度话题、能让我写的笔记在对话中被利用起来——这些就是它真正的价值所在。