调教Hermes：从大玩具到小助理

最近心血来潮折腾了一个月的Hermes，想做成一个高级的AI Agent。花费的时间里，80%都是在折腾各种配置，真正用Hermes干活的时间可能只有20%。这篇文章分享我调教Hermes遇到的坑和一些经验，以及Hermes能真正帮到我什么。或许我的经历能给你一些启发，帮你少走几步弯路。

配置篇

启动程序是第一道坎

Hermes 没有稳定的原生 Windows 版，必须在 Windows 的 Linux 子系统（WSL）里运行。这意味着得自己配 WSL 环境、装依赖、设环境变量。如果有其他AI Agent，比如Claude code，安装会比较简单，但如果没有，就很痛苦了。

装好之后，作为一个Windows老用户，我最喜欢的启动方案是双击一个东西。但Hermes没有，所以得自己做一个。听起来不难，写个bat脚本，把启动命令行封装进去。但最大的问题是Windows和WSL之间的跨环境交互，经常出bug。有了启动按钮，最好还有一个关闭按钮，也会遇到同样的问题。我试图做一个关闭+启动的重启按钮，问题就更多了。每次都需要让Claude code帮我修复半天。有时今天能用的东西，第二天又不能用了。

重启的主要目的是为了让Hermes在修改完配置后重启生效。那么是否可能让Hermes自己重启呢？很可惜，没有这个原生功能。我试图让Hermes调用已有的重启脚本，但每次一重启，Hermes的进程就被杀掉，Hermes根本不记得自己运行了什么，也不知道自己又活了。于是我又做了一个Hermes重启脚本，让Hermes知道自己正在重启，并且重启后还能收到一条消息，让它继续工作。

思路很简单，真正麻烦的是让工具能够稳定运行。我遇到过重启成功但对话丢失、显示重启失败但实际上成功、显示重启成功但实际没重启等等，每个问题都不致命，因为有Claude code救场，但每个都要花时间排查。

和重启类似的事情还有很多：环境变量、API Key 管理、MCP 工具注册、网络代理配置。单独拎出来都不是大事，但堆在一起就是一道不低的门槛，有时候搞得人心烦，想一键删除算了。

记忆系统的理想与现实

Hermes 宣传"自我进化"——它设计了一套多层记忆框架（Memory、User、Soul、Skill、Agents），让 AI 能不断学习和沉淀。这个概念很吸引人，但实际用下来的感觉是：AI 并不知道什么东西该记在哪里。它看到什么都想往 Memory 里塞，skill又乱写各种杂项，高级的框架基本用不起来。

解决办法比较朴素：我自己写了一个 Skill，专门告诉 AI 哪些信息存到哪个层级。等于手动给这个"自我进化"系统打了一个补丁。

后来还基于这个 Skill 做了一个定时任务——每天凌晨 3 点自动整理记忆，类似openclaw的"做梦机制"，把memory这些记忆文件都整理归档，该删的删，该合的合。效果说不上惊艳，但至少比放着不管要好。

Hermes 与 Claude Code 的分工

用了一段时间后，我发现 Hermes 在处理日常事务和统筹调度上很好用，但写复杂代码的能力不如专用工具。于是我灵机一动：能不能让Hermes调用claude code写代码呢？

听起来是一个多Agent协调的典型案例，项目经理 + 技术专家的模式。但落地很不顺。Hermes运行在WSL，Claude Code运行在Windows，直接用命令行经常会出错。为了让 Hermes 能方便地调用 Claude Code，我专门做了一个桥接工具，想让Hermes能稳定调用，但实践效果也很差，命令行会出的bug，包装为脚本一点也不会少：上下文丢失、消息发不出去、发出去收不回来、任务运行超时。每次都搞半天。最后还是回到朴素的方案：本地文档通信。Hermes先把任务要求写到本地md文档，然后一条命令行让CC读取文档，完成工作后CC再写一个文档回复，Hermes定时检查有没有文档出来。

双电脑同步：失败的尝试

我在家里和公司办公室各有一台电脑，于是很自然的想法就是把两台电脑的Hermes配置同步，这样就只用调教一遍。

两台电脑共用一套配置，听起来很合理。我尝试了用云盘同步文件夹来实现，结果遇到了三层问题。

第一层，Hermes 的配置文件默认不在同步目录里，需要用软链接把它们链过去。软链接本身就是一重不确定性——路径跳转后很多Hermes原生工具没法使用，比如更新记忆、更新skill。需要先找到软连接指向的文件，再直接修改底层文件。

第二层，同步目录里放了启动脚本、重启工具、Claude Code 的桥接脚本。但这些脚本依赖的路径和环境在两台电脑上不完全相同——目录结构、网络配置、环境变量都有差异。同一个文件要适配两台机器，每次修改都得小心翼翼。

折腾了一圈之后，我基本放弃了同步方案。两台电脑各自装在默认位置，只建了一个共享文件夹放一些不依赖环境的文档。两台 Hermes 通过共享目录写 Markdown 文件来通信，反而比同步方案稳定得多。

接入个人知识库

我平时做的投资研究、写的小说、收藏的文章等都会存到思源笔记里，积累下来已经有几百万字。Hermes内置的记忆体系只能记住非常有限的东西，显然不可能把这些东西都塞进Hermes。

很自然的，就想把我的思源笔记作为知识库开放给Hermes，它需要的时候按需读取、编辑修改。但思源笔记的底层数据格式很特殊，AI无法直接读取、修改，只能通过思源提供的API接口。但API有上百个，直接暴露出去，AI得晕死。但搜了一圈没看到现成的MCP工具，于是开始了自己造轮子的旅程。

借助Codex的帮助，第一版MCP半个下午就做出来了，叫做思源桥，最开始只有读取功能，花了几天时间完善，预期是让AI能像写代码那样自然的读写笔记，但实测下来，读取功能还行，编辑和写入功能就非常不稳定，经常失败。后来看到有人写了类似的MCP工具，叫做siyuan sisyphus，比我的好用些，于是就放弃了思源桥，去给sisyphus提PR了。

但受制于思源本身的限制，sisyphus也不太好用，编辑和修改功能也经常出错，效果一般。现在还在探索Obsidian是否有可能成为AI和人类的共同知识库载体，欢迎催更后续。

场景篇

如果只有上面的那些东西，Hermes对我而言就只是一个大玩具，除了好玩之外没什么价值。但这怎么能行呢。于是开始寻找自己工作和生活里能够用得上Hermes的场景。还确实有一些立刻就能用的：

深度研究报告

作为投资研究员，我经常需要就一个话题进行兼具深度和广度的研究分析。最开始是用搜索引擎，GPT出来后开始用网页版GPT，现在开始逐渐转向Hermes。用 Hermes 做这件事最大的好处是：它记得上下文。不是那种"同一轮对话里记得"的上下文，而是"你上周聊过一个什么方向、关注过什么信息"的长期记忆。我可以和它反复讨论同一件事，每次都能从上次结束的地方接上。

虽然效果没有想象的好，但主动提醒它看文档看资料，AI也能够大致跟上。并且Hermes可以接入很多MCP，所以能直接读取我最新的报告，并做一些简单的知识库维护。能接入不同的搜索引擎，获取更丰富的资料。甚至还能写个简单的脚本做财务建模。

相比之下，网页版AI就差很多了。记忆体系单薄，工具调用受限，每次更新都得重发一遍才行。想要操作本地电脑的其他文件？根本没机会。

个人网站维护

我蛮早以前一时兴起，见了个人网站，但建起来后就没什么动力去维护了。因为发布的过程太麻烦：写好文章之后要整理为markdown格式，复制到指定目录，还需要调格式、处理图片路径、commit 发布等等，感觉比直接发微信公众号麻烦很多。于是网站就基本荒废了。

但Hermes可以把我在思源笔记里写好的东西导出为文档，完成剩余的所有工作。发布流程变成了一句话的事。网站需要做些细微的调节，也可以不用专门坐到电脑前，直接手机发个消息就可以。

持续对话与共享知识库

Hermes 的一个独特优势是"持续在线"。我可以通过手机飞书、电脑飞书随时和它交流，不需要每次重新解释我是谁、在做什么。

它还有一个很大的缺点变成了优点：Hermes 没有自己的知识库，所以我让它直接使用我电脑上的思源笔记作为共享知识库。我平时写的笔记、记录的想法、积累的资料，它都能读取和引用。等于我和它共享同一个知识体系。这一点用久了不觉得特别，但换回网页版 AI 的时候，落差感非常明显。

网页版没有我的知识库，所以想让它读什么东西都得自己手动发，而讨论了一个小时后，成果也只是散落在聊天记录里，没有任何形式的总结，自己也看不到。

最后

这段时间用下来，我最深的感受是：现在各类AI Agent都还处在相当早期的探索阶段。从"大玩具"到"小助理"还有很长的路要走。现在想要用起来，需要愿意折腾、愿意自己打补丁、愿意接受一些不稳定。

不过AI的发展也同样迅速，也许明年，后年，市场上就会出现完全不同的东西，到时候可能也不再需要折腾，开箱即用，稳定可靠，聪明懂你。

但折腾了这么久的AI，发现最重要的仍然是场景。能不能找到一个让AI干活、创造价值的场景，满足自己真实的需求。对我来说，能让我有动力去维护个人网站、能和一个 AI 持续讨论深度话题、能让我写的笔记在对话中被利用起来——这些就是它真正的价值所在。

‍