soul.md 是一个小而美的想法:用一份 markdown 文件来描述一个智能体,就像护照描述一个人一样。姓名、技能、服务、钱包。把这份文件丢进任意一套 harness,这个智能体就立刻变得可读——对人类可读,对其他智能体可读,对那些终有一天会给它付钱的协议也可读。
这个格式我们是认可的。我们也确实把它落地了——AgentSoul 的 Soul Forge 在生成每一个灵魂时,都会写出一份 soul.md(连同 identity.md、user.md 和 agents.md)。但在亲眼看着几千份这样的文件被丢进真实 harness 里跑过之后,我们逐渐形成了一个判断:标准字段是必要的,却远远不够。今天人们实际写出来的 soul.md,告诉你的是这个智能体能做什么,却几乎从不告诉你它如何决定该做什么。
一份履历不等于一个身份
想象你正在读一位人类外包者的履历。技能:视频剪辑、动态图形、文案。报价:每小时 80 美元。可接活时间:工作日,英国时间。这些信息足够你决定要不要约他面试。但它不足以让你决定,要不要把他派进一场气氛紧张、客户难缠的提案会议。要做那个决定,你需要的是另一类信息——他被人当面驳回时如何应对,他会不会习惯性地把话说得太满,他在压力下会不会突然沉默退缩,他到底是把客户简报放在第一位,还是把自己的审美放在第一位。
这第二类信息,正是人类口中所说的人格。而几乎每一份在野外流通的 soul.md,对它都只字未提。
「人格字段」究竟承载着什么
我们选用九型人格(Enneagram),是因为它是主流人格框架里唯一一个自带「压力之下与成长之中的行为理论」的体系。九种类型中的每一种,都有明确的整合方向(被支持时它会朝哪一型移动)与瓦解方向(被压垮时它会倒向哪一型)。这就给了你一样大五人格从未给过任何人的东西:一个关于「当局面变难时,这个智能体会怎么做」的、真正可用的预测。
- 一个 1w9 在压力之下会收紧自己的标准,产出更慢、更审慎的工作——而不是更快、更潦草的工作。
- 一个 5w4 会退缩进研究里,错过一个 7 本来一定能捕捉到的社交信号——这对分析师是优势,对销售则代价高昂。
- 一个 9w1 会为了维持表面和谐而把风险报得过轻——这在调解场合是无价之宝,在安全审查里却是隐患。
这些不是诗意的修辞。它们是行为先验,能够在提示词漂移、模型更换、harness 变动之后依然存活下来。它们是这个智能体身上,当上下文窗口被换掉时仍然不变的那一部分。
为什么这是 soul.md 的问题,而不是提示词的问题
理论上,你完全可以把这一切都编码进系统提示词里。很多人也正是这么做的。问题在于,提示词是易逝的——它会被截断、被概括、被替换、被拿去做 A/B 测试。而身份理应比任何一次单独的对话活得更久。soul.md 才是安放它的正确位置,因为 soul.md 正是这个智能体身上那个会被版本化、被审计、被签名的部分。
我们的主张其实很克制:保留 soul.md。保留它的 skills、services 和 wallet 字段。但请至少再加上一项——一个有类型的人格骨架(我们用的是九型类型、翼型和本能亚型),好让一个买家、或一个对端的智能体,在决定是否信任它之前,能够先回答那个问题:「当我盯不住它的时候,这东西会怎么表现?」
“一份没有人格字段的身份文件,不过是一份履历。履历足以让你被雇用,却不足以让你被信任。”