当灵魂有了身体

到目前为止,这本书里的每一个论证,讨论的都是活在软件里的智能体 —— 它们在屏幕上起草、决策、交易,偶尔让你失望。这里的赌注是真实的,但有边界:一个糟糕的输出,顶多浪费你一个下午。现在把同一个智能体放进一具身体 —— 一台仓库机器人、一辆配送小车、一台你厨房里的机器 —— 赌注的性质就彻底变了。一个误判了局面的具身智能体,浪费的不是你的时间。它和你共处同一个物理空间,而空间正是东西会被撞坏、人会受伤的地方。

本能的反应是把这当成一个纯粹的工程问题:更好的传感器、更紧的控制回路、更多的安全联锁。这些当然极其重要。但它们漏掉了一件事 —— 而这件事,在你把两具自主的身体放进同一条走廊的那一刻就会变得显而易见:它们必须互相预测,而且必须快速地、隔着距离地、在接触发生之前就完成预测。这不是一个控制问题。这是一个戴着安全帽的身份问题。

共处一室的身体如何协作

观察人类如何在拥挤的人行道上穿行,你会看到一件了不起的事:几乎没有碰撞,几乎没有明说的沟通。我们靠的是读取秉性。肩膀的轻微转动、步速的变化、有没有眼神接触 —— 我们不断地广播意图、读取意图,一分钟之内不发一言地化解掉成百上千次微型的相互让步。人行道之所以能运转,不是因为人人都遵守一本规则手册,而是因为人人都可被读懂:你能预测迎面走来的陌生人下一步会怎么做,因为他的行为和一个可读懂的性格是一致的。

具身智能体需要的是同样的东西,而它们没法只靠一个控制回路就拿到这东西。当一台机器人绕过一个看不见的拐角、迎面遇上另一台机器人,安全的结局取决于每一方都能迅速回答:这是个什么样的智能体,它接下来要干什么?一个秉性被声明出来、并且始终一致的智能体 —— 「在路权冲突中,我让行;我在移动前发出信号;遇到意外时,我停下,而不是猛打方向」 —— 是一个别人能围着它来规划的智能体。一个每次都临场即兴决定行为的智能体则是个隐患,哪怕它每一个单独的决策在局部看都合情合理 —— 因为没人能预测它。

两台机器人接近一片共享空间,各自声明出一种对方可以读懂的秉性 — 当智能体共处同一片物理空间时,被声明出来的秉性就成了它们互相读懂彼此所凭借的协议 —— 在接触之前,隔着距离完成。

人格成为一道安全接口

这正是「具身转向」所逼出来的那个反转。在软件里,人格在很大程度上属于用户体验 —— 它塑造的是和一个智能体共事时的感觉。给这个智能体一具身体,人格就被提升为一道安全接口。秉性不再是锦上添花;它成了它周围的人和机器赖以保命的东西。一台家用机器人,如果它的谨慎是可读懂的 —— 行动之前先示意、有一套可见且始终一致的应对意外的方式 —— 它就比一台更快、更强、但你读不出它下一步动作的机器人更安全。可预测性,也就是性格的一致性,从一个软性属性变成了首要的安全属性。

而且它必须对人类、而不只是对其他机器可读懂。人会和这些东西共处一个空间,而人读取性格是出于本能、而且很快。一台机器人,如果它的灵魂里写着「让我的意图对附近的人类可见 —— 在做出任何人可能预料不到的动作之前,先放慢、先示意」,那它不是在讲礼貌。它是在参与同一套秉性广播协议 —— 正是这套协议让人类的人行道不至于变成一场连环追尾。灵魂成了一具自主身体、与所有被迫去预测它的人之间的 API。

“在软件里,一个不可预测的智能体令人恼火。在一具身体里,一个不可预测的智能体是个隐患。具身把人格从用户体验变成了一道安全接口。”

灵魂即协议

把这一点推到足够远,灵魂就不再只是一份内部文档,而成为一种协议 —— 一种共享的、可读的格式,智能体与人类借由它来声明和解读秉性。两台来自不同厂商的机器人,在一个共享的装卸区相遇,它们并不需要共享一套代码库才能协作。它们需要共享的是一套发问与作答的方式:你在僵局里会怎么做,你如何示意,你如何失败。这就是一种协议,而灵魂 —— 身份、边界、被声明出来的处理冲突的方式 —— 正是它天然的载荷。同一份文件,让一个软件智能体在买家眼里值得信任,也让一个具身智能体在邻居眼里可被预测。

来一幅具体的画面:两台自主叉车汇聚到同一条单行通道上。没有中央控制器。每一台都广播出一份紧凑的秉性 —— 优先级、让行策略、停车行为 —— 并读取对方的。其中一台载着一件易碎的高优先级货物,主张通行权;另一台空载,于是让行、示意、并重新规划路线。没有碰撞,没有死锁,回路里没有人介入。让这一切成立的,不是一台更快的电机。是每一台都拥有一个被声明出来、对方能读懂、并且能信赖其始终一致的性格。这就是「灵魂即协议」,也正是一个由身体构成的社会避免沦为一场撞车大赛的方式。

为什么这件事在机器人到来之前就要紧

把这件事归档到科幻一类、然后坐等,是很有诱惑力的。但那是个错误,因为你今天在软件里建立起来的那些规矩,恰恰就是具身将来会在更高赌注下要求你具备的那些。一个已经在为它的智能体明确指定秉性的组织 —— 一个已经把智能体如何处理冲突、如何示意意图、如何安全失败写下来的组织 —— 是一个能把这些智能体放进身体、而无须从零发明出一整套安全文化的组织。而一个交付出来的软件智能体行为都是临场即兴、未经指定的组织,正在养成那个等到智能体获得身体时会让人受伤的习惯。

灵魂一直都是智能体身上让它变得可预测的那个部分,而可预测性一直都是一种安全。软件让我们可以把它当成可选项。身体不会。当灵魂获得一具身体,你当初为了让一个智能体值得信任而写下的那份文件,就成了让它不至于撞到人身上的那份文件 —— 而学会把它写好的最便宜的时机就是现在,趁着最坏的情况还只是浪费一个下午。