Agent自进化为什么是个伪命题

最近看了差评对 OpenClaw 团队 Josh 和 Michael 的专访，有一个问题特别有意思。

记者问："你们为什么不加个自进化功能？让 Agent 能自己学习、改进？"

Josh 的回答是："开源生态的好处就是大家各自探索，官方不想替社区做选择。"

Michael 的回答是："现在太早了，很多东西还在变，今天 work 的东西明天模型一更新就不 work 了。"

我反复读这两段回答，觉得特别有意思。

有意思的不是他们在说什么，而是他们没有说什么。

我干智能体开发这一年多，见过太多类似的回答了。问 Agent 为什么不做自进化，行业里的人都在绕。绕的方式不太一样，但本质上都在回避同一个问题：

不是不能，是不敢。

先说为什么"不能"。

我们今天搭的 Agent 框架，不管用什么技术栈，基本都是这个结构：

工具调用写死、记忆检索用 Top-K 召回、任务编排走 DAG、输出格式靠 JSON Schema、Prompt 模板是字符串拼接。

这套东西存在的意义是什么？

让 AI 不要乱来。

你花三个月搭的规则系统，每一行代码都在做同一件事：限制 AI 的自由度，把它按在你设计好的路径上跑。

这不是 Agent，这是约束器。

而自进化要求什么？要求你把自由度重新打开一点。让 Agent 自己决定用什么工具、怎么拆任务、记忆权重怎么调。

但你一打开自由度，你的规则系统就废了。

你一打开，AI 就有可能做错误决策。错了才能学，对吧？但错了就会出问题，你就得回头补规则。

最后你会发现，你在做一件很矛盾的事：同时要求一个系统既听话又能自己改规矩。

再说"不敢"的部分。

所谓"自进化"现在在做什么？

大多数产品演示的"自进化"，是这个流程：

Agent 执行任务 → 拿到执行记录 → 塞回上下文 → 修改 Prompt → 调整 Memory

然后它就"学会"了。

但你仔细想想，这改变了什么？

底层逻辑没变。你的工具调用还是写死的。你的 Top-K 召回还是那个算法。你的 DAG 还是那个拓扑结构。

大模型会演，但 Agent 框架不会。

这不叫自进化，这叫高阶版的 Prompt Engineering。你只是在上下文里塞了更多历史记录，让大模型表演"我好像学到东西了"。

真正的自进化是什么？是 Agent 框架层能基于历史数据，优化自己的决策策略。

但现在 Agent 框架的参数空间是什么？

工具调用 → if-else。记忆管理 → 余弦相似度。任务编排 → 写死的 DAG。Prompt 模板 → 字符串拼接。

这些东西是离散的、不可微的。你没法算梯度，没法做优化。强化学习想进来？先解决 Credit Assignment 再说——一个任务十几步工具调用，每步对最终结果贡献多少？你说得清楚吗？

说不清楚。Reward Signal 不知道从哪来。

所以最后大家都选择了一条路：假装在进化。

那为什么行业不直说呢？

我之前看到一句话，说的是段永平的不为清单。

他说，他成功的秘诀不是知道什么该做，而是知道什么不该做。游戏不做，感冒药不做，多元化不做。

知道不做什么，比知道做什么更重要。

Agent 框架也一样。

不做自进化，不是因为技术上做不到。而是因为一旦认真做自进化，你就得放弃 Agent 框架最核心的卖点——稳定可控。

你的用户买的是什么？是"我搭好规则，它按规矩跑，出问题我能修"。不是"它可能会变好，也可能变坏，反正我也不知道它怎么想的"。

这两件事在体验上是完全不同的。前者是工程产品，后者是实验品。

你见过哪个工程产品宣传自己是"可能变好也可能变坏的"？

Karpathy 前阵子说了一句话，我觉得特别准：

"2025 年或许是 Agent 的元年，但接下来的十年都将是 Agent 时代。"

什么意思？意思是现在 Agent 还不行，还得很长时间才能真正"雇来干活"。

但我后来想想，这句话反过来也成立：

正因为还需要十年，才说明这个方向是对的。

正因为现在的 Agent 还在"约束器"阶段，才说明真正的"自进化 Agent"还在前面等着。

我不是在否定 Agent 的价值。

我是在说，承认当前的局限性，比假装突破更有价值。

OpenClaw 为什么能火？不是因为它有多智能，而是因为它老老实实地承认：我是一个工具，一个可以控制的工具。用户愿意用，恰恰是因为它不会乱来。

那些天天喊自进化、天天宣传 Agent 会自己学习的产品，你去看看他们的用户留存——估计大部分都是来薅羊毛的，真正愿意把关键任务交给它的，没几个。

信任比智能更难建立。

回到开头的问题：OpenClaw 为什么不做自进化？

我现在觉得，Josh 和 Michael 的回答其实是诚实的。

"太早了"，是对的。

"不想替社区做选择"，也是对的。

只是还有一个原因他们没说出来：

他们比谁都清楚，一旦做了自进化，用户就不是在买工具了，而是在买不确定性。

而这个世界上，愿意为不确定性付钱的人，永远比愿意为确定性付钱的人少。

Table Of Content