Agent自进化为什么是个伪命题

从OpenClaw团队访谈出发,分析为什么Agent框架目前不敢做真正的自进化——不是技术做不到,而是一旦认真做,就得放弃'稳定可控'这个核心卖点。
2026-05-18
最近看了差评对 OpenClaw 团队 Josh 和 Michael 的专访,有一个问题特别有意思。
记者问:"你们为什么不加个自进化功能?让 Agent 能自己学习、改进?"
Josh 的回答是:"开源生态的好处就是大家各自探索,官方不想替社区做选择。"
Michael 的回答是:"现在太早了,很多东西还在变,今天 work 的东西明天模型一更新就不 work 了。"
我反复读这两段回答,觉得特别有意思。
有意思的不是他们在说什么,而是他们没有说什么。
我干智能体开发这一年多,见过太多类似的回答了。问 Agent 为什么不做自进化,行业里的人都在绕。绕的方式不太一样,但本质上都在回避同一个问题:
不是不能,是不敢。
先说为什么"不能"。
我们今天搭的 Agent 框架,不管用什么技术栈,基本都是这个结构:
工具调用写死、记忆检索用 Top-K 召回、任务编排走 DAG、输出格式靠 JSON Schema、Prompt 模板是字符串拼接。
这套东西存在的意义是什么?
让 AI 不要乱来。
你花三个月搭的规则系统,每一行代码都在做同一件事:限制 AI 的自由度,把它按在你设计好的路径上跑。
这不是 Agent,这是约束器。
而自进化要求什么?要求你把自由度重新打开一点。让 Agent 自己决定用什么工具、怎么拆任务、记忆权重怎么调。
但你一打开自由度,你的规则系统就废了。
你一打开,AI 就有可能做错误决策。错了才能学,对吧?但错了就会出问题,你就得回头补规则。
最后你会发现,你在做一件很矛盾的事:同时要求一个系统既听话又能自己改规矩。
再说"不敢"的部分。
所谓"自进化"现在在做什么?
大多数产品演示的"自进化",是这个流程:
Agent 执行任务 → 拿到执行记录 → 塞回上下文 → 修改 Prompt → 调整 Memory
然后它就"学会"了。
但你仔细想想,这改变了什么?
底层逻辑没变。你的工具调用还是写死的。你的 Top-K 召回还是那个算法。你的 DAG 还是那个拓扑结构。
大模型会演,但 Agent 框架不会。
这不叫自进化,这叫高阶版的 Prompt Engineering。你只是在上下文里塞了更多历史记录,让大模型表演"我好像学到东西了"。
真正的自进化是什么?是 Agent 框架层能基于历史数据,优化自己的决策策略。
但现在 Agent 框架的参数空间是什么?
工具调用 → if-else。记忆管理 → 余弦相似度。任务编排 → 写死的 DAG。Prompt 模板 → 字符串拼接。
这些东西是离散的、不可微的。你没法算梯度,没法做优化。强化学习想进来?先解决 Credit Assignment 再说——一个任务十几步工具调用,每步对最终结果贡献多少?你说得清楚吗?
说不清楚。Reward Signal 不知道从哪来。
所以最后大家都选择了一条路:假装在进化。
那为什么行业不直说呢?
我之前看到一句话,说的是段永平的不为清单。
他说,他成功的秘诀不是知道什么该做,而是知道什么不该做。游戏不做,感冒药不做,多元化不做。
知道不做什么,比知道做什么更重要。
Agent 框架也一样。
不做自进化,不是因为技术上做不到。而是因为一旦认真做自进化,你就得放弃 Agent 框架最核心的卖点——稳定可控。
你的用户买的是什么?是"我搭好规则,它按规矩跑,出问题我能修"。不是"它可能会变好,也可能变坏,反正我也不知道它怎么想的"。
这两件事在体验上是完全不同的。前者是工程产品,后者是实验品。
你见过哪个工程产品宣传自己是"可能变好也可能变坏的"?
Karpathy 前阵子说了一句话,我觉得特别准:
"2025 年或许是 Agent 的元年,但接下来的十年都将是 Agent 时代。"
什么意思?意思是现在 Agent 还不行,还得很长时间才能真正"雇来干活"。
但我后来想想,这句话反过来也成立:
正因为还需要十年,才说明这个方向是对的。
正因为现在的 Agent 还在"约束器"阶段,才说明真正的"自进化 Agent"还在前面等着。
我不是在否定 Agent 的价值。
我是在说,承认当前的局限性,比假装突破更有价值。
OpenClaw 为什么能火?不是因为它有多智能,而是因为它老老实实地承认:我是一个工具,一个可以控制的工具。用户愿意用,恰恰是因为它不会乱来。
那些天天喊自进化、天天宣传 Agent 会自己学习的产品,你去看看他们的用户留存——估计大部分都是来薅羊毛的,真正愿意把关键任务交给它的,没几个。
信任比智能更难建立。
回到开头的问题:OpenClaw 为什么不做自进化?
我现在觉得,Josh 和 Michael 的回答其实是诚实的。
"太早了",是对的。
"不想替社区做选择",也是对的。
只是还有一个原因他们没说出来:
他们比谁都清楚,一旦做了自进化,用户就不是在买工具了,而是在买不确定性。
而这个世界上,愿意为不确定性付钱的人,永远比愿意为确定性付钱的人少。