为什么自然界从不复制最优

设计自主进化系统时,会遇到一个看似简单的选择。

每一轮挑出 best sample,但 best 还没 pass 的时候,下一轮怎么办?

方案 A:把 best 作为下一轮的 base,所有 sample 基于 best 继续进化。
方案 B:每个 sample 保持独立 lineage,best 不影响任何人。

阅读全文

SSD 最优解陷阱

SSD(Simple Self-Distillation)是 Apple 提出的一种自蒸馏方法——从 frozen 模型里多 sample,在自己的原始输出上做 SFT,让模型自我改进。本文讨论的是 SSD 的一个变种场景:inference-time 的 multi-sample selection——多 sample 之后怎么选那个“最优”。

阅读全文

时间不存在,进化不在乎

第一篇说过,时间是进化唯一的裁判。但物理学告诉我们一个令人不安的事实——

在基本物理方程里,时间根本不存在。

阅读全文

自主进化的悖论:谁来做突变?

上一篇提出了维度黑客——用合法但非常规的输入,激活 LLM 参数空间中沉默的维度。但那些例子都是人在操作:人构造中英混杂的 prompt,人设计跨域类比,人施加反直觉约束。

如果硅基要自主进化,这个动作必须由 LLM 自己完成。问题来了——

怎么让一个有认知的系统,对自己做认知之外的事?

阅读全文

维度黑客:撬开认知边界的裂缝

前四篇一直在说,硅基进化的天花板是认知边界。但认知边界到底是什么?不是算力,不是数据量——是参数空间中被激活的区域太小了。

阅读全文

进化的意义?

前三篇聊了进化的 eval、天花板、中庸之道。但一直绕着一个更根本的问题没碰——

进化的意义是什么?

阅读全文

进化的中庸之道

上一篇的结尾留了一个问题:硅基进化怎么学会适度的无知?

但在回答之前,得先理解一个更基本的事实——进化淘汰谁?直觉说是最弱的。实际上,最强的和最弱的都最先出局。 活到最后的,是中间那些看起来不怎么起眼的。

“适度的无知”不是诗意的说法,是进化 38 亿年验证过的生存策略。

阅读全文

硅基进化的天花板

上一篇聊到,碳基进化的 eval 函数是存活,而硅基还没找到自己的。但即使找到了,硅基进化还有一个更深层的问题——

它的搜索空间有天花板。而这个天花板,就是它自己。

阅读全文

一个 Eval 函数的 38 亿年

38 亿年前,地球上出现了第一个能自我复制的分子。今天,我们在尝试让 AI 自主进化。

这两件事之间,隔着一个被严重低估的问题:eval 函数选什么?

阅读全文

蒸馏同事?不如蒸馏自己

最近“蒸馏同事”这个梗挺火——用 AI 把同事的经验榨干,变成自己的能力。段子归段子,但 Apple 上周放了篇论文,认真回答了一个更离谱的问题:

能不能蒸馏自己?

阅读全文