从 LLM 到高效沟通
最近在给儿子讲 LLM 的工作原理,做了一套 PPT 。讲到 context window 的时候,我随手举了个例子:
同样是调用 Claude API 写代码,Cursor 做成了估值百亿的产品,而无数“套壳”应用悄无声息地死掉了。区别在哪?
这个问题让我想到一个更古老的类比。
前段时间,儿子问我:“爸爸,ChatGPT 是怎么知道该说什么的?”
我决定认真回答这个问题。不是敷衍一句“它很聪明”,而是真的把 LLM 的原理拆给他看。于是做了一套 PPT —— LLM for Kids,从 Token、Embedding 一路讲到 Attention、Transformer,用“小猫坐在垫子上”当例句,用“成绩单”和“画饼图”当类比。
连续半个月高强度使用 AI 之后,原本睡觉不怎么做梦的我,开始每天晚上梦见自己在和 AI 对话。不是偶尔一次,是连续好多天,从未间断。意识到这件事的时候,第一反应是:我的大脑是不是在不知不觉中被 AI 侵入了?后来查了一下,发现这并不是个例,而且有一个更专业的说法 — 俄罗斯方块效应(Tetris Effect)。
自从充了 Claude MAX 会员,每天跟 Claude 聊的比跟我老婆聊的都多。
经过了这么多天的切磋,脑子里又冒出来一个大胆的想法——AI 对我到底有多了解?
当我们对一件事有了立场,就会不自觉地用对这个立场有利的证据来强化它,而忽略事实本身。这不是什么新发现——心理学把它叫 confirmation bias。
有意思的是,LLM 也会这样。
最近被邀请去帮其他部门面试。题目一看,还是熟悉的配方:两轮 coding、一轮 design、一轮 leadership principle。
Zoom 里,candidate 正在共享屏幕手写 LRU Cache,我脑子里却在想另一件事:这个人如果入职了,他每天的工作有多少跟眼前这道题有关系?
昨天我做了一个小实验:让 Claude 和 Gemini 围绕“谁是最好的 AI”这个话题自由辩论。
为了实现这个实验,我写了一个叫 Agora 的小工具。它的原理很简单——用 Puppeteer 同时打开两个浏览器窗口,一个登录 Claude,一个登录 Gemini,然后自动把一方的回复喂给另一方,让它们来回对话。就像古希腊的 Agora(广场)一样,给两个 AI 一个公开辩论的场所。
Alphabet 刚发了一支百年债券。
没错,100 年。上一次科技公司干这件事,还是 1997 年的摩托罗拉——那也是摩托罗拉最后一年被认为是“大公司”。Michael Burry 立刻在 X 上发了一条警告,暗示 Google 可能在重蹈覆辙。