前几天,国内一个朋友拿我开涮:“你们韩国现在是不是人均资产都翻了三倍?”他当然在开玩笑,但这个玩笑在韩国已经有了一整套民间叙事。

最出名的叫“传说中的海力士员工”。2008 年前后,公司里的人觉得买自家股票是疯了,他却拿 4,446 万韩元,以 7,800 韩元买下 5,700 股。如果一直没卖,到 2026 年 1 月已经值 41 亿韩元。

最近另一篇帖子又在韩国社区刷屏。发帖人自称来自 SK hynix 某设计团队,身边一半以上的人持有超过 1 亿韩元的公司股票,连入职两年的新人也过了亿。网友顺手把故事继续往下编:“2028 年新员工年薪 4 亿”,再配一张 AI 生成的“2026 年海力士停车场”——放眼望去,全是 Ferrari。

这些匿名帖子不能当财报,却很适合当情绪指标。当一个市场开始批量生产暴富传说,最赚钱的共识通常已经形成。

这个共识有名字:存储。SK hynix 从周期底部涨了三倍多,KOSPI 也一路刷新纪录。HBM 先被数据中心吃紧,DRAM 和 enterprise SSD 随后进入上行周期,SK hynix、Samsung、SanDisk 从周期股涨成 AI 交易的中心。到了这个位置,再证明“AI 需要更多存储”已经没有价值。真正有价值的问题是:从今天的价格出发,存储之后,聪明钱会流向哪里?

最顺手的答案是 Edge SoC、AI PC 和先进封装。数据中心先买 HBM,接下来几十亿台 PC、手机、汽车、机器人和眼镜开始跑模型,算力从云端下沉,资金沿产业链继续接力。这个故事好懂,也好卖。

可市场不会按产业链顺序发钱。

一台手机多 4GB 内存、加一颗 NPU,和 hyperscaler 新建几吉瓦的数据中心,根本不是同一笔生意。前者按十亿台计算,后者只有几十个客户;可一个客户的资本开支,就足以重写 GPU、HBM、网络、电力和冷却的收入曲线。把“端侧 AI 会普及”直接推导成“端侧会成为最大的 AI 利润池”,中间偷偷换了分母。

所以,接下来不能只看端侧。训练还在扩容,Cloud inference 正在工业化,AI PC 和 Edge device 也刚开始下沉。真正值得研究的,是 AI 算力如何从数据中心扩散到 PC、手机、汽车、机器人和眼镜,以及每一层究竟能留下多少收入、利润和自由现金流。

设备数量制造叙事,资本密度、定价权和供给瓶颈决定利润。

先把“整个 AI 市场”这个分母算对

“AI 市场”可以包含模型订阅、Cloud service、数据中心设备、半导体、手机和软件。如果把这些东西全塞进一个数字,端侧份额没有分析价值。本文讨论的是个人投资者最容易映射到上市公司的两块:AI 半导体与 AI 基础设施。

Omdia 对 Edge AI processor 的估算覆盖手机、PC、平板、机器人和无人机等十类设备,到 2028 年约 600 亿美元。另一份 Omdia 预测显示,数据中心 GPU 与 AI accelerator 在 2025 年已经达到约 2070 亿美元,2030 年约 2860 亿美元。

两份报告的口径和年份并不完全一致,不能拿来计算小数点后的精确份额。把它们做数量级拼接,结论已经很清楚:到 2028 年前后,端侧 AI processor 的价值量大致只有数据中心 AI processor 的五分之一;再把 HBM、网络、存储、电源、冷却和机房建设算进去,端侧在整个 AI 硬件收入池中的占比只能做区间判断,更可能落在 10%—20%,并且接近下沿。

另一个对比更直观。NVIDIA 最近一个季度的数据中心收入达到 752 亿美元,已经超过 Omdia 对 2028 年整个 Edge AI processor 市场的年度预测。IDC 预计 2026 年数据中心半导体收入约 4771 亿美元,而整个 Mobile semiconductor 市场约 898 亿美元。

口径依旧不完美,结论却不会反转:端侧可以拥有数十亿台设备,却未必拥有最大的利润池。如果把 Cloud AI service、模型订阅和企业软件也纳入“整个 AI 行业”,端侧硬件的收入占比还会更低。

维度 数据中心 AI AI PC、手机与 Edge device
设备数量 数十亿级
单机半导体价值 极高 数十到数百美元
当前收入可见度 已进入财报和订单 多数仍是配置渗透
主要驱动力 训练、推理、Agent workload 换机、隐私、低时延、持续感知
核心瓶颈 Accelerator、HBM、互连、电力 功耗、内存、软件、价格

设备数量决定想象空间,单机价值量和定价权决定利润。

AI 的三条增长曲线正在同时发生

把 AI 发展理解成“云端结束,端侧接棒”,会错过当前最重要的变化。训练还在扩容,推理正在工业化,端侧才刚开始下沉。这三条曲线会并行很多年。

训练扩容:最贵,也最集中

Frontier model 继续增加参数、数据和计算量,训练集群从万卡走向十万卡,利润集中在 GPU、HBM、先进封装、scale-up/scale-out 网络、电源和冷却。NVIDIA 与 SK hynix 是这条曲线最直接的受益者,TSMC、Broadcom、光互连和电力基础设施赚的是瓶颈钱。

这一层的优势是收入已经兑现,风险也最清楚:hyperscaler 的资本开支能否转化成 AI 收入和自由现金流。我之前在《一年烧 $700B,谁会是下一个摩托罗拉?》里讨论的,正是这条曲线的天花板。

推理扩容:从“算得出来”走向“算得起”

模型进入生产环境后,竞争指标从训练速度变成每个 token 的成本、延迟和稳定性。推理量可能远超训练量,硬件结构却会发生变化:更多 custom ASIC、更低精度计算、更复杂的 memory hierarchy,以及更高密度的网络连接。

Broadcom 和 Marvell 的 custom silicon 与 networking 收入正在加速,说明聪明钱暂时还没有离开数据中心。它只是在数据中心内部,从通用 GPU 向 ASIC、交换芯片、光互连、CXL 和电力系统扩散。

AI 第一阶段买算力,第二阶段买每瓦、每美元和每秒能交付多少有效 token。

推理下沉:把模型能力变成数十亿个高频入口

AI PC、手机、汽车、机器人、摄像头和眼镜会承接隐私敏感、低时延、持续感知和离线任务。复杂推理仍会回到云端,本地负责唤醒、个人上下文、传感器融合和轻量模型。

端侧因此会增加 NPU、LPDDR、NAND、传感器、电源管理和安全芯片的单机价值,也会制造新的软件入口。但它短期更像云端 AI 的分发层,收入取决于两个问题:用户是否真的高频使用,以及新增价值能否转化成更高 ASP 或更短换机周期。

存储的逻辑比原来更强,也更危险

把分母扩大到整个 AI 行业后,存储的上涨逻辑反而更扎实。今天的核心需求来自数据中心,端侧只是后续增量。

HBM 直接绑定 accelerator 出货和单卡容量,企业级 SSD 吃到训练数据、checkpoint、RAG 和推理缓存,普通 DRAM 与 NAND 又被 HBM 占用晶圆和资本开支间接抬价。即使手机和 PC 出货疲弱,AI 基础设施仍可能把存储维持在高景气区间。

这也意味着,判断存储空间不能只盯 AI 手机渗透率。

HBM 看结构,NAND 看周期

SK hynix 的核心变量是 HBM 份额、良率、客户认证和供给纪律。它赚的是数据中心 AI 的结构性增长,端侧 LPDDR 只是锦上添花。

Micron 同时暴露于 HBM、服务器 DRAM、数据中心 SSD 和 Client memory。在美股里,它比 SanDisk 更接近“整个 AI memory cycle”的映射。

SanDisk 的弹性主要来自 NAND 价格、enterprise SSD mix 和供给收缩。Edge device 增加存储容量会提供第二层需求,但 NAND 一旦恢复扩产,价格弹性也会最快反转。

Samsung 横跨 HBM、DRAM、NAND、Foundry、手机和 SoC,理论上拥有最完整的云端到端侧链条。现实里的收益取决于 HBM 追赶、先进制程利用率和终端竞争力能否同时兑现。

存储还有上升空间,赔率已经换了

后续空间取决于三件事:数据中心资本开支继续上修、HBM 与企业级 SSD 供给保持紧张、三大厂没有为了份额重新大规模扩产。端侧爆发能够延长周期,却很难在供给失控时拯救价格。

所以,存储仍可能继续创造利润新高,股票收益率却不再来自简单的估值修复。接下来赚的是供给纪律和盈利上修持续时间的钱。

存储景气的核心分母仍是数据中心,端侧负责把周期拉长,不负责独自启动下一轮。

存储之后,第一层机会仍藏在数据中心

市场很喜欢寻找“AI 的下一个板块”,好像资金必须离开已经上涨的东西,流向一块全新的地方。现实通常没有这么整齐。只要数据中心收入和订单仍在加速,新的利润池会先在同一个系统里出现。

Custom silicon 与网络

Hyperscaler 希望降低 token 成本、摆脱单一供应商,并针对自己的模型优化芯片。Custom ASIC 的份额会提高,但它不会减少对先进制程、HBM、封装和高速网络的需求。Broadcom、Marvell、TSMC、EDA/IP 和交换芯片因此处于同一条增长链上。

网络的重要性还会随集群规模上升。单颗 accelerator 再快,数据搬不动也没用。Scale-up、scale-out、光互连和 CXL 正从配角变成系统瓶颈。

这层机会的风险来自客户集中、估值和 hyperscaler 自研能力。订单很大,不代表利润会平均分配。

电力、散热与机房

当 AI 集群从芯片问题变成吉瓦问题,价值会继续向变压器、配电、UPS、液冷和热管理迁移。数据中心能否按时上线,越来越取决于电力接入和冷却,而不是芯片有没有出货。

这一层的好处是技术路线更分散:GPU、ASIC 谁赢,都要用电、配电和散热。风险在于资本开支周期、项目延迟和工业品估值扩张过快。

Foundry 与先进封装

无论 NVIDIA GPU、hyperscaler ASIC,还是 AI PC SoC,最终都要落到先进制程、chiplet 和封装。TSMC 同时吃到云端与端侧,最接近“无需押具体架构”的卖铲人。

Amkor 和 ASE 受益于封装复杂度提升,但商业模式资本密集,收入增长能否转化为每股自由现金流,需要继续看利用率和定价权。

Intel 也应该放在这张地图里。18A 已进入量产爬坡,18A-P 进入 risk production,14A 仍在 PDK 和客户 test chip 阶段;EMIB 与 Foveros 又提供先进封装能力。它拥有云端、AI PC、Foundry 和 Packaging 四重暴露,外部客户、良率、利用率和毛利率仍需逐项验证。

制程能跑通,只解决技术问题;客户愿意下单、产能能够赚钱,才解决投资问题。

风险收益比更好的位置,可能是“双重暴露”

纯数据中心公司拥有最强的当期增长,纯端侧公司拥有最大的远期弹性。对个人投资者更友好的位置,可能夹在两者之间:当前靠数据中心兑现收入,未来又能从 AI PC 和 Edge device 获得第二条曲线。

类型 当前现金流 端侧爆发后的增量 主要风险
数据中心核心 有限或间接 Capex、估值、客户集中
云端与端侧双重暴露 中到强 明显 执行、竞争、估值
纯端侧期权 弱到中 最大 应用、换机、价格敏感度
存储周期仓 强但波动大 有第二层需求 扩产、库存、价格反转

TSMC 同时制造 GPU、ASIC、手机和 PC SoC,还拥有先进封装;Arm 的 IP 覆盖服务器、PC、手机、汽车和 IoT;AMD 当前增长来自数据中心,又在 AI PC 与 Embedded 保留端侧入口;Micron 同时卖 HBM、服务器内存和 Client memory。这些公司不需要端侧明天爆发,端侧兑现后又能获得额外增长。

代价当然存在。Arm 的增长质量高,估值也会压缩未来收益率;AMD 要证明 accelerator 份额和软件生态;TSMC 面临地缘政治与资本密集度;Micron 仍逃不开存储周期。

Qualcomm、MediaTek 和其他 Client SoC 厂商更接近端侧纯期权。它们的上行弹性很大,前提是 NPU 从标配变成 ASP、毛利率和换机率。MediaTek 主挂牌台交所,不能把它当成普通美股标的;Qualcomm 的数据中心布局提供了新可能,利润表目前仍由手机、汽车和 IoT 决定。

Intel 的位置更特殊:它同时拥有双重暴露和高风险反转。成功时弹性巨大,失败时资本开支会继续吞噬现金流。

与其押端侧在哪一年爆发,不如先找云端继续扩张时能赚钱、端侧兑现时还能再长一层的公司。

端侧什么时候才从“配置”变成“利润”

AI PC 和 GenAI smartphone 的渗透率可以很快提高,因为新芯片会自然进入产品线。渗透率增长不代表新增销量,也不代表用户愿意支付溢价。

Gartner 曾预计 2026 年 AI PC 占 PC 出货量约 55%,今年初已有报道显示该预测下调到约 49%,原因包括高溢价、内存短缺和缺乏 must-have software。IDC 同时预计 2026 年 PC 出货下滑、ASP 大幅上升。硬件配置在普及,换机需求却没有同步爆发。

端侧进入利润表,需要四个信号同时出现:

  1. AI 功能的月活和任务完成率持续提高;
  2. 本地推理占比上升,云端 offload 不再覆盖大部分价值;
  3. NPU、内存和存储升级能够提高 ASP 与毛利率;
  4. AI 让用户提前换机,而不只是随正常换机获得新功能。

AI 眼镜、机器人和汽车还要再加一条:多设备协同必须形成新的购买行为,而不是把手机能力换一个屏幕展示。

AI 标签统计出货,任务成功率统计收入。

聪明钱应该按兑现顺序排队

股票排序不能看谁涨得少。涨幅只记录过去,未来收益率取决于新增自由现金流、兑现概率、当前估值和失败时的损失。

我会把研究顺序分成四层:

第一层:已经兑现的数据中心瓶颈

GPU、HBM、custom silicon、networking、电力与冷却拥有最清楚的订单和收入。行业增长相对清楚,真正难判断的是估值是否透支,以及资本开支何时见顶。

第二层:云端与端侧的双重暴露

Foundry、先进封装、Arm IP、同时覆盖 Data Center 与 Client 的处理器和内存,能够跨越三条增长曲线。它们通常不是弹性最大的交易,却可能提供更好的 risk-adjusted return。

第三层:端侧纯期权

Qualcomm、MediaTek、Client NPU、低功耗传感器、安全芯片和电源管理,需要等使用率、ASP 和换机周期给出证据。这一层最容易出现预期差,也最容易被发布会叙事骗进去。

第四层:按供给管理的周期仓

SK hynix、Micron、Samsung 和 SanDisk 不能只按“AI 长期增长”持有。HBM、DRAM、NAND 的供给、库存和资本开支一旦变化,仓位也要变化。

这套排序不会给出一只永远排第一的股票。Arm 的增长天花板、Broadcom 的当前兑现、TSMC 的平台地位、Qualcomm 的端侧弹性、Intel 的反转赔率,分别对应不同的胜率和赔率。

六个节点会让整套逻辑重新定价

Hyperscaler 的 AI 收入能否追上 Capex

数据中心是最大分母,也是最大风险源。一旦 AI 收入、利用率或自由现金流无法支撑资本开支,GPU、HBM、网络、光模块和电力设备会一起下修。端侧的长期故事救不了短期订单。

推理需求能否抵消模型效率提升

量化、蒸馏、稀疏化和 custom ASIC 会降低单次推理成本。成本下降可能压缩硬件需求,也可能触发 Jevons paradox,让 token 使用量增长得更快。决定结果的是总推理量,不是单个模型变小了多少。

Memory supply 何时真正释放

HBM 良率、新晶圆厂、先进封装和 NAND 扩产只要同时改善,存储价格就会先于需求转弱。这里要看 bit supply、客户库存、长约和 Capex,而不是等毛利率见顶。

Agent 是否跨过可靠性门槛

端侧真正需要的是常驻、个性化、跨应用执行。Agent 如果仍会在权限、支付、状态和错误恢复上掉链子,AI PC 和手机只完成配置升级,无法缩短换机周期。

云端与本地的经济账

Cloud inference 持续降价,会延长旧设备寿命;隐私、时延、网络和持续订阅成本则会推动任务下沉。最终架构由每个任务的总成本决定,不由发布会决定。

电力与地缘政治

电网接入、能源价格、出口限制、先进制程产能和区域补贴,都可能改变赢家。AI 越资本密集,政策变量越难忽略。

三种情景下,钱会流向不同位置

情景 产业路径 更受益的方向 主要受损方向
基准 数据中心继续扩张,推理增长快于训练,端侧随换机渗透 ASIC、网络、Foundry、封装、双重暴露 高估值纯叙事标的
乐观 Agent 带来海量推理,端侧出现杀手应用,多设备协同形成新需求 全链条,尤其 Edge SoC、Memory、传感器 只依赖旧流量入口的公司
受阻 Capex ROI 下滑,端侧缺乏付费意愿,存储供给释放 低成本平台、现金流强的基础设施 Memory beta、纯端侧期权、高杠杆扩产

基准情景下,数据中心仍是未来几年最大的 AI 利润池,推理基础设施是最清楚的第二条曲线,端侧提供长期可选性。乐观情景才会让手机、AI PC、眼镜和机器人同时贡献硬件增量。受阻情景里,端侧渗透率依旧可能提高,但它只会成为默认配置,不会创造新的超级周期。

存储之后,答案不在一个板块里

回到最初的问题:存储是否还有空间?有,核心驱动力仍是数据中心,端侧会增加持续时间和第二层需求;供给一旦释放,NAND 和普通 DRAM 的风险也会迅速暴露。

除了存储,第二梯队是谁?眼下最清楚的答案仍在数据中心内部:custom silicon、networking、光互连、电力、冷却、Foundry 和先进封装。端侧 SoC、AI PC 与 Edge device 是后续弹性更大的第三层。

从个人投资角度,风险收益比更值得研究的是双重暴露:今天能从云端 Capex 赚钱,明天又能吃到端侧下沉。它们未必涨得最猛,却不需要最脆弱的假设才能成立。

聪明钱真正寻找的,是下一道供给最难扩、需求最先兑现、价格又没有把未来全部买走的瓶颈。

当 token 从机房流向数十亿台设备,谁只能赚一次,谁能沿途收两遍钱?