求是缘半导体周要闻－莫大康(2026.3.30)

江苏芯缘半导体有限公司

Jiangsu Thankyou Semiconductor Co.,Ltd.

新闻动态

NEWS

求是缘半导体周要闻－莫大康(2026.3.30)

来源: | 作者:芯缘 | 发布时间: 2026-03-31 | 72 次浏览 | 🔊 点击朗读正文 ❚❚ ▶ | 分享到:

AI芯片十年路线图

英伟达谷歌联合多所大学在2026年3月发布的《10-Year Roadmap for AI + Hardware》（AI+硬件十年路线图）。核心是AI与硬件协同设计、能效优先、全栈突破、十年千倍效率目标。

核心定位与目标

定位：AI与硬件协同演进的十年战略蓝图，解决当前“算法适配旧硬件、硬件跟不上新模型”的割裂问题。

训练/推理效率提升1000倍

构建节能、自优化、云端-边缘-物理AI无缝协同的系统

普及先进AI基础设施，兼顾公平与可持续

四大核心技术方向

芯片架构革命（以内存为中心）

存内计算（PIM）：计算单元嵌入内存，减少数据搬运，大幅提效降功耗

3D堆叠+近存计算：HBM4e、3D芯片堆叠、小芯片（Chiplet）异构集成

专用架构：GPU/TPU/NPU/模拟AI/光子/神经形态处理器多元并行

2. 互联与系统：光互联+超大规模集群

光互联（硅光）：替代电互联，带宽400Tb/s+，解决通信瓶颈

超大规模扩展：NVLink 576光互联，支持百万级GPU集群，支撑AGI训练

液冷+高密度机架：GB200 NVL72、Rubin平台等机架级液冷方案

3. 算法-硬件协同设计（全栈优化）

大小模型共生：云端大模型做“教师”，边缘小模型轻量化推理，端云协同

自改进系统+去中心化AI代理：硬件自适应优化、多智能体协同

训练-推理统一架构：消除训练与推理的硬件鸿沟，统一优化路径

4. 可持续与普惠

极致能效：从芯片到数据中心全链路降功耗，解决AI能耗不可持续问题

公平获取：开放基础设施、降低门槛、培养跨学科人才

以人为本：安全、隐私、伦理嵌入硬件设计

分阶段路线（2026–2036）

短期（1–3年）：Blackwell→Rubin架构落地；光互联商用；端云协同优化

中期（4–7年）：存内计算规模化；3D集成成熟；自优化系统部署

长期（8–10年）：光子/神经形态计算突破；千倍效率达成；AGI级基础设施就绪

2026年半导体涨价已成常态，谁在狂欢？谁在承压？

它的特征，可以用三个关键词来概括：

第一，涨价常态化。

涨价已从存储芯片，迅速向功率器件、模拟芯片、代工、封测全产业链蔓延。过去“等一等就降价”的逻辑，彻底失效。

第二，结构性供需失衡。

AI的算力需求，像一个巨大的黑洞，正在抽干先进存储和高性能芯片的产能。而成熟制程、传统终端——手机、PC、物联网——正面临严重的供给真空。

第三，竞争逻辑重构。

单纯的价格战已无以为继。未来两年的核心博弈，不再是成本竞争，而是供应链的掌控力，是与上游生态资源的深度绑定。

从2026年到2028年，只有那些能提前识别拐点、果断锁定产能、构建韧性体系的企业，才能在这场“AI虹吸”中，立于不败之地。

在AI需求的强势牵引下，价格预期被不断打破。

市场研究机构TrendForce的数据显示：2026年第一季度常规DRAM合约价涨幅，从年初的55%至60%，一路上修至90%至95%；NAND Flash合约价涨幅也从33%至38%上调至55%至60%。更令人震撼的是现货市场的表现：过去一年里，部分DRAM涨幅达386%，NAND涨幅达207%。

一场"局部的繁荣" 谁是赢家？

虽然涨价潮覆盖全行业，但这并非一场普惠的繁荣，而是一场“局部的狂欢”，行业分化正在加剧。

涨价赢家是以AI核心算力、先进存储、先进封装为代表的头部企业。它们正处于“超级繁荣期”，拥有绝对定价权，需求确定性极高，能够将成本顺畅传导。

而涨价受害者则是面向传统消费电子的部分模拟芯片、部分功率器件厂商。它们不仅面临成本暴涨，还要应对传统消费电子复苏缓慢带来的需求不确定性。对于这些企业而言，涨价更多是无奈之举，利润空间遭到两头挤压。

只要AI的军备竞赛不停止，芯片的高景气度将成为一种常态。科技巨头2026年资本开支指引显著上修：Meta预计1150～1350亿美元，谷歌1750～1850亿美元，亚马逊约2000亿美元，微软单季资本开支已达375亿美元。预计北美四大云厂商2026年资本开支合计将达约6550亿美元，同比增长约60%，对算力与高端存储需求形成持续支撑。

全球半导体业可能超长周期一直到2028年

高确定性的三大支撑

AI算力超级周期（最强引擎）

从训练→推理爆发，2026年推理占比超70%，带动GPU、HBM、先进逻辑、光互联全链需求。

云厂商/AI公司资本开支持续上修：Meta、AWS、OpenAI等2026–2028年AI基建投入超3000亿美元。

供给刚性：晶圆厂建设周期2–3年，2026–2027年新增产能有限，HBM良率仅30%–40%，结构性短缺持续。

2. 存储芯片全面复苏（第二引擎）

DRAM/NAND库存历史低位（仅4周），头部厂商控价保利润。

HBM挤占25%–35%通用DRAM产能，供需失衡延续到2027年底。

2026年存储市场增速或达90%，成为行业第一增长极。

3. 先进制程扩产加速（第三引擎）

台积电、三星、英特尔、格芯等先进制程（3nm/2nm）大规模扩产，设备订单饱满。

中国成熟/先进制程同步扩产，国产替代加速。

下行风险（概率15%–20%）

AI需求不及预期：云厂商/AI公司盈利不及预期、资本开支砍单；推理需求落地慢于预期。

宏观与资金压力：全球经济衰退、利率高企、AI公司债务/融资压力上升。

产能过剩风险：2027年底–2028年存储/成熟制程集中投产，价格战风险上升。

地缘政治：出口管制升级、供应链断裂、贸易摩擦加剧。

马斯克的TeraFab成功几率是多少?

马斯克是狂人许多业界认为做不到的事它居然成功。如火箭回收，星链计划等。但是这次的Terafab可能有点悬，因为建fab是个系统工程它的技术难度，资金巨额，EUV设备、工程经验及周期等都是几乎不可渝越的槛，日本Rapidus雄心勃勃其2nm也困难重重，业内有人估计成功率仅30%。

半导体制造是人类精密工程的极限，是对硅材料进行纳米级雕刻的艺术。TeraFAB要在2026年直接切入2nm并实现逻辑与存储的同端整合，必须直面三大无法用资金直接砸穿的技术墙。

卡点一：2nm GAA架构的良率难题与刻蚀选择比

当晶体管尺寸微缩至2nm节点时，台积电沿用多代的FinFET（鳍式场效应晶体管）架构已触碰短沟道效应的物理极限，必须全面转向GAAFET（纳米片全环绕栅极）架构。根据2026年初的市场调研，即使是深耕GAA多年的三星，其2nm（SF2）节点的良率也仅在40%-60%之间徘徊，迟迟无法满足大客户的大规模量产需求。

GAA工艺的核心难点在于沟道外延生长与选择性刻蚀（Selective Etching）。在释放硅纳米片（Nanosheet）时，需要使用高选择比的各向同性刻蚀技术，精准去除硅锗（SiGe）牺牲层，而不损伤仅有几纳米厚的硅沟道。任何微小的化学浓度波动或等离子体不均匀，都会导致内部间隔层（Inner Spacer）的坍塌。

台积电之所以能按计划在2025年四季度实现N2节点的高量产（HVM），靠的是其积累的超大规模的晶圆缺陷数据，以及相应的应对模型。TeraFAB作为一个毫无前道流片数据的“新手村”玩家，试图在无历史工艺配方积累的情况下直接攀爬这座良率悬崖，大概率将在投产前两年面临废片如山的惨状。

卡点二：High-NA EUV光刻机的产能配额

先进工艺的良率与成本极度依赖于极紫外（EUV）光刻机。在2nm及以下节点，传统的0.33 NA EUV必须使用昂贵且良率损失极大的多重曝光（Multi-patterning）技术。ASML推出的0.55 NA High-NA EUV光刻机（如Twinscan EXE:5200B）成为突破光学分辨率极限的关键，但其单台售价逼近3.8亿至4亿美元。

目前，High-NA EUV的早期产能已被英特尔（用于18A/14A节点）和三星（预计2026年上半年引入第二台用于SF2/Exynos生产）提前数年锁死。台积电则凭借强大的多重曝光优化能力，策略性地推迟了High-NA的大规模引入以控制折旧成本。

面对ASML极其缓慢的设备交付周期，TeraFAB若要实现10万片/月的初始产能，需要至少十几台最先进的EUV设备。在2026年至2028年的窗口期内，缺乏历史订单背书的TeraFAB在ASML的客户优先级列表中处于绝对劣势，设备采购的瓶颈将直接锁死其产能爬坡的上限。

卡点三：超越CoWoS的先进封装热应力难题

在TeraFAB的蓝图中，最激进的一步是将逻辑晶圆与高带宽存储（HBM）的生产、封装整合在同一屋檐下。在现有的AI芯片制造中，这一环节由台积电的CoWoS（Chip-on-Wafer-on-Substrate）技术垄断。

随着AI芯片功耗的激增（从单芯片150W向更高迈进），将多颗高发热的逻辑Die与对温度极度敏感的HBM3e/HBM4堆叠在一起，会引发灾难性的热应力问题。硅中介层（Silicon Interposer）、逻辑芯片、底层基板之间的热膨胀系数（CTE）存在显著差异。

在封装回流焊（Reflow）过程中，极易发生基板热翘曲（Warpage），导致数以万计的微凸点（Microbump）断裂或虚焊。台积电预计2026年将其CoWoS产能扩张至9万-11万片/月，这是建立在庞大良率试错库的基础上的。

TeraFAB如果无法在短时间内攻克底填料（Underfill）材料配方与应力释放仿真模型，其生产出来的将只是昂贵的“硅基废砖”。

意法半导体华虹代工STM32 MCU规模量产

2026-3月23日，意法半导体（ST）宣布，中国本地制造的STM32通用微控制器现已开启交付。首批由华虹宏力代工的意法半导体STM32晶圆产品已陆续发货给国内客户。这一里程碑标志着意法半导体全球供应链战略的重大进展。公司计划2026年将有更多STM32产品系列（包括高性能、安全及入门级的微控制器）实现本地量产。

意法半导体执行副总裁、中国区总裁曹志平表示：

STM32 MCU在本地实现规模量产，体现了意法半导体对中国客户的核心承诺。我们与华虹携手，通过打造一条安全、可靠、更具韧性的本地化MCU供应链，把与全球市场同标准、同性能的产品带给本地客户。未来，意法半导体将继续以更快的速度和更精准的服务，更好满足客户的需求。

通过此次合作，意法半导体成为业内首家依托双供应链体系建立起全球产品统一标准的半导体公司，实现了中国本地生产制造的40nm MCU与其海外产品在设计和技术上的完全一致。公司已打造了一条完全本地化的STM32供应链，覆盖从晶圆制造到芯片封装与测试的全流程制造。

在前端晶圆制造环节，意法半导体与华虹宏力在长达十五年的合作基础上，进一步深化了双方的长期合作伙伴关系。华虹采用与意法半导体全球晶圆厂完全一致的40纳米嵌入式非易失性存储器（eNVM）技术和质量管控标准，确保本地制造的产品在质量和兼容性上与意法半导体全球标准无缝衔接。封装与测试环节，则由意法半导体自有的深圳封装测试工厂及本地外包封测（OSAT）伙伴共同完成。

这一制造模式为国内客户提供了独特的双供应链选择权——既可选用中国本地制造的MCU，也可选择海外生产的型号，且品质全球一致、完全兼容

生产计划（2026-2027）

首款基于"在中国，为中国"供应链体系的STM32产品：STM32H7系列

成熟的高性能通用MCU系列，适用于需配备更先进图形显示的工业系统、智能家居系统、个人电子设备及医疗应用等。

进展：部分H7系列型号已率先开始量产，更多型号计划于2026年底实现量产。

三星代工迎来大逆转，接连拿下NVIDIATeslaAMD大单

据韩国媒体报道，三星代工业务正迎来强势反弹，在接连获得特斯拉和高通的订单后，三星又拿下NVIDIA新一代AI推理芯片"Grok 3 LPU"的生产合同，目前正与AMD洽谈下一代芯片的代工合作。

NVIDIA CEO黄仁勋在GTC 2026演讲中宣布，三星电子将负责生产Grok 3 LPU推理芯片，这是NVIDIA以200亿美元收购Groq后推出的首款产品，瞄准的是AI市场向智能体AI转型所带来的推理芯片需求爆发。三星已启动Grok 3 LPU的量产工作，预计今年第三季度开始出货。

据行业人士透露，三星代工部门内部已将今年第四季度设定为扭亏目标节点，证券分析师同样预测，三星代工业务从今年下半年起将大幅收窄亏损幅度，最快第四季度即可实现盈利。技术层面，三星2nm工艺良率已趋于稳定，美国德州Taylor工厂计划于今年下半年投产，届时产能将显著提升。此前，三星代工因先进制程前期投入巨大、良率长期低于预期，一直被市场视为三星Device Solutions（DS）部门的"问题业务"。

全球第一中国AI大模型调用量达4.69万亿Token

据媒体报道，全球最大AI模型API聚合平台OpenRouter最新发布的数据显示，截至3月15日，中国AI大模型的周调用量达到4.69万亿Token，连续第二周超越美国。

全球调用量排名前三的位置，均被中国模型包揽。摩根大通预测，中国的AI推理Token消耗量将从2025年的约10千万亿，增长至2030年的约3900千万亿，五年间增幅约370倍。

在AI的世界里，Token是模型处理信息的最小计量单位——无论是用户的提问，还是AI生成的一段代码，最终都需要被拆解成Token来完成运算。

正因如此，Token调用量成为衡量AI模型活跃度和产业价值的关键指标：调用量越高，意味着模型被用得越多，创造的实际价值也就越大。

OpenRouter平台汇聚了全球数百种大语言模型，拥有超500万开发者用户，是目前全球最大的AI模型API聚合平台。

其API调用量数据被业内视为反映全球AI应用落地趋势的“晴雨表”，直接体现开发者“用脚投票”的结果，反映模型在实际应用中的真实竞争力。

安谋科技CPU成功推出对于中国半导体业的意义

中国是安谋CPU成功的“根基与主场”

本土团队主导研发：星辰CPU由安谋中国本土团队设计，本土技术占比超90%，完全适配中国场景。

中国市场是最大基本盘：国内授权客户超460家，累计芯片出货450亿+；自研CPU客户235+，自研芯片出货14亿+，中国贡献绝大多数营收与落地案例。

本土需求驱动产品定义：聚焦AIoT、车载、工业、穿戴等中国高速增长赛道，解决端侧算力-功耗-面积矛盾，是为中国市场“量身定制” 。

中国产业生态是安谋CPU成功的“放大器”

本土芯片厂快速落地：灵动微电子、兆易创新、华大半导体等230+本土设计公司采用星辰CPU，快速流片量产，形成IP→芯片→终端闭环。

全产业链协同：联动工具链（SEGGER）、软件、终端、车厂，构建中国特色AIoT生态，降低国产芯片门槛。

政策与资本加持：契合国产替代、自主可控战略，获得地方与产业资本支持，加速研发与生态扩张。

中国战略环境是安谋CPU成功的“催化剂”

供应链安全刚需：外部技术管制加剧，本土自研CPU成为国产芯片“安全底座”，安谋星辰填补关键缺口。

端侧AI爆发：中国在智能家居、智能汽车、工业物联网的端侧AI需求全球领先，星辰CPU的Helium向量AI加速精准匹配。

双轨创新路径：安谋以Arm全球生态+本土自研双轮驱动，既兼容国际标准，又满足中国差异化需求，形成独特竞争力。

安谋CPU成功反哺中国半导体的“三重价值”

技术自主：提供自研CPU IP，提升本土芯片设计能力，减少对海外单一IP依赖。

产业赋能：让低成本MCU具备AI能力，加速中国AIoT、车载、工业智能化落地。

生态升级：与“周易NPU、山海SPU、玲珑ISP”形成全栈自研IP矩阵，支撑中国从“应用大国”走向“技术强国”。

Arm造芯为何下场与客户竞争？

3月24日，Arm在旧金山发布了公司35年历史上第一颗自研量产芯片——AGI CPU。一家靠卖图纸起家的公司，终于决定亲手造芯片了。

这不是一次产品发布，这是一次商业模式的根本转向。

过去35年，Arm的生意逻辑极其清晰：设计指令集和CPU内核IP，授权给Apple、高通、三星、英伟达、亚马逊、谷歌等客户，按每颗芯片收取版税。它不制造任何芯片，不和任何人竞争，行业称之为半导体界的"瑞士银行"——绝对中立，只做技术底座。

这个模式让Arm的架构渗透到了全球超过99%的智能手机处理器，累计出货超过2800亿颗芯片，几乎每一个你能想到的计算设备里，都有Arm的血统。

现在，"瑞士银行"不干了。Arm不仅要卖图纸，还要卖芯片。AGI CPU的首批客户名单上，Meta排在第一位，紧随其后的是OpenAI、Cerebras、Cloudflare和SAP。这些公司中的相当一部分，本身就是Arm的IP授权客户。换句话说，Arm正式成为了自己客户的竞争对手。

2022年Rene Haas接任CEO以来，Arm一直在试图通过涨价和IP捆绑销售来提高单芯片版税收入，但这条路走到了尽头——高通曾因授权费争议和Arm对簿公堂，苹果和谷歌也在持续降低对Arm标准IP的依赖度，转向深度定制设计。客户越强大，Arm从授权模式中能榨取的价值就越有限。

CEO Haas在发布会上给出了一个让华尔街为之振奋的数字：到2031年，AGI CPU预计将为Arm贡献约150亿美元的年收入，公司总收入目标为250亿美元，每股收益9美元。这意味着芯片销售业务将占到Arm未来总收入的60%，远超传统授权业务。

问题出在商业模式本身。Arm的收入由两部分构成：IP授权费（一次性）和版税（按芯片出货量抽成）。每颗芯片大约收取售价的1%到2%作为版税。一颗售价500美元的服务器CPU，Arm能拿到的可能不超过10美元。而如果Arm直接卖芯片，按照CFO Jason Child在发布会上透露的约50%毛利率来算，同一颗芯片的利润空间可能是授权模式的数十倍。

要理解Arm为什么必须走出这一步，先看一组数据。2025财年，Arm的年收入刚刚突破40亿美元。对于一家架构覆盖了全球绝大多数计算设备的公司而言，这个数字显得异常单薄。同期，英伟达仅数据中心GPU一项业务的季度收入就超过了Arm的全年营收。英特尔和AMD的数据中心CPU收入，每年也在百亿美元量级。原因很简单：ARM卖的是图纸，不是芯片。

可以确定的一件事是：半导体行业中最稳固的一种商业关系——"设计者不造芯，造芯者买设计"——从2026年3月24日这一天起，正式画上了句号。Arm用35年时间精心建立起来的"中立者"信用，如今被全部押在了一张150亿美元的赌桌上。这场赌局的胜负，将在接下来的五年内逐步揭晓。但无论最终结果如何，整个行业的竞争格局已经被永久地改写了。从今天起，没有人还会把Arm当成半导体界的"瑞士银行"——因为它已经亲手选择了自己的立场，而且选择站在了所有人的对面。

END

莫大康：浙江大学校友，求是缘半导体联盟顾问。亲历50年中国半导体产业发展历程的著名学者、行业评论家。

上一篇：求是缘半导体周要闻－莫大康(2026.4

下一篇：求是缘半导体周要闻－莫大康(2026.3