一个月前,当Ilya在NeurIPS上宣布“预训练即将结束”时,他可能没有想到,这一表态不仅没有让业界感到困惑,反而掀起了另一场狂欢。
博通成为第一家利用这一优势的公司。
就在 NeurIPS 开幕的前一天,12 月 13 日,ASIC 芯片巨头博通发布了季度报告。虽然调整后净利润33%的增长并不是特别“吓人”,但CEO陈富阳表示,大客户2027年将花费6亿元人民币。900美元购买博通AI组件的预测仍然导致公司股价飙升次日暴涨24%,成为第九家市值突破万亿的美股公司。
在大洋彼岸的中国,ASIC概念股再次被带回人们的视线,寒武纪、芯原、明芯等公司受到投资者追捧。
虽然A股市场从来不缺乏盲目追逐热点的案例,但这一次,国内ASIC芯片厂商确实拥有了相对扎实的基本面。
一位产业投资者告诉笔者,“国内领先的CSP(云解决方案提供商)公司都在开发自己的ASIC芯片,每个公司都需要第三方芯片设计公司的帮助。”
这并不难理解。就像谷歌和博通联合打造的自研TPU一样,谷歌可以为其设计架构,但IP核授权和布局设计的工作仍然需要博通来完成。
但问题是,国内CSP厂商会选择国内ASIC芯片设计公司吗?
该产业投资者认为,“在产品组合、IP核库、设计复用性、软件生态等方面,国内ASIC厂商与博通、Marwell等巨头存在明显差距。”
更宏观的问题是,即使业界承认预训练已经结束,高举ASIC大旗的博通真的能颠覆“NVIDIA叙事”吗?
博通的信心从何而来?
在博通财报发布后的电话会议上,陈富阳表示,2024财年,博通AI相关半导体营收为122亿美元。根据博通的业务架构,这部分收入除了ASIC芯片外,还应该包括以太网交换机芯片、PHY芯片等。
即便122亿全部计入ASIC芯片营收,陈富阳的预测也极其夸张。如果以900亿美元为上限,未来三年博通ASIC芯片的年复合增长率将达到惊人的170%。
相比之下,英伟达2022年至2024年的收入复合增长率约为110%。
陈富阳为何如此看好ASIC市场?
我们先来说一下ASIC芯片的定义。 ASIC,即专用集成电路(Application Specific Integrated Circuit),是为特定用户或特定电子系统而制造的集成电路。
广义上可以理解为用户为满足产品功能、成本、体积等要求而专门设计的芯片。在此背景下,汽车中用于发动机控制的芯片可以视为ASIC芯片。
目前AI行业使用的ASIC芯片主要是针对人工智能相关的算法和任务而设计的,以加速人工智能的训练和推理过程。
听起来和GPU有点相似?
与后者相比,ASIC是针对特定推理任务定制的,不需要像GPU那样频繁配置和切换来适应各种任务。
同时,由于ASIC芯片只包含完成特定推理任务所需的功能模块,因此不需要像GPU那样集成大量通用功能和接口。例如,在一些简单的图像识别推理应用中,ASIC芯片可以完全去掉GPU中用于复杂图形处理和游戏渲染的模块,从而降低芯片成本。
此外,在推理方面,设计厂商会为卷积、矩阵乘法等常见运算设计专门的电路模块。在执行推理任务时,这些模块避免了冗余计算和不必要的电路切换,从而显着降低了功耗。
目前业界主流观点是,在大规模数据中心的推理任务中,使用ASIC芯片可以降低功耗30%-70%;在边缘计算等简单数据场景中,ASIC芯片甚至可以降低功耗。一个数量级。
值得一提的是,去年年底,Redshirt 发布了一份名为《2025 年的 AI:构建模块牢牢就位》的报告,其中包含了一个非常有趣的观点:
今天的软件即服务未来将转向服务即软件。在AI应用方面,未来“按结果收费”将取代目前的“按座位收费”。
如果AI行业如Redshirt预测的那样发生变化,那么在配置相对灵活的推理端,厂商无疑会“为成本而疯狂”。
在此背景下,ASIC芯片的意义不言而喻。
NVIDIA 的替代品?太早了

事实上,各大互联网公司关注ASIC芯片并不比GPU晚多少。
最有代表性的就是谷歌。早在2015年,谷歌就开发出了第一代TPU处理器(ASIC的一个分支)。虽然当时外界对这个项目了解不多,但正是这个芯片驱动AlphGo击败了李世石。
接下来的八年里,在博通的帮助下,谷歌TPU又迭代了六个版本。
2023年12月,多模态大车型Gemini 1.0诞生。谷歌在I/O大会上表示,这个大模型100%的训练和推理都是由TPU V5e和TPU V4完成的。
当然,这并不意味着TPU在大型模型训练上也有优势,但对于谷歌来说,它并不希望看到NVIDIA在硬件平台上“胜者杀”。
除了谷歌之外,meta和字节跳动也在通过博通“自研”ASIC芯片。尽管后者官方否认与博通合作,但业内人士指出,字节跳动的ASIC芯片最早将于今年年底上市。看到反馈了。
不过,在博通与这些大厂的合作中,我们也可以看到目前ASIC芯片的几个明显的缺点。
首先是,至少在现阶段,各公司定制/自研的ASIC芯片并不能说是节省成本的,而且开发周期较长。
例如,谷歌的TPU项目于2015年启动,但真正可用于大型模型训练/推理的芯片要到2022年才会出现(TPU V4)。虽然理论上ASIC芯片适合特定的推理任务并且功能更简单,但实际上设计门槛非常高。从流程的角度来说,需要从最基本的系统规范定义和逻辑设计开始。
此外,与Nvidia的GPU相比,Broadcom和Marvell都明显缺乏像CUDA这样丰富且易于使用的软件生态系统支持。当涉及到卡间互连和智能计算中心建设的问题时,NVlink没有类似的支持,Infini Band是一个“即用型”解决方案。
与硬件平台相比,英伟达在软件生态上的优势可谓“第二名看不到尾灯”。
这两个因素直接导致了使用ASIC进行AI推理,这注定只是现阶段领先CSP厂商的游戏。上述行业投资者认为,“在全球范围内,对推理端ASIC芯片有强烈需求的云厂商可能不超过10家”。
更重要的是,对于领先的CSP厂商来说,其丰富的产品矩阵注定短时间内仍需要更多的通用GPU作为计算中心的核心。毕竟,当新的算法或应用场景出现时,GPU可以通过软件升级来支持,而ASIC则需要重新设计产品。
因此,以博通为代表的ASIC厂商短期内或许无法推翻“NVIDIA叙事”。
国产ASIC,乘风破浪?
前面提到,国内领先的CSP厂商都在开发自研ASIC,大致可分为两类:
第一类是以阿里巴巴、百度为代表的“纯自研路线”。两者相关的平头哥和昆仑芯片均已成立ASIC研发团队,并已完成相关产品的流片和量产。 。
第二类是以字节跳动为代表的厂商,与第三方芯片设计公司合作开发ASIC芯片。
这两类厂商的共同点是,出于供应链安全考虑,都有不同程度的ASIC芯片国产替代需求。
这构成了国产ASIC芯片企业最坚实的基本面,但目前来看,国产ASIC芯片企业仍然存在几个明显的短板需要解决。
首当其冲的是IP核资源的稀疏。
相比之下,博通在为谷歌打造GPU时,除了提供先进的封装技术和光互连技术外,还附带了多个高性能互连IP核,涵盖高速SerDes核、PCIe接口等。没有这些IP核资源丰富,谷歌TPU的研发时间会更长。
国内AISC厂商有时需要先获得Broadcom、Marvell等公司的IP授权,这对于作为客户的CSP厂商来说,成本比收益要高一些。
此外,作为一家Fabless(无晶圆厂)公司,博通还可以提供代工之外的全制程服务。从最前端的规格定义到最后端的3.5D先进封装,博通都能提供成熟的解决方案。
一位业内人士告诉笔者,“现在很多人都因果颠倒了。并不是说选择ASIC路线就会导致成本大幅下降,而是像博通这样的公司,强大的in-House优势让ASIC芯片的研发成本降低。”
另一个不容忽视的问题是,随着BIS新规的生效,本土ASIC芯片的代工能力进一步收紧。当然,随着半导体行业国产替代进程的加速,这一制约因素未来有望得到改善。