开云体育(中国)官方网站据德勤《2026科技、传媒和电信行业预测》-开云(中国)kaiyun体育网址-登录入口

发布日期:2026-03-15 07:16    点击次数:201

开云体育(中国)官方网站据德勤《2026科技、传媒和电信行业预测》-开云(中国)kaiyun体育网址-登录入口

本文开头:21世纪经济报说念 作家:邓浩 孙燕开云体育(中国)官方网站

3月中旬将在加州圣何塞召开的NVIDIA的GTC大会,是AI边界最受瞩主意嘉会之一。此前黄仁勋告示,将推出一款“寰球前所未见”的全新芯片。

此言一出,老本市集热议纷起。现在相比主流的判断是,这次野心于GTC发布的芯片,最有可能的形态是融入Groq LPU(言语处罚单位)遐想的全新推理产物。

之是以不太可能是“加快插件”,云岫老本AI/智能制造组董事庄昌磊对记者分析称,“淌若四肢现存GPU的插件,其数据传输仍然要经过PCIe或NVLink等外部接口,这自己就会引入新的蔓延,部分对消SRAM的低蔓延上风。”

其进一步补充,“更理思的决议是像Cerebras那样,打造一个专为推理遐想的、以SRAM为中心的全新计较架构。”

推理时期降临

跟着“小龙虾”(OpenClaw)为代表的新一代Agent运用爆火,各人算力需求结构正发生较着变化,市集重点也从查考转向推理。

据德勤《2026科技、传媒和电信行业预测》,到2026年,“推理”(即驱动AI模子)将占据全部AI计较智力的三分之二。况兼,改日将出现价值数十亿好意思元的推理专用优化芯片,会部署在数据中心和企业办事器中,且部分芯片的功耗将与通用AI芯片极端致使更高。

近日,记者获悉,关于这次大会,业界算计最大的亮点,除了瞻望英伟达将精致揭晓Rubin及下一代Feynman架构GPU的中枢工夫细节外,还以为其极有可能会推出整合了LPU工夫的全新推理芯片。

四肢整合了Groq团队LPU工夫的全新推理芯片系统,这或将是英伟达初次在中枢AI算力产物线中大边界引入外部架构。

中信证券称,此前NVIDIA推出Rubin CPX针对Prefill降本需求,在对Groq收购后,本次或将推出LPU或“类LPU”芯片来收尾Decode提效。

在推理经过中,模子一般要需资格两阶段。率先,在pre-fill阶段处罚用户输入;其次,在decode阶段,逐Token生成输出后果。

践诺影响用户推理体验的关键,在于decode阶段的生成速率与蔓延。在基于GPU的推理架构中,由于无数模子参数存放于HBM中,计较中枢与HBM之间需要进行时常数据搬运,会影响模子decode阶段的时效性。

而Groq LPU是专为推理加快遐想,遴荐离计较中枢更近的存储单位SRAM来存储模子参数,比如230MB片上SRAM可提供高达80TB/s的内存带宽,数据处罚速率远超GPU架构。

不外,从物理遐想看,用SRAM满盈替代HBM并不行行。

庄昌磊诠释,面对面前动辄千亿、万亿参数的大模子,纯SRAM决议在容量上满盈无法胜任。那么,英伟达可能怎么转变?

谜底很可能不是“替代”,而是“堆叠”。庄昌磊暗示,“字据产业讯息,英伟达可能遴荐相通AMD 3D V-Cache的工夫,通过台积电的SoIC(集成芯片系统)搀杂键合工夫,将专为推理加快遐想的、包含无数SRAM的LPU单位(言语处罚单位),径直3D堆叠在GPU中枢晶圆上。”

供应链或生变

关于3D堆叠决议,AMD等头部厂商已有布局。2021年AMD公布3D垂直缓存(3D V-Cache)工夫,可将独特的7nm SRAM缓存垂直堆叠在Ryzen计较小芯片的顶部,大幅加多L3缓存数目。2024年7月,富士通先容旗下MONAKA处罚器遴荐3D SRAM工夫,野心2027年出货。

这一决议会否走向主流?

“片上SRAM存在工艺缩放比逻辑电路慢等问题,导致在单枚芯片上SRAM占用的面积较大、成本提高。基于此,部分投资者以为SRAM架构难以成为AI芯片内存的主要决议。”东方证券则以为,SRAM 3D堆叠决议可通过垂直堆叠存储单位的设施来提高密度以逃避传统SRAM容量受面积密度为止的问题,若AI推理中需要收尾更高容量的SRAM,3D堆叠决议有望拓展运用。

中信证券也以为,改日的GPU与NPU齐有可能遴荐3D堆叠SRAM的形式,收尾访存带宽的飞跃,经受LPU的上风,同期保抓原有的软件生态无需变动,保留GPU和NPU的原有上风。

庄昌磊指出,复杂的AI芯片可能同期需要两者:先用SoIC堆叠LPU和GPU中枢,再把这个堆叠好的立方体通过CoWoS与HBM封装在一说念。关于一些特定的、不需要HBM容量的纯推理芯片,如实不错满盈依靠3D堆叠SRAM来构建,从而绕开CoWoS,“但这部分芯单方面向的是细分市集,量级难以撼动HBM+CoWoS的主流地位。”

而SRAM 3D堆叠(如台积电SoIC)需要在晶圆制造阶段就进行精准的晶圆对晶圆键合,工夫和工艺与前端制造深度耦合。这会进一步将价值从后说念封装前移。

一方面,先进制程的价值被进一步放大。庄昌磊指出,为了在垂直堆叠中得回最高的互联密度和能效,最底层的计较晶圆必须遴荐起始进的工艺(如A16),这加重了行业对顶端工艺的依赖。

“另一方面,淌若高端芯片的价值不休上前说念制造和与之绑定的先进封装集中开云体育(中国)官方网站,原土封测厂可能濒临被‘挤出’高端市集的风险。”庄昌磊以为,这也为原土封测厂带来了互异化竞争机遇,如为不需要最顶端工艺的芯片提供练习且高性价比的3D堆叠决议,或是在3D堆叠芯片的测试、散热、可靠性分析等后端法子建树新的工夫壁垒。