(原标题:【券商聚焦】国泰海通:2026 CES开幕,英伟达、英特尔、AMD等北美头部算力厂商密集更新新产品进展)
金吾财讯 | 国泰海通发研报指,2026 CES开幕,英伟达、英特尔、AMD等北美头部算力厂商密集更新新产品进展。
新硬件、新架构、开源全家桶,英伟达展示全面的AI基础设施部署与迭代,强调物理AI的应用前景。英伟达宣布新一代AI平台Rubin已进入全面量产阶段,Rubin包含六款新型芯片:Vera CPU、Rubin GPU、NVLink 6交换机、ConnectX-9超级网卡、BlueField-4 DPU及Spectrum-6以太网交换机。其中,Rubin GPU在训练任务的运行速度是Blackwell架构的3.5倍,在推理任务的速度达到了Blackwell的5倍,峰值运算能力达50 Petaflops。1)计算效率方面,相较于Blackwell平台,Rubin推理阶段的token成本最高降低10倍,并将训练混合专家模型(MoE)所需的GPU数量减少至原来的1/4。2)架构创新方面,针对推理过程中产生的大量KV Cache问题,英伟达推出由BlueField-4驱动的推理上下文内存存储平台,在GPU内存和传统存储之间创建一个第三层,通过扩大上下文容量、加快跨节点共享,在特定场景下,每秒处理的token数提升最高达5倍,并实现同等水平的能效优化。该推理上下文内存存储平台有助于帮助Agent保留长期记忆,长期运行、反复思考。3)部署节奏方面,微软和Coreweave将成为2026下半年首批部署Rubin的客户,微软的下一代Fairwater AI超级工厂将配备Vera Rubin NVL72机架级系统,规模可扩展至数十万颗Vera Rubin芯片。4)应用方面,黄仁勋表示物理AI的ChatGPT时刻快要到来。英伟达发布了Alpamayo系列VLA开源AI模型和工具,用于自动驾驶车辆开发。英伟达DRIVE系统正式进入量产阶段,首先应用于梅赛德斯-奔驰CLA,计划2026年在美国上路。这款车将搭载L2++级自动驾驶系统,采用“端到端AI模型+传统流水线”的混合架构。
AMD推出基于MI 455X的Helios机架。Helios机架采用全液冷设计,配备四个Instinct MI455X GPU和一个EPYC Venice Zen6 CPU。此外,MI500系列芯片也在开发中,将采用2nm工艺。随着MI500系列在2027年推出,AMD有望在4年时间内将AI性能芯片提升1000倍。
英特尔推出首款基于18A制程节点打造的计算平台。英特尔正式发布了基于18A工艺的最新一代客户端处理器英特尔酷睿Ultra 3系列(代号Panther Lake)。酷睿Ultra 3平台的总AI算力达到180 TOPS,其中GPU贡献了120TOPS,凭借大内存支持,该平台成为业内首个能在本地运行700亿参数大语言模型并支持32k上下文的客户端芯片。首批搭载酷睿Ultra 3处理器的消费级笔记本电脑将于2026年1月6日开启预售,并于2026年1月27日起在全球范围内面市,更多产品设计将于2026上半年陆续推出。
