主要内容
本周在上海举行的华为 Connect 2025 活动上,中国科技巨头华为宣布了其 Ascend 芯片系列的下一代计划。华为董事会副主席徐直军在会议主题演讲中表示,2025 年是“值得铭记的一年”,并指出 1 月 DeepSeek-R1 的首次亮相是公司的一个转折点。他还承认,中国在半导体制造工艺节点方面可能会“在相当长的时间内”落后。
公司应对关税和贸易禁运的策略是推进基础设施设计和技术,同时决定开源其大部分软件,包括 openPangu 基础 AI 模型和 Mind 系列 SDK。
新的 Ascend 芯片:公司计划生产三个新的 Ascend 芯片系列,即 950、960 和 970。Ascend 950PR 和 950TO 将由同一芯片铸造,为低精度数据格式提供额外支持,包括 FP8(950 将提供每秒 1000 万亿次浮点运算性能)和 MXFP8(额定为每秒 2000 万亿次浮点运算)。还将有更好的向量处理和更精细的内存访问,从 512 字节降至 128 字节。Ascend 950 芯片将提供 2 TB/s 的互连带宽,比目前的 Ascend 910C 高 2.5 倍。950PR 将于 2026 年第一季度推出,Ascend 950DT 将于 2026 年第四季度推出。一年后,即 2027 年第四季度,Ascend 960 将具有比 950 高一倍的计算能力、内存访问带宽、内存容量和互连端口数量。它将支持华为的专有 HiF4 数据格式,公司声称该格式比其他 FP4 技术具有更高的精度。最强大的芯片将是定于 2028 年第四季度发布的 Ascend 970。徐直军表示:“我们仍在研究其一些规格,但总体目标是将所有规格推得更高。”
华为的策略:华为的策略是以 SuperPoDs 的形式提供原始计算的超大规模集群,将于 2026 年第四季度以 Atlas 950 SuperPoD 的形式出现,配备新的 Ascend 950DT 芯片。竞争对手 NVIDIA 的 NVL144 系统(类似 SuperPod)将于 2026 年中至下旬推出,华为声称其第一个 SuperPoD 将比 NVL144 中的 GPU 多 56.8 倍的 NPU,并提供近 7 倍的处理能力。即使 NVIDIA 计划在 2027 年推出 NVL576,Atlas 950 SuperPoD 仍将表现更好。
通用计算芯片:对于通用计算,华为计划在 2026 年第一季度发布其 Kunpeng 950 处理器的两种型号,两种型号中较快的一种具有 96 个核心和 192 个线程,另一种具有 192 个核心和 384 个线程。还将有徐直军所称的“世界上第一个通用计算 SuperPoD”,即基于 Kunpeng 950 的 TaiShan 950 SuperPoD,将于 2026 年第一季度推出。
开源连接协议:NPU 和通用计算 SuperPoDs 将使用 UnifiedBus 2.0,这是现有 UnifiedBus 1.0 的下一次迭代。这是今年 3 月投入使用的 Atlas 900 A3 SuperPoD 使用的互连技术,迄今已有 300 多个安装。UnifiedBus 2.0 将是一个开放协议,技术规格将立即发布给开发社区。UnifiedBus 2.0 将在新一代 SuperPods 中内部使用,并连接 SuperPods 集群,形成 SuperClusters。第一个集群产品将是 Atlas 950 SuperCluster,提供比目前世界上最强大的计算集群 xAI 的 Colossus 高 2.5 倍的 NPU 和 1.3 倍的计算能力。2027 年最后一季度,华为打算推出 Atlas 960 SuperCluster,它将在