发布时间:2025-06-12 来源:群智咨询(Sigmaintell)
AMD在ISC 2025高性能计算大会上正式发布了新一代AI/HPC加速器Instinct MI355X。这款旗舰产品在AI性能上实现了显著提升,在关键性能指标上直接对标NVIDIA旗舰产品Blackwell Ultra (B300);但其高达1400W的峰值功耗也同样“吸睛”,几乎是上代产品的两倍。Instinct MI355X归属于全新的MI350X系列,该系列基于AMD的CDNA 4架构。
除了支持FP8、FP16精度外,还支持FP4和FP6低精度格式,FP4和FP6在AI推理任务中正被越来越多使用。AMD将MI350X系列明确聚焦于AI推理领域。目前该系列GPU的扩展能力仍然限制在8卡(单机),这在一定程度上无法与支持更大规模互连的NVIDIA Blackwell GPU全面竞争,不过据透露,和硕(Pegatron)正研发集成128颗MI350X的机柜级系统。
MI350X包含两个型号:标准款MI350X功耗为1000W,设计采用风冷散热;高性能MI355X则功耗高达1400W,主要设计为液冷方案。不过AMD称部分客户或许也能采用风冷。两款型号均配备高达288GB的HBM3E高带宽内存,带宽均达到了8 TB/s。在关键的算力指标上,标准MI350X可提供最高18.45 PFLOPS的FP4/FP6性能, MI355X则进一步提升至20.1 PFLOPS。两项数据均超越了NVIDIA B300(15 FP4 PFLOPS)的标称性能,不过实际性能表现仍有待检验。
FP8性能方面,MI350X约为9.3 PFLOPS,MI355X为10.1 PFLOPS。与前代Instinct MI325X的2.61/5.22 PFLOPS相比,几乎让性能翻了一倍,并且MI355X的FP8性能还超过了Nvidia B300,尽管只高出0.1 PFLOPS。AMD的CTO Mark Papermaster认为,在未来10年,行业将持续开发更强大的处理器以实现Z级(Zettascale)的超算性能目标。然而,性能的持续增长的代价则是功耗的急剧攀升。据他描绘,一台Z级性能的超级计算机可能消耗高达500兆瓦(MW)的电力,这大约是一个中型核电站输出功率的一半。据AMD数据,全球Top级的超级计算系统大约每1.2年性能就能翻倍:HPC早期由纯CPU打造,但在2005年前后,则转向了混合CPU与GPU/加速器的异构架构。而在AMD称之为的“AI加速时代”中,像Frontier和El Capitan这样的系统已将峰值计算能力推至超过1 ExaFLOPS(百亿亿次浮点运算每秒)。为了维持这种指数级性能增长,内存带宽与功耗已成为HPC领域的两大挑战。因为要保持带宽与计算能力的匹配关系,GPU内存带宽需要在每2年内翻一倍。
这必然要求GPU集成更多HBM,这就意味着芯片体积将越来越大,功耗也将越来越高。AI加速器的功耗已呈现爆炸式增长趋势:比如AMD在2023年发布的Instinct MI300X峰值功耗为750W,而最新发布的MI355X已飙升至1400W。AMD认为在2026-2027年间,GPU功耗将达到1600W,而到2030前,将逼近2000W。相比之下,Nvidia就激进了许多,其规划中的Rubin Ultra GPU(配备四个光罩级尺寸的计算芯粒)预计功耗可能高达3600W。值得关注的是,在功耗急剧增加的同时,超级计算机和加速器的能效(单位功耗的性能)也在持续快速提升。
据AMD数据显示,能效已从2010年的约3.2 GFLOPS/W,发展到Frontier系统的约52 GFLOPS/W。如何维持能效提升?AMD预测,要支撑计算性能的持续翻倍,能效本身也需要每2.2年翻一番。在这样的能效路线图下(达到约2140 GFLOPS/W,是当前的41倍),提供Z级性能的HPC系统预计需要约500 MW的电力。若无法实现如此幅度的能效飞跃,未来的超级计算机恐将需要吉瓦(GW)级别的电能供应——这相当于一个大型核电站的发电能力,其高昂的运行成本将使其变得极不经济。AMD强调,要在十年后显著提升超级计算机性能,不仅需要重大的架构创新,整个产业链也必须协同发展,以确保计算能力能与所需的内存带宽齐头并进。而在功耗持续激增的大趋势下,一个之前看似遥不可及的解决方案——使用核反应堆为Z级超级计算机提供电力——在2030年代或将成为可能。AMD Instinct MI355X的发布,其比肩Nvidia B300的强劲性能彰显了AMD挑战N记的野心,但高达1400W的功耗,也是追逐极致算力道路上严峻能效挑战的一个缩影。