AMD发布3nm怪兽MI355X:1850亿晶体管,性能碾压英伟达B200
AMD在Advancing AI大会上发布了3nm工艺的MI355X,以1850亿晶体管、288GB HBM3e显存实现最高2.2倍于英伟达B200的推理性能。AMD董事长兼CEO苏资丰一口气推出了其史上最强的AI新品组合。
MI355X:3nm工艺的性能怪兽
MI350系列基于台积电3纳米工艺节点的全新CDNA 4架构,集成高达1850亿个晶体管。在FP6推理精度上,MI355X相比B200有2.2倍的速度提升。单颗MI350 GPU即可运行参数量高达5000亿的大型模型。在运行DeepSeek R1模型时,MI350系列的推理吞吐量超越了英伟达B200。8卡配置下,MI355X系统提供2.3TB HBM3e内存和64TB/s内存带宽。
奥特曼压轴登场:OpenAI将使用AMD芯片
现场的亮点是OpenAI CEO奥特曼作为嘉宾压轴出场,他表示OpenAI将使用AMD的AI芯片。AMD的新机架技术让苏妈有底气与黄仁勋掰手腕。据透露,英伟达的大客户OpenAI一直在给AMD的MI400系列芯片提建议。这种芯片功耗更低、运行成本更便宜,而且AMD采用激进的定价策略来挑战英伟达。
MI400系列:明年推出
苏妈还公布了下一代AI芯片MI400系列的细节。MI400将采用HBM4显存,每颗GPU提供423GB容量,FP4精度下峰值算力高达40PFLOPS。基于MI400的AMD首个AI机架「Helios」支持将多达72个MI400集成,FP4峰值算力达2.9EFLOPS。相比MI355X,MI400性能提升10倍。
ROCm 7.0:推理性能提升3.5倍
全新AI软件栈ROCm 7.0预计2025年第三季度全面上线。相比ROCm 6,推理性能提升超3.5倍,训练性能提升3倍。在Llama 3.1 70B、Qwen2-72B、DeepSeek R1等模型上,ROCm 7推理和训练性能比前代提升3.2-3.8倍。AMD首次推出开发者云,提供对MI300X GPU的即时访问,Docker容器已预装热门AI软件。