IT之家在不久前报道,科技媒体techpowerup在AdvancingAI大会上获悉,AMD公司更新了其产品线,推出了一款全新的加速卡——Instinct MI325X。
这款加速卡基于AMD的CDNA3架构,相较于前代的MI300X加速卡,MI325X无疑是一大步的进化。
在应对日益增长的AI计算需求中,AMD以巨大的热情和决心,带来了其在AI领域的最新成果。
AMD Instinct MI325X加速卡在规格和性能上都有着显著的提升。
其配备了高达256GB的HBM3E内存,这是MI300X加速卡192GB容量的1.8倍。
更重要的是,MI325X的带宽达到了惊人的6TB/s,这为AI计算提供了极为强大的数据吞吐能力。
在计算能力方面,新的加速器表现同样出色。
在FP16(半精度浮点)计算下,MI325X提供1.3PetaFLOPS的性能;而在FP8(八位浮点)训练和推理下,其性能更是高达2.6PetaFLOPS。
相较于前代的MI300X加速卡,MI325X的计算性能提升了1.3倍。
当我们将多个MI325X加速器组合在一起时,其性能表现更是惊人。
配备八个MI325X加速器的系统,可以实现高达2TB的HBM3E内存和48TB/s的带宽,计算性能更是达到了惊人的10.4PetaFLOPS(FP16)和20.8PetaFLOPS(FP8)。
AMD Instinct MI325X加速卡在性能上不仅超过了前代的MI300X,甚至还在某些方面超越了竞争对手。
AMD声称,MI325X在内存带宽、FP16/FP8计算性能上超越了NVIDIA H200 HGX系统1.3倍,同时在内存容量上更是超越了后者1.8倍。
这无疑彰显了AMD在AI计算领域的强大实力和决心。
为了让Instinct MI325X加速卡能够充分发挥其性能,AMD为其打造了一套完善的软件生态。
加速器核心是ROCm软件堆栈,这是一款为AMD硬件优化的软件环境,能够为用户提供最佳的AI计算体验。
AMD计划将ROCm引入每款GPU,包括消费级GPU,并与开源社区合作集成最新功能。
AMD还表示将与开源社区合作,将PyTorch、Triton、ONNX等流行的深度学习框架的功能整合到ROCm堆栈中,从而为用户提供一个一站式的AI计算解决方案。
据AMD官方报道,该公司正在为2025年下半年准备InstinctMI350X系列。
该系列将基于TSMC的3纳米工艺,推出CDNA4 Instinct MI355X加速器。
这款加速器将配备288GB HBM3E,以应对未来更加复杂的AI计算任务。
AMD的Instinct MI325X加速卡无疑是公司在AI领域的一次重要尝试。
其强大的性能、完善的软件生态以及面向未来的发展规划,都使得MI325X成为市场上的一款重要产品。
我们期待这款加速卡能够在AI领域创造更多的可能,推动人工智能的进一步发展。
同时,我们也期待Instinct MI350X系列的出现,带领AMD在AI硬件领域走向新的高峰。
本文地址: https://www.gosl.cn/hlzxwz/6a1de9229d07b190eb20.html
上一篇:体育模拟游戏足球经理25宣布延期...