AMD王牌AI加速卡MI300X出世：训练模型比英伟达H100最高快 60%

业界

2023

12/07

12:48

IT之家

12 月 7 日消息，AMD 今天凌晨 2 点举办“Advancing AI”活动中，正式宣布了旗舰 AI GPU 加速器 MI300X，其性能比英伟达的 H100 高出 60%。

性能：

AMD 公司在演讲过程中，对比英伟达的 H100 加速卡，分享了 MI300X 的性能参数情况，IT之家附上数值如下：

内存容量是 H100 的 2.4 倍

内存带宽是 H100 的 1.6 倍

FP8 TFLOPS 精度是 H100 的 1.3 倍

FP16 TFLOPS 精度是 H100 的 1.3 倍

在 1v1 比较中，训练 Llama 2 70B 模型速度比 H100 快 20%

在 1v1 比较中，训练 FlashAttention 2 模型速度比 H100 快 20%

在 8v8 Server 比较中，训练 Llama 2 70B 模型速度比 H100 快 40%

在 8v8 Server 比较中，训练 Bloom 176B 模型速度比 H100 快 60%

AMD 提到，在训练性能方面，MI300X 与竞争对手（H100）不相上下，并提供具有竞争力的价格 / 性能，同时在推理工作负载方面表现更为出色。

MI300X AI 加速卡软件堆栈升至 ROCm 6.0，改善支持生成式 AI 和大型语言模型。

新的软件堆栈支持最新的计算格式，如 FP16、Bf16 和 FP8（包括 Sparsity）。

架构：

AMD Instinct MI300X 是最受关注的芯片，因为它针对的是 AI 领域的 NVIDIA 的 Hopper 和英特尔的 Gaudi 加速器。

该芯片完全基于 CDNA 3 架构设计，混合使用 5nm 和 6nm IP，AMD 组合这些 IP，让其晶体管数量达到 1530 亿个。

设计方面，主中介层采用无源芯片布局，该芯片使用第 4 代 Infinity Fabric 解决方案容纳互连层。中介层总共包括 28 个芯片，其中包括 8 个 HBM3 封装、16 个 HBM 封装之间的虚拟芯片和 4 个有源芯片，每个有源芯片都有 2 个计算芯片。

每个基于 CDNA 3 GPU 架构的 GCD 总共有 40 个计算单元，相当于 2560 个内核。总共有八个计算芯片（GCD），因此总共有 320 个计算和 20,480 个核心单元。在良率方面，AMD 将缩减这些内核的一小部分，我们将看到总共 304 个计算单元（每个 GPU 小芯片 38 个 CU），总共有 19,456 个流处理器。

内存方面，MI300X 采用 HBM3 内存，容量最高 192GB，比前代 MI250X（128 GB）高 50%。该内存将提供高达 5.3 TB / s 的带宽和 896 GB/s 的 Infinity Fabric 带宽。

AMD 为 MI300X 配备了 8 个 HBM3 堆栈，每个堆栈为 12-Hi，同时集成了 16 Gb IC，每个 IC 为 2 GB 容量或每个堆栈 24 GB。

相比之下，NVIDIA 即将推出的 H200 AI 加速器提供 141 GB 容量，而英特尔的 Gaudi 3 将提供 144 GB 容量。

在功耗方面，AMD Instinct MI300X 的额定功率为 750W，比 Instinct MI250X 的 500W 增加了 50%，比 NVIDIA H200 增加了 50W。

其中一种配置是技嘉的 G593-ZX1 / ZX2 系列服务器，提供多达 8 个 MI300X GPU 加速器和两个 AMD EPYC 9004 CPU。这些系统将配备多达 8 个 3000W 电源，总功率为 18000W。

【来源：IT之家】

THE END

广告、内容合作请点击这里寻求合作

AMD

免责声明：本文系转载，版权归原作者所有；旨在传递信息，不代表金沙手机网投app 的观点和立场。

相关热点

AMD发布会：“最强算力”Instinct MI300X、新款AI P

12月7日讯当地时间周三，AMD举行“Advancing AI”发布会，除了如期发布诸如Instinct MI300X、MI300A、锐龙8040系列处理器等外，大量AI产业的龙头公司也来到现场，为“英伟达挑战者”站台助威。

业界

AMD Instinct加速器真是彪悍！但别忘了EPYC它也是AI

12月7日消息，AMD今天正式发布了新一代AI/HPC加速器Instinct MI300X、Instinct MI300A，一个是传统GPU加速器，一个是独一无二的CPU+GPU融合加速器。

业界

锐龙8040官宣！AMD首创的AI PC性能飙升60％，2024年

AMD 2023年初发布的锐龙7040系列处理器，不但为笔记本带来了迄今最先进的4nm制造工艺、Zen4 CPU架构、RDNA3 GPU架构，还第一次为x86处理器加入了独立的NPU AI引擎硬件单元。

业界

Meta、微软承诺购买AMD新型人工智能芯片Instinct MI

12 月 7 日消息，当地时间周三 Meta、OpenAI 和微软在 AMD 投资者活动上表示，他们都将使用 AMD 最新开发的人工智能芯片 Instinct MI300X。

业界

AMD前3代EPYC处理器曝出CacheWarp漏洞，影响虚拟机

11 月 17 日消息，据德媒 ComputerBase 报道，AMD 和奥地利格拉茨大学的研究人员披露了 AMD EPYC 处理器中一个名为 CacheWarp 或 CVE-2023-20592 的新漏洞，涉及到第一代到第三代的 EPYC 处理器。

业界

AMD王牌AI加速卡MI300X出世：训练模型比英伟达H100最高快 60%

相关热点

最新文章

相关推荐

“特斯拉又割了我 7 万块”

用 eSIM 取代手机卡，究竟难在哪里？

这就是 iPhone 13 的“杀手级新功能”？网友：炒华为冷饭！

谷歌Pixel 6真机曝光：最美安卓屏幕没跑了！

iPhone 13机模曝光：值得等！

苹果计划在美国生产 Apple Car 汽车电池

关注我们