博客

HPC

AMD EPYC Genoa-X 和 EPYC Bergamo — 同类最佳性能

2023.12.01 19分钟阅读
为什么说 AMD EPYC Genoa-X 意义强大

今年6月,AMD 宣布更新其第四代 AMD EPYC(霄龙)系列处理器,专为满足企业需求所需的特殊工作负载而设计。AMD EPYC Genoa-X 是添加到其第4代 EPYC 处理器家族中的 3D V-Cache 变体。3D V-Cache 是一种缓存堆叠技术;通过将三级缓存直接堆叠在核心芯片上,AMD 能够增加其 CPU 上的三级缓存容量,以减少从 RAM 来回传输数据所需的内存延迟。EPYC Genoa-X 或 9004X 在3个新的 SKU 中交付,它在 CPU 中的缓存比我们以前见过的更多。

额外增加的 1.1GB 高速缓存具有很高的性能,特别是在大型数据集应用程序中,如模拟、CFD、AI 和深度学习训练,以及其他 HPC 应用程序。Phoronix 发布了 AMD EPYC 9684X 在各种 HPC 工作负载中的基准测试结果。与 AMD 和 Intel 的其他顶级 SKU CPU 相比,尽管 L3 缓存的加速和基本时钟速度较低,但在各种应用中仍具有相当大的优势。

虽然 9684X 具有 96 个内核的高容量,但不要低估较低内核数的 9384X 和 9184X。对于虚拟机等应用程序,较低的内核数使内核与缓存的比率具有巨大的优势。在 9384X 中,每个内核将有 24MB 的缓存,在 9184X 中,每个内核有 48MB 的缓存!较低内核数的 SKU 适用于遵循每个核在许可模式下的企业应用程序。每个内核都必须确保快速,每个内核额外的 L3 缓存将有助于提高其速度和减少延迟。

如果有任何迹象表明额外的缓存甚至能起作用,那么 Milan-X CPU 在 HPC 和服务器领域将受到高度追捧。Genoa-X 虽然其新平台的启动成本较高,但对于早期采用者来说,这可能是一项非常值得的投资。

EPYC Bergamo 中的内核数最多可达128,这意味着双处理器配置最多可达到256个内核512个线程。查看 Phoronix 在 AMD EPYC Bergamo 9754 上各种应用程序的基准测试结果。如果 EPYC Bergamo 与其他 AMD EPYC CPU 采用相同的芯片尺寸封装,那么它们是如何实现内核增加的?

通过减少缓存大小,AMD EPYC Bergamo 内核更小,本质上,现在可以在芯片包上安装更多!这似乎与 Genoa-X 和 3D V-Cache 所代表的相反。然而,权衡是不同的。那些工作负载不占用内存,也不需要几乎同样高的时钟速度的用户可以利用 EPYC Bergamo 提供的额外 Zen 4c 内核。

更小的内核使 AMD 能够以不同的方式路由内核,从而导致 AMD 决定将设计重新格式化为8个 CCD,每个 CCD 最多16个内核。每个 CCD 上的核心越多,它们的距离就越近,从而实现更高效的设计;AMD EPYC Bergamo 优化了每瓦的性能,从而降低了总体成本。基于云的工作负载、虚拟化服务器和其他非高度密集型应用程序可以利用 Zen4c 中大量高效的核心。

AMD EPYC Genoa vs. EPYC Genoa-X vs. EPYC Bergamo — 最完整的 CPU 堆栈

AMD 正在将其高性能CPU堆栈划分为不同的类别,这些类别具有不同的物理特性,可以为每个独特的用例提供更好的性能。

 

AMD EPYC Genoa(非 X 变体)标记的 EPYC 9004 是为通用计算工作负载设计的。这些内核具有更高的时钟速度,方便那些需要性能最好的内核和/或大量内核的人使用。AMD EPYC 9004 低核 SKU 具有更高的时钟速度,可加速优先考虑单核性能的工作负载。那些工作负载不经常访问内存,并且需要最高频率的人选择 AMD EPYC 9004 作为他们用例中最快的部分,因为它的时钟速度更高。

 

AMD EPYC Genoa-X 标记的 EPYC 9004X 专为技术计算或 HPC 设计。这些带有 3D V-Cache 的处理器的时钟较慢,以保持堆叠的 L3 缓存的稳定。但对于经常需要访问内存的用户,如 CFD、天气预报和 AI 深度学习等大型数据集工作负载,可以利用缓存内存。那些使用大型数据集和参考数据的用户通常会发现,基于提供的大量 L3 缓存,AMD EPYC 9004X 是其用例中速度最快的部分。

 

AMD EPYC Bergamo 标记的 EPYC 97X4 是为云原生工作负载设计的,或者更普遍地说,是为更多适配的场景设计的!这些高密度 CPU 具有较低速度的核心,可以为非高密集型工作负载提供最佳计算!在这些简单的任务中,内核越多越好,尤其是当你使用一台 AMD EPYC Bergamo 服务器来处理各种基于云的工作负载时。那些工作负载基于许多轻任务的人会发现 AMD EPYC 97X4 是基于额外内核的用例中速度最快的部分。

 

在联泰集群的服务器和解决方案中能够支持这两条新的 AMD EPYC 生产线。我们也提供其他广泛的平台选择,多样化的配置以匹配您理想的工作负载。

立即联系我们,了解更多,我们经验丰富的工程师将帮助您选择联泰的下一个 AMD EPYC 解决方案的最佳组合。

相关贴子

敬请登记。

登记
本网站受 reCAPTCHA 保护,适用 Google隐私政策和服务条款。