博客

基准

AMD EPYC™ 平台优化指南——基于 GA2232 G3V2 的 HPL 性能测试

2024.12.27 22分钟阅读

AMD EPYC™(霄龙)处理器以其强大的多核处理能力和出色的能效比,在数据中心、高性能计算(HPC)、云计算等领域赢得了广泛的应用和赞誉。其卓越的架构设计不仅提供了前所未有的计算能力,还显著降低了能耗,成为现代计算平台的理想选择。

 

本文以基于AMD EPYC™ 9004 架构的 GA2232 G3V2 服务器为例,通过 High Performance Linpack (HPL) 性能测试,深入探讨了 AMD CPU 平台的优化思路。采用评估系统线性代数求解能力的 HPL 进行测试,其是衡量超级计算机浮点运算性能标准基准测试的重要工具之一。

测试平台介绍

GA2232 G3V2 是联泰集群推出的一款双路 SP5 平台的 2U 服务器,专为满足现代数据中心的需求而设计。该服务器支持两颗 AMD EPYC™ 9004 或 9005 系列处理器。最高可配置 10 个标准 PCI-e 扩展槽,能够根据不同的应用场景轻松扩展 GPU、网卡或其他外围设备。适用于云计算、虚拟化、高性能计算和人工智能等应用。

图片

图片

 

  • 硬件配置及平台

要充分发挥服务器的性能,不仅依赖于高性能的 CPU,还需要一个卓越的硬件平台以及合理的硬件配置。
GA2232 G3V2 通过其精密的电路设计以及优秀的电源管理系统,提供持续稳定的电力支持以及高速低延迟的通信,此外先进的风道设计和智能散热控制系统,保证了服务器在长时间满载运行时仍能保持较低的温状态。
此外,鉴于 AMD CPU 的独特架构设计,为了实现最低延迟和最高带宽的内存访问,在每个内存通道上都应安装内存条,这可以显著提升数据处理速度和效率。
同样重要的是,配备高速 NVMe 固态硬盘也是必不可少的选择。NVMe SSD 提供的超高读写速度和极低延迟,进一步增强了整个系统的响应能力和数据吞吐量,为各种计算密集型应用提供坚实的基础。
  • BIOS 优化设置

合理的 BIOS 设置对于最大化服务器性能至关重要。不同应用场景对服务器性能的要求各不相同。因此,在调整 BIOS 设置时,须根据具体的工作负载需求进行针对性配置。本次测试主要通过关闭超线程、调整 NUMA 节点设置、修改 CPU 运行参数等方法对服务器进行设置,主要目的是提升 CPU 频率,增加内存及 CPU 间通信速度。
  • 系统优化设置

对系统进行合理的配置和优化,可以在很大程度上增强服务器的性能表现。本次测试主要采用开启系统内的透明大单页、将 CPU 设置为高性能模式等方式对系统进行调整,此外,测试前最好清除下内存缓存并对内存进行整理,这样对提升测试结果会有一定帮助。
  • 软件优化

在高性能计算(HPC)领域,大部分软件都需要进行编译安装,因此编译器和加速库的选择至关重要。Intel® 和 AMD 分别提供了针对自家 CPU 优化的编译器和加速库,在特定场景下能够显著提升应用程序的性能。
除了选择合适的编译器和加速库外,合理的软件运行参数同样对性能提升起到关键作用。不同的硬件配置需要针对性地调整运行时的参数,以确保最佳性能表现。
总结
综上所述,服务器性能调优可以从硬件配置、BIOS 设置、系统设置、软件优化四个方面进行调整。当然,实际测试过程中,服务器性能受到诸多因素影响,调优过程是个漫长而复杂的过程,需要不断的调整各种参数,才能充分发挥服务器性能。
我们使用了 AOCC(AMD Optimizing C/C++ Compiler)、AOCL(AMD Optimizing CPU Libraries)以及 GCC、OpenBlas 对 HPL 进行编译,并在服务器默认设置以及优化设置后的平台上进行测试,再将测试结果与服务器理论值进行对比,测试结果如下:
图片
得益于 GA2232 G3V2 的优秀设计,我们通过简单的设置,即实现了 HPL 性能的大幅提升。在使用了 AOCC&AOCL 编译的 HPL 以及针对服务器进行优化设置后,服务器整体性能大约提升了 17% 左右。

相关贴子

敬请登记。

登记
本网站受 reCAPTCHA 保护,适用 Google隐私政策和服务条款。