博客
RELION GPU 3D 分类基准测试-RTX 6000 Ada、RTX 5000 Ada 和…
12-21-2023-英特尔至强 W9-3495X 上的新 RTX 5000 Ada 基准测试
01
RELION 在 Cryo EM 应用中的 GPU 基准概述
作为科学工作站和服务器的增值供应商,联泰集群定期提供各种 GPU 配置的参考基准,以指导低温电子显微镜(cryo-EM)科学家采购为其研究优化的系统。在本博客中,我们使用 RELION Cryo EM 对 NVIDIA RTX 6000 Ada、RTX 5000 Ada 和 RTX A4500 性能进行了基准测试,比较了 GPU 运行时与 Intel Xeon Scalable 8490H 平台和 Intel Xeon W9-3495X 平台上的总体运行性能(数值越低越好)。
02
软件摘要
自 2012 年以来,RELION(Reregularized LIkelihood Optimization)已经彻底改变了低温 EM 领域。该独立计算机程序由 MRC 分子生物学实验室的 Scheres 实验室开发,使用贝叶斯方法通过电子冷冻显微镜数据的单粒子分析来细化大分子结构。
RELION 的开发得到了英国医学研究委员会的长期资助,并根据 GPLv2 许可证进行分发。这意味着任何人(包括商业用户)都可以免费下载、使用和修改 RELION。MRC 实验室只是要求,如果 RELION 在该用户的工作中有用,请标记引用他们的论文。
03
测试平台参数
04
RELION GPU 3D 分类基准-RTX 6000 Ada、RTX 5000 Ada、RTX A4500
在第一个测试中,我们希望可视化工作站和服务器平台上 GPU 之间的性能差距。我们将在下一节中比较基于 CPU 的性能。性能数字是消耗的时间,分数越低越好。
正如预期的那样,顶级 RTX6000Ada 在其他 GPU 中表现非常好。值得注意的是,NVIDIA 2022 年 3 月份推出的 Hopper 架构 GPU 卡不是为 HPC 和 RELION 类型的工作负载设计的,它们更适合于深度学习训练和推理。
RTX A4500 因其较低的成本和全面的性能而成为生命科学行业的宠儿。然而,它的年龄显示在英特尔至强可扩展 8490H 平台上。在未优化的 5xMPI 设置上,4 个 RTX A4500 性能数字最多可提供 RTX 6000 Ada 70% 的性能(其中带有 4 个 GPU 的 9xMPI 可提供 RTX6000 Ada 60% 的性能)。
使用 Intel Xeon 可扩展服务器平台,可以进行 8 和 10 GPU 配置。然而,10 倍 A4500 的性能与 4 倍 RTX 6000 Ada 相当。这就使得大家会对 4U 服务器机箱中 10 个 RTX A4500 的价格,或更便携的台式工作站机箱中 4 个 RTX 6000 Ada 的价格提出了质疑。
2023 年第 4 季度发布的 RTX 5000 Ada 插槽正好位于 RTX 6000 Ada 和 RTX A4500 之间。许多行业专业人士认为,RTX 5000 Ada 将有效地取代 RTX A4500 作为 GPU,以获得卓越的性价比。
05
RELION CPU 与 NVIDIA RTX 6000 和 RTX A4500 的基准测试
为了更深入地了解 GPU 和 CPU 平台之间的性能,我们使用相同的数字并将其格式化,以显示 GPU 静态时的 CPU 性能。我们将 Intel Xeon Scalable 8490H 的双 CPU 服务器配置与工作站 Intel Xeon W9-3495X 进行了测试,并将 GPU 性能与平台进行了比较。
通过测量 RTX6000Ada 的性能,我们可以看到 Intel-3495X 工作站配置的性能略有提高。我们怀疑,英特尔至强 W9-3495 具有更高的时钟速度,与英特尔至强可扩展相比,它的优势更大。这意味着 RELION 完全能够在不太依赖 CPU 的情况下实现最佳性能。
对于 RTX A4500 测试,我们进一步支持 RELION 在时钟速度更高时工作效率最好的说法。额外的内核本身并不能带来性能优势。然而,在服务器配置中,运行 8 和 10 GPU 配置是一种选择,而在 Intel Xeon W 平台上则不是。
06
RELION 的 GPU 和 CPU 硬件建议
如果与其他应用程序一起运行,RELION 通常是计算密集型的,因此优化应该首先满足 RELION 工作负载。有各种优化可以提高或降低性能,但我们希望在配置下一个系统时提供一个大致的想法。
对于 CPU,请选择每个 GPU 至少 4 个内核。越多越好,但优先考虑高时钟速度而不是核心数量。要构建高性能工作站,请选择 Intel Xeon W9-3495X 或 AMD Threadipper PRO 5995WX。两者都有充足的内核,分别为 56 和 60,并为额外的硬件提供了出色的时钟速度性能和 I/O。在配置服务器配置(双配置或单配置)时,请选择内核较少、时钟速度较高的处理器。
对于 GPU 来说,这取决于预算。根据我们的测试,10 倍 RTX A4500 的性能相当于 4 倍 RTX 6000 Ada。当我们考虑到每个 GPU 的成本时,购买 10 个 RTX A4500 仍然更具成本效益,但将其集成到具有服务器组件、机架空间和基础设施的服务器中,平台的成本会迅速上升。除非您已经有可用的数据中心机架空间,否则选择 4xGPU 工作站更容易设置,具有便携性和更好的灵活性。然而,如果您的预算限制没有那么紧,最好的选择是使用 RTX 6000 Ada 的 8 或 10 个 GPU 配置。RTX 5000 Ada 也是一个不错的选择,对于那些寻求更好性能、更好带宽、更高内存和最新一代的人来说,它似乎很有吸引力。
最终,您的工作量可能不是 100% 依靠 RELION。在 RELION 优化和考虑其他应用程序之间取得平衡,对于为您找到合适的组件至关重要。
如果您对构建下一个高性能计算解决方案有任何疑问,请联系我们,联泰集群的工程师可以回答这些问题,并在您的预算内以最佳价格提供最佳硬件方面提供指导。探索 RELION 优化的平台和解决方案,为您的生物学研究助力。