测试平台由计算节点、高速互联网络组件、存储组件、管理与散热组件组成。用户通过 STAR-panel 进行测试运行。计算节点和部分高速互联组件,向 STAR-microbench 和 STAR-proxy 反馈性能信息。计算节点、高速互联网络组件、存储组件和散热与管理组件,向 STAR-panel 反馈功耗信息。
用例参数的取值应使得服务器正常运行的情况下CPU达到满载,每个用例测试3次,结果取平均值。运行某一应用所需要的时间,单位为秒(s),应用运行过程中,服务器的平均功率,单位为瓦(w)。
在行业应用以外,HPC 领域有一些非常专业、有影响力、有代表性的应用可以体现高性能计算各 项性能,本文件选取其作为高性能计算领域的通用测试用例。
高性能共轭梯度(HPCG)基准项目是一项旨在创建用于对 HPC 系统进行排名的新指标的工作。HPCG旨在作为高性能 LINPACK(HPL)基准的补充,该基准目前用于对 TOP500 计算系统进行排名。HPL的计算和数据访问模式仍然代表着一些重要的可伸缩应用程序,但不是全部。HPCG 旨在行使与不 同而广泛的重要应用程序更加紧密匹配的计算和数据访问模式,并激励计算机系统设计人员投资于将影 响这些应用程序总体性能的功能。
本测试使用HPCG官网提供的开源版本:OpenHPCG 进行测试。
OpenFOAM 的前身为 FOAM(Field Operation and Manipulation 的简写),后来作为开源代 码公布到网上,任何人都可以自由下载和传播它的源代码。目前 OpenFOAM 有两个版本:
1) 官方版本:www.openfoam.org 该版本以 Herny weller 为首的 OpenCFD 公司维护。该版本主要基于有限容积方法,功能 比较强大,目前商业 cfd 软件 cfx、fluent 能够支持的功能 openfoam 基本都能够支持。
2) dev 版本:以 Hrvoje Jasak 为首的在 openfoam 官方版本进行扩充,除了官方版本的有限容积 方法,dev 版本支持有限元、有限面积等。OpenFOAM 是一个完全由 C++编写的面向对象计算流体力学(CFD)软件包,采用类似 于我们日常习惯的方法在软件中描述偏微分方程的有限体积离散化,支持多面体网格(比如 CD-adapco 公司推出的 CCM+生成的多面体网格),因而可以处理复杂的几何外形,其自带的 snappyHexMesh 可以快速高效的划分六面体+多面体网格,网格质量高。支持大 型并行计算,目前针对 OpenFOAM 库的 GPU 运算优化也正在进行中。
AMG-2013 是一个线性系统的并行代数多重网格求解器,用于求解非结构化网格。在稀疏矩 阵计算,计算流体力学(CFD)中,AMG 方法占据着重要地位,是 CFD 领域的核心求解器之 一。AMG-2013 由美国劳伦斯-利弗莫尔实验室应用计算中心研发并在 GPL-2.1 许可证下开源。本用例将使用 AMG-2013 求解一个大型拉普拉斯方程,利用的计算方法为并行共轭梯度下降方法。每节点求解格点数为 100663296 个。
miniFE 全称有限元方法求解器,用于模拟流体力学中常见的隐式非结构化网格求解过程。此 处选用该应用是为了考察 HPC 服务器在这类经典计算场景中的综合性能。
基因行业测试用例、工具及指标按照表的要求。
生命科学研究是 ARM HPC 所探索的关键领域之一。生物信息学是生命科学研究中以计算机 为工具对生物信息进行存储、检索和分析的科学,其研究重点体现在基因组学(Genomics) 和蛋白质组学(Proteomics),分析序列中表达结构功能的生物信息。生物信息测序技术包括一代、二代、三代测序技术,当前领域主要应用为二代和三代测序技术。两代测序技术分别对应不同生信软件的移植及使用,二代测序核心软件为GATK 工具集, 三代测序为 CANU。
GATK, Genome analysis Toolkit. 使用最广泛的二代测序分析软件,重视数据质量、基因分 析、变异查找,是 SNPs 和 Indels 检测的行业标准软件。GATK 最初设计为人类基因和外显子 分析,后来扩展为能对其它任何生物体、有机体进行分析。GATK 提供了一种人工编码算法, 将统计数据应用到测序机器最容易出错的地方。
Canu 是第三代基因测序工具的一种,专门用于集成 PacBio 或 Oxford Nanopore 基因序列。Canu 处理流程分为3个步骤:correction、trimming、assembly,每一步又由许多小步骤组成。一般情况下。3个步骤都会执行,但是可以用-correct,-trim or –assemble 指定运行哪一步(如果 你想对 reads 做一次 correct 操作,尝试别的不同的方法做 assemble)。大多数算法都可以实现 多线程(在一个node 上使用多个core),并行化(使用 grid 中的多个 node),或者两者都有。具体选用 CANU 开源算例 PacBio 来进行评测。
Wtdbg2 是一个三代测序数据(同时适用于 pacbio 和 nanopore)denovo 组装软件,它是一款基 于 C 语言开发的开源软件。Wtdbg2 是从头序列装配器,用于由 PacBio 或 Oxford Nanopore Technologies(ONT)产生的长噪声读取。它组装原始读取而不进行纠错,然后从中间组装输 出建立共识。Wtdbg2 能够以比 CANU 和 FALCON 快几十倍的速度组装人类甚至 32Gb Axolotl 基因组,同时产生可比的碱基精度的重叠群。
NGS Analyzer-MINI 基于基因分析软件 NGS Analyzer,由日本理研所基因药学研究中心开发。NGS Analyzer 快速地分析由下一代基因测序软件输出的数据并能够更准确的识别人与人之间 的基因差异或者肿瘤细胞的突变。
COSMO 是一个 1998 年开发的非流体静力学的在限定区域内的大气预测模型。COSMO 基于 原始的热流体动力学方程,描述了湿润大气中的可压缩流,常被用于数值气象预报以及其他基于该模型的科学计算。
本文选自“服务器应用场景性能测试方法(高性能计算)”,绿色计算产业联盟,简称“GCC”。自成立以来 GCC 以协同构建绿色、开放、自主、共享生态体系为目标,致力于推动绿色计算产业发展,GCC 已经成为拥有包括天津飞腾、海 思、Marvell、Ampere 等全球最完整的 Arm 基础架构服务器芯片伙伴的全球联盟。截至目前,GCC 已 有单位会员近百家,包括芯片、设备和软件厂商,用户以及相关研究机构、高等院校等。