博客
破局算力孤岛!长安大学车联网实验平台“异构进化”实录
-
高性能计算服务器01:双路 Intel Xeon Gold 6342 、2卡 40G 以上企业级加速卡 GPU 服务器2台;
-
高性能计算服务器02:双路 Intel Xeon Platinum 8358P 、8 卡 Ada Lovelace 架构 GPU 服务器 2 台;
-
网络部分:24 端口千兆交换机 1 台,48 端口 10GbE 以太网交换机1台;
-
集群附件:配备多台 42U 标准服务器机柜、PDU、KVM 显示器、UPS 不间断电源等设备;
-
集群管理:LtAI 异构资源管理平台,搭建统一异构计算资源池,其平台的主要特性如下:
-
支持集群管理及资源池虚拟化,构建统一资源池;
-
支持 X86/ARM 芯片;
-
整体功能方面,支持容器管理、作业管理、镜像创建与管理、分布式存储管理;
-
用户管理、数据处理标注、模型开发、作业建模、模型纳管、部署;
-
资源监控方面,支持集群详情查看,支持系统组件监控、CPU 监控;支持自动识别加速卡类别,并根据识别结果对加速卡信息进行自适应展示:

用户收益
仿真实验平台在部署验收完成及半年的试运行后,用户对本次方案的使用情况和具体服务高度赞赏,其具体用户收益如下:
· 计算能力上:
高性能计算服务器01:2 台 2 卡 40G 以上企业级加速卡,主要用于大型计算任务;
高性能计算服务器02::2 台 8 卡 Ada Lovelace 架构加速卡;
平台使用方面,LtAI 异构资源管理平台,搭建统一异构计算资源池,按需分配对应的异构算力资源,解决计算资源孤岛问题;
软件框架兼容方面,兼容 Tensorflow/Pytorch 等框架,以及仿真模拟软件等,代码无需修改,可无缝移植;
大规模数据分布式训练方面,兼容 MPI 等分布式调度方式,结合 25GbE 网络,极大的提升了训练效率。
如果您对您的企业或高校机构等如何通过混合或内部部署存储解决方案增加数据容量有任何疑问,请立即联系我们联泰集群的专业工程师!
相关贴子
-
HPC
SH223 G3: 双路 Hygon 处理器,打造高性能、高扩展、高性价比 2U 机架式服务器新标杆
2024.07.11 16分钟阅读 -
HPC
高效散热,绿色节能,新一代液冷服务器—G2232 G2V2L
2024.08.02 30分钟阅读 -
HPC
纯国产服务器—GF2232 G2,我国高端服务器技术上的自主创新和突破
2024.10.25 16分钟阅读