作者:tryccl | 来源:互联网 | 2024-12-12 13:57
近日,国际权威AI基准测试平台MLPerf发布了最新的推理测试结果,浪潮AI服务器NF5488A5在此次测试中创造了18项性能纪录,显著提升了数据中心AI推理性能。
国际权威AI基准测试平台MLPerf近日公布了最新一轮的推理测试结果,浪潮AI服务器NF5488A5在此次测试中表现出色,共创造了18项性能纪录,在数据中心AI推理性能方面领先于其他品牌的产品。
MLPerf是全球公认的AI计算基准评测组织,由图灵奖得主大卫·帕特森(David Patterson)联合谷歌、斯坦福、哈佛大学等机构共同创立,每年组织全球范围内的AI训练和推理性能测试并发布排行榜。此次MLPerf的AI推理基准测试吸引了来自全球的23家企业和研究机构参与,涵盖了数据中心和边缘计算等多个应用场景。此前,MLPerf已于7月发布了今年的训练性能榜单。
浪潮NF5488A5在数据中心AI性能测试中表现卓越
在此次测试中,浪潮NF5488A5不仅创造了18项MLPerf推理性能纪录,成为此次测试中创纪录最多的AI服务器,还在数据中心AI性能测试中取得了显著的成绩。在22个数据中心测试项目中,NF5488A5赢得了13项性能纪录,展现出强大的竞争力。相比之下,NVIDIA DGX仅获得了5项数据中心性能纪录。值得注意的是,在之前的MLPerf训练性能测试中,NF5488A5也在关键的ResNet50训练任务中创造了性能纪录,其单机性能位居榜首。
性能提升显著,全栈AI能力突出
在此次基准测试中,浪潮AI服务器NF5488A5在开放优化(Open)和固定任务(Closed)的ResNet50基准性能测试中均表现出色,相比2019年的最佳性能提升了近3倍。NF5488A5是浪潮自主研发的新一代AI服务器,能够在4U的空间内支持8块基于安培架构的A100芯片,并通过NVLink技术实现高速互联。该服务器采用了超低延迟设计,支持PCIe 4.0全链路优化,以及高频通信单元的一级拓扑最近连接,最大限度地提高了处理器与AI芯片之间的通信性能。
此外,NF5488A5还通过配置NUMA节点,确保每颗处理器与其直连的GPU之间的通信性能达到最优,从而最大限度地降低了通信延迟。系统结构的深度优化也保证了设备在高温环境下的稳定运行。在软硬件协同优化方面,浪潮通过精细校准和全面优化CPU、GPU硬件性能,使这些组件在AI推理过程中处于最佳状态。在软件层面,浪潮优化了多GPU的轮询调度,实现了从单卡到多卡的近似线性性能扩展;在深度学习算法层面,通过自研的通道压缩算法,成功实现了模型的极致性能优化,使得在不损失精度的情况下性能提升接近两倍。
这些技术进步不仅展示了浪潮在AI计算领域的深厚积累,也为未来AI技术的发展提供了新的动力。