热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

浪潮AI服务器NF5488A5在MLPerf基准测试中刷新多项纪录

近日,国际权威AI基准测试平台MLPerf发布了最新的推理测试结果,浪潮AI服务器NF5488A5在此次测试中创造了18项性能纪录,显著提升了数据中心AI推理性能。

国际权威AI基准测试平台MLPerf近日公布了最新一轮的推理测试结果,浪潮AI服务器NF5488A5在此次测试中表现出色,共创造了18项性能纪录,在数据中心AI推理性能方面领先于其他品牌的产品。

MLPerf是全球公认的AI计算基准评测组织,由图灵奖得主大卫·帕特森(David Patterson)联合谷歌、斯坦福、哈佛大学等机构共同创立,每年组织全球范围内的AI训练和推理性能测试并发布排行榜。此次MLPerf的AI推理基准测试吸引了来自全球的23家企业和研究机构参与,涵盖了数据中心和边缘计算等多个应用场景。此前,MLPerf已于7月发布了今年的训练性能榜单。

浪潮NF5488A5在数据中心AI性能测试中表现卓越

在此次测试中,浪潮NF5488A5不仅创造了18项MLPerf推理性能纪录,成为此次测试中创纪录最多的AI服务器,还在数据中心AI性能测试中取得了显著的成绩。在22个数据中心测试项目中,NF5488A5赢得了13项性能纪录,展现出强大的竞争力。相比之下,NVIDIA DGX仅获得了5项数据中心性能纪录。值得注意的是,在之前的MLPerf训练性能测试中,NF5488A5也在关键的ResNet50训练任务中创造了性能纪录,其单机性能位居榜首。

性能提升显著,全栈AI能力突出

在此次基准测试中,浪潮AI服务器NF5488A5在开放优化(Open)和固定任务(Closed)的ResNet50基准性能测试中均表现出色,相比2019年的最佳性能提升了近3倍。NF5488A5是浪潮自主研发的新一代AI服务器,能够在4U的空间内支持8块基于安培架构的A100芯片,并通过NVLink技术实现高速互联。该服务器采用了超低延迟设计,支持PCIe 4.0全链路优化,以及高频通信单元的一级拓扑最近连接,最大限度地提高了处理器与AI芯片之间的通信性能。

此外,NF5488A5还通过配置NUMA节点,确保每颗处理器与其直连的GPU之间的通信性能达到最优,从而最大限度地降低了通信延迟。系统结构的深度优化也保证了设备在高温环境下的稳定运行。在软硬件协同优化方面,浪潮通过精细校准和全面优化CPU、GPU硬件性能,使这些组件在AI推理过程中处于最佳状态。在软件层面,浪潮优化了多GPU的轮询调度,实现了从单卡到多卡的近似线性性能扩展;在深度学习算法层面,通过自研的通道压缩算法,成功实现了模型的极致性能优化,使得在不损失精度的情况下性能提升接近两倍。

这些技术进步不仅展示了浪潮在AI计算领域的深厚积累,也为未来AI技术的发展提供了新的动力。


推荐阅读
  • 2018年3月31日,CSDN、火星财经联合中关村区块链产业联盟等机构举办的2018区块链技术及应用峰会(BTA)核心分会场圆满举行。多位业内顶尖专家深入探讨了区块链的核心技术原理及其在实际业务中的应用。 ... [详细]
  • FinOps 与 Serverless 的结合:破解云成本难题
    本文探讨了如何通过 FinOps 实践优化 Serverless 应用的成本管理,提出了首个 Serverless 函数总成本估计模型,并分享了多种有效的成本优化策略。 ... [详细]
  • 深入解析JVM垃圾收集器
    本文基于《深入理解Java虚拟机:JVM高级特性与最佳实践》第二版,详细探讨了JVM中不同类型的垃圾收集器及其工作原理。通过介绍各种垃圾收集器的特性和应用场景,帮助读者更好地理解和优化JVM内存管理。 ... [详细]
  • Valve 发布 Steam Deck 的新版 Windows 驱动程序
    Valve 最新发布了针对 Steam Deck 掌机的 Windows 驱动程序,旨在提升其在 Windows 环境下的兼容性、安全性和性能表现。 ... [详细]
  • 探讨如何通过编程技术实现100个并发连接,解决线程创建顺序问题,并提供高效的并发测试方案。 ... [详细]
  • 本文将介绍如何编写一些有趣的VBScript脚本,这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例,帮助您了解VBScript的基本语法和功能。 ... [详细]
  • 数据管理权威指南:《DAMA-DMBOK2 数据管理知识体系》
    本书提供了全面的数据管理职能、术语和最佳实践方法的标准行业解释,构建了数据管理的总体框架,为数据管理的发展奠定了坚实的理论基础。适合各类数据管理专业人士和相关领域的从业人员。 ... [详细]
  • 本文详细介绍了Java编程语言中的核心概念和常见面试问题,包括集合类、数据结构、线程处理、Java虚拟机(JVM)、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题,帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]
  • 本文详细介绍了macOS系统的核心组件,包括如何管理其安全特性——系统完整性保护(SIP),并探讨了不同版本的更新亮点。对于使用macOS系统的用户来说,了解这些信息有助于更好地管理和优化系统性能。 ... [详细]
  • 深入探讨CPU虚拟化与KVM内存管理
    本文详细介绍了现代服务器架构中的CPU虚拟化技术,包括SMP、NUMA和MPP三种多处理器结构,并深入探讨了KVM的内存虚拟化机制。通过对比不同架构的特点和应用场景,帮助读者理解如何选择最适合的架构以优化性能。 ... [详细]
  • 深入解析 Apache Shiro 安全框架架构
    本文详细介绍了 Apache Shiro,一个强大且灵活的开源安全框架。Shiro 专注于简化身份验证、授权、会话管理和加密等复杂的安全操作,使开发者能够更轻松地保护应用程序。其核心目标是提供易于使用和理解的API,同时确保高度的安全性和灵活性。 ... [详细]
  • 本文探讨了如何在日常工作中通过优化效率和深入研究核心技术,将技术和知识转化为实际收益。文章结合个人经验,分享了提高工作效率、掌握高价值技能以及选择合适工作环境的方法,帮助读者更好地实现技术变现。 ... [详细]
  • 阅读本文大约需要3分钟。微信8.0版本的发布带来了许多令人振奋的新功能,如烟花特效和改进的悬浮窗,引发了用户的热烈反响。 ... [详细]
  • 本文详细介绍了 Java 中 org.apache.xmlbeans.SchemaType 类的 getBaseEnumType() 方法,提供了多个代码示例,并解释了其在不同场景下的使用方法。 ... [详细]
  • VPX611是北京青翼科技推出的一款采用6U VPX架构的高性能数据存储板。该板卡搭载两片Xilinx Kintex-7系列FPGA作为主控单元,内置RAID控制器,支持多达8个mSATA盘,最大存储容量可达8TB,持续写入带宽高达3.2GB/s。 ... [详细]
author-avatar
tryccl
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有