热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

浪潮AI服务器NF5488A5在MLPerf基准测试中刷新多项纪录

近日,国际权威AI基准测试平台MLPerf发布了最新的推理测试结果,浪潮AI服务器NF5488A5在此次测试中创造了18项性能纪录,显著提升了数据中心AI推理性能。

国际权威AI基准测试平台MLPerf近日公布了最新一轮的推理测试结果,浪潮AI服务器NF5488A5在此次测试中表现出色,共创造了18项性能纪录,在数据中心AI推理性能方面领先于其他品牌的产品。

MLPerf是全球公认的AI计算基准评测组织,由图灵奖得主大卫·帕特森(David Patterson)联合谷歌、斯坦福、哈佛大学等机构共同创立,每年组织全球范围内的AI训练和推理性能测试并发布排行榜。此次MLPerf的AI推理基准测试吸引了来自全球的23家企业和研究机构参与,涵盖了数据中心和边缘计算等多个应用场景。此前,MLPerf已于7月发布了今年的训练性能榜单。

浪潮NF5488A5在数据中心AI性能测试中表现卓越

在此次测试中,浪潮NF5488A5不仅创造了18项MLPerf推理性能纪录,成为此次测试中创纪录最多的AI服务器,还在数据中心AI性能测试中取得了显著的成绩。在22个数据中心测试项目中,NF5488A5赢得了13项性能纪录,展现出强大的竞争力。相比之下,NVIDIA DGX仅获得了5项数据中心性能纪录。值得注意的是,在之前的MLPerf训练性能测试中,NF5488A5也在关键的ResNet50训练任务中创造了性能纪录,其单机性能位居榜首。

性能提升显著,全栈AI能力突出

在此次基准测试中,浪潮AI服务器NF5488A5在开放优化(Open)和固定任务(Closed)的ResNet50基准性能测试中均表现出色,相比2019年的最佳性能提升了近3倍。NF5488A5是浪潮自主研发的新一代AI服务器,能够在4U的空间内支持8块基于安培架构的A100芯片,并通过NVLink技术实现高速互联。该服务器采用了超低延迟设计,支持PCIe 4.0全链路优化,以及高频通信单元的一级拓扑最近连接,最大限度地提高了处理器与AI芯片之间的通信性能。

此外,NF5488A5还通过配置NUMA节点,确保每颗处理器与其直连的GPU之间的通信性能达到最优,从而最大限度地降低了通信延迟。系统结构的深度优化也保证了设备在高温环境下的稳定运行。在软硬件协同优化方面,浪潮通过精细校准和全面优化CPU、GPU硬件性能,使这些组件在AI推理过程中处于最佳状态。在软件层面,浪潮优化了多GPU的轮询调度,实现了从单卡到多卡的近似线性性能扩展;在深度学习算法层面,通过自研的通道压缩算法,成功实现了模型的极致性能优化,使得在不损失精度的情况下性能提升接近两倍。

这些技术进步不仅展示了浪潮在AI计算领域的深厚积累,也为未来AI技术的发展提供了新的动力。


推荐阅读
  • 本文详细介绍了Java编程语言中的核心概念和常见面试问题,包括集合类、数据结构、线程处理、Java虚拟机(JVM)、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题,帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]
  • 深入解析JVM垃圾收集器
    本文基于《深入理解Java虚拟机:JVM高级特性与最佳实践》第二版,详细探讨了JVM中不同类型的垃圾收集器及其工作原理。通过介绍各种垃圾收集器的特性和应用场景,帮助读者更好地理解和优化JVM内存管理。 ... [详细]
  • Docker的安全基准
    nsitionalENhttp:www.w3.orgTRxhtml1DTDxhtml1-transitional.dtd ... [详细]
  • 本文介绍了Java并发库中的阻塞队列(BlockingQueue)及其典型应用场景。通过具体实例,展示了如何利用LinkedBlockingQueue实现线程间高效、安全的数据传递,并结合线程池和原子类优化性能。 ... [详细]
  • 深入理解 SQL 视图、存储过程与事务
    本文详细介绍了SQL中的视图、存储过程和事务的概念及应用。视图为用户提供了一种灵活的数据查询方式,存储过程则封装了复杂的SQL逻辑,而事务确保了数据库操作的完整性和一致性。 ... [详细]
  • 本文深入探讨了Linux系统中网卡绑定(bonding)的七种工作模式。网卡绑定技术通过将多个物理网卡组合成一个逻辑网卡,实现网络冗余、带宽聚合和负载均衡,在生产环境中广泛应用。文章详细介绍了每种模式的特点、适用场景及配置方法。 ... [详细]
  • 本文详细介绍了macOS系统的核心组件,包括如何管理其安全特性——系统完整性保护(SIP),并探讨了不同版本的更新亮点。对于使用macOS系统的用户来说,了解这些信息有助于更好地管理和优化系统性能。 ... [详细]
  • 2023年京东Android面试真题解析与经验分享
    本文由一位拥有6年Android开发经验的工程师撰写,详细解析了京东面试中常见的技术问题。涵盖引用传递、Handler机制、ListView优化、多线程控制及ANR处理等核心知识点。 ... [详细]
  • MySQL缓存机制深度解析
    本文详细探讨了MySQL的缓存机制,包括主从复制、读写分离以及缓存同步策略等内容。通过理解这些概念和技术,读者可以更好地优化数据库性能。 ... [详细]
  • 数据库内核开发入门 | 搭建研发环境的初步指南
    本课程将带你从零开始,逐步掌握数据库内核开发的基础知识和实践技能,重点介绍如何搭建OceanBase的开发环境。 ... [详细]
  • UNP 第9章:主机名与地址转换
    本章探讨了用于在主机名和数值地址之间进行转换的函数,如gethostbyname和gethostbyaddr。此外,还介绍了getservbyname和getservbyport函数,用于在服务器名和端口号之间进行转换。 ... [详细]
  • 本文详细探讨了Netty中Future及其子类的设计与实现,包括其在并发编程中的作用和具体应用场景。我们将介绍Future的继承体系、关键方法的实现细节,并讨论如何通过监听器和回调机制来处理异步任务的结果。 ... [详细]
  • 从零开始构建完整手机站:Vue CLI 3 实战指南(第一部分)
    本系列教程将引导您使用 Vue CLI 3 构建一个功能齐全的移动应用。我们将深入探讨项目中涉及的每一个知识点,并确保这些内容与实际工作中的需求紧密结合。 ... [详细]
  • 通过与阿里云的合作,牛客网成功解决了跨国视频面试中的网络卡顿问题,为求职者和面试官提供了更加流畅的沟通体验。 ... [详细]
  • 深入探讨CPU虚拟化与KVM内存管理
    本文详细介绍了现代服务器架构中的CPU虚拟化技术,包括SMP、NUMA和MPP三种多处理器结构,并深入探讨了KVM的内存虚拟化机制。通过对比不同架构的特点和应用场景,帮助读者理解如何选择最适合的架构以优化性能。 ... [详细]
author-avatar
tryccl
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有