热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

英特尔推出第三代至强可扩展处理器及傲腾持久内存,AI性能显著提升

英特尔在数据创新峰会上发布了第三代至强可扩展处理器和第二代傲腾持久内存,全面增强AI能力和系统性能。

【51CTO.com原创稿件】6月19日,英特尔举办了数据创新峰会暨新品发布会。受新冠疫情影响,此次发布会采用线上直播形式。会上,英特尔全球同步推出了第三代至强可扩展处理器。与前两代产品相比,第三代处理器的发布节奏更快,有助于用户受益并推动行业快速迭代。

加入Bfloat16数据格式,AI能力全面提升

自第一代至强可扩展处理器起,英特尔就注重提升CPU的AI能力。第一代处理器引入了AVX-512指令,优化了FP32计算能力;2019年发布的第二代处理器则引入了深度学习加速技术(Intel Deep Learning Boost),提升了Int8推理能力。此次,第三代至强可扩展处理器在深度学习加速技术中加入了Bfloat16数据格式,进一步增强了AI能力。

Bfloat16最初由谷歌TPU引入,现已成为加速机器学习的流行浮点格式。英特尔、ARM及众多AI芯片公司均将其视为核心功能。Bfloat16在大多数情况下具有与FP32相同的精度,但效率更高,可视为FP32的改进版本。

根据英特尔的数据,第三代至强可扩展处理器在AI性能方面表现出色。Bfloat16的加入显著提升了训练和推理能力,尤其是推理性能。与第二代处理器相比,训练性能最高提升1.96倍,推理性能最高提升1.9倍。在图像分类任务中,训练性能提升了1.93倍,推理性能提升了1.7倍。

第三代至强可扩展处理器包括白金8300系列、黄金6300和5300系列。8300系列支持四路和八路配置,最高28核心,6内存通道,最大支持单路4.5TB内存,标称TDP最高达250瓦。黄金6300和5300系列仅支持四路配置。

第三代至强可扩展处理器主要强化了安全性和多核计算性能,适用于业务关键性负载、实时分析、机器学习及混合云等工作负载。与五年前的平台相比,平均性能提升1.9倍,数据库性能最高提升1.98倍,虚拟机数量提升2.2倍。作为市场上唯一提供八路x86服务器处理器的平台,至强集成了深度学习加速功能。

对开发者而言,只需少量代码改动即可使用新平台。目前,包括阿里云、蚂蚁金服、腾讯云、东软等国内厂商已采用带有Bfloat16的处理器,推理和训练性能提升近两倍。

第二代傲腾持久内存发布:性能更强,容量更高

发布会上,英特尔还推出了新一代傲腾产品——Optane Persistent Memory 200系列,以更好地支持第三代至强可扩展处理器。与第三代至强可扩展处理器相比,傲腾产品的发布节奏明显较慢。

Optane Persistent Memory 200系列不仅容量更大,性能也更高。与上一代傲腾持久内存配合第二代至强可扩展处理器相比,带宽平均提升25%,与主流NAND SSD相比,数据传输访问效率提升225倍。

在容量方面,单路最高支持6条512GB持久内存,最大3TB持久内存。200系列在单路第三代至强可扩展处理器上可提供最高4.5TB内存,包括3TB的傲腾持久内存和普通DRAM内存。单条容量有128GB、256GB和512GB三种,支持与普通DRAM混插。

傲腾持久内存掉电不丢数据,能加速系统故障后的重启时间。大容量内存有助于支持内存数据库,减少服务器数量,从而降低License授权费用,对TCO有显著好处。

此外,英特尔还发布了D7-P5500和P5600两个系列的NAND SSD。这些SSD采用96层TLC技术,支持PCIe 4.0和NVMe 1.3c,4K随机读最高可达100万IOPS,4K随机写IOPS最高达26万,延迟显著降低。该系列SSD主要用于全闪存阵列,支持人工智能和大数据分析等IO密集型场景。这是英特尔首款PCIe 4.0 SSD,标志着市场正式转向4.0。

面向AI优化,新品FPGA-Stratix 10 NX性能大幅提升

除了第三代至强可扩展处理器和第二代傲腾持久内存,英特尔还发布了FPGA-Stratix 10 NX FPGA新产品。该产品嵌入了AI优化模块AI Tensor,数据显示,其Int8计算性能比现有Stratix 10 MX高出15倍。

Stratix 10 NX作为至强处理器的补充,专为特定应用提供定制化解决方案。英特尔重新设计了计算模块(DSP模块),使其在自然语言处理、欺诈检测、智慧城市等场景中的表现远超英伟达V100显卡。

尽管GPU在AI计算领域应用广泛,但面向AI场景设计的芯片,如Stratix 10 NX FPGA和IPU等,在某些场景下表现优于GPU。AI芯片将随着AI计算负载的变化继续演进。


推荐阅读
  • 探索电路与系统的起源与发展
    本文回顾了电路与系统的发展历程,从电的早期发现到现代电子器件的应用。文章不仅涵盖了基础理论和关键发明,还探讨了这一学科对计算机、人工智能及物联网等领域的深远影响。 ... [详细]
  • Valve 发布 Steam Deck 的新版 Windows 驱动程序
    Valve 最新发布了针对 Steam Deck 掌机的 Windows 驱动程序,旨在提升其在 Windows 环境下的兼容性、安全性和性能表现。 ... [详细]
  • 数据管理权威指南:《DAMA-DMBOK2 数据管理知识体系》
    本书提供了全面的数据管理职能、术语和最佳实践方法的标准行业解释,构建了数据管理的总体框架,为数据管理的发展奠定了坚实的理论基础。适合各类数据管理专业人士和相关领域的从业人员。 ... [详细]
  • 本文详细介绍了macOS系统的核心组件,包括如何管理其安全特性——系统完整性保护(SIP),并探讨了不同版本的更新亮点。对于使用macOS系统的用户来说,了解这些信息有助于更好地管理和优化系统性能。 ... [详细]
  • 深入探讨CPU虚拟化与KVM内存管理
    本文详细介绍了现代服务器架构中的CPU虚拟化技术,包括SMP、NUMA和MPP三种多处理器结构,并深入探讨了KVM的内存虚拟化机制。通过对比不同架构的特点和应用场景,帮助读者理解如何选择最适合的架构以优化性能。 ... [详细]
  • 非公版RTX 3080显卡的革新与亮点
    本文深入探讨了图形显卡的进化历程,重点介绍了非公版RTX 3080显卡的技术特点和创新设计。 ... [详细]
  • 本文将介绍如何编写一些有趣的VBScript脚本,这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例,帮助您了解VBScript的基本语法和功能。 ... [详细]
  • 本文详细介绍了如何在Ubuntu系统中下载适用于Intel处理器的64位版本,涵盖了不同Linux发行版对64位架构的不同命名方式,并提供了具体的下载链接和步骤。 ... [详细]
  • 基于KVM的SRIOV直通配置及性能测试
    SRIOV介绍、VF直通配置,以及包转发率性能测试小慢哥的原创文章,欢迎转载目录?1.SRIOV介绍?2.环境说明?3.开启SRIOV?4.生成VF?5.VF ... [详细]
  • 本文探讨了领域驱动设计(DDD)的核心概念、应用场景及其实现方式,详细介绍了其在企业级软件开发中的优势和挑战。通过对比事务脚本与领域模型,展示了DDD如何提升系统的可维护性和扩展性。 ... [详细]
  • 随着网络安全威胁的不断演变,电子邮件系统成为攻击者频繁利用的目标。本文详细探讨了电子邮件系统中的常见漏洞及其潜在风险,并提供了专业的防护建议。 ... [详细]
  • 本文探讨了现代信号处理系统的核心组件,包括数据转换、数据交互和数据处理。详细介绍了AD/DA转换、串/并转换、编解码转换等技术,并讨论了FPGA在信号处理中的应用及其实现方法。 ... [详细]
  • 配置Windows操作系统以确保DAW(数字音频工作站)硬件和软件的高效运行可能是一个复杂且令人沮丧的过程。本文提供了一系列专业建议,帮助你优化Windows系统,确保录音和音频处理的流畅性。 ... [详细]
  • 深入解析TCP/IP五层协议
    本文详细介绍了TCP/IP五层协议模型,包括物理层、数据链路层、网络层、传输层和应用层。每层的功能及其相互关系将被逐一解释,帮助读者理解互联网通信的原理。此外,还特别讨论了UDP和TCP协议的特点以及三次握手、四次挥手的过程。 ... [详细]
  • FinOps 与 Serverless 的结合:破解云成本难题
    本文探讨了如何通过 FinOps 实践优化 Serverless 应用的成本管理,提出了首个 Serverless 函数总成本估计模型,并分享了多种有效的成本优化策略。 ... [详细]
author-avatar
qiuyaji4379
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有