作者:qiuyaji4379 | 来源:互联网 | 2024-11-17 13:07
【51CTO.com原创稿件】6月19日,英特尔举办了数据创新峰会暨新品发布会。受新冠疫情影响,此次发布会采用线上直播形式。会上,英特尔全球同步推出了第三代至强可扩展处理器。与前两代产品相比,第三代处理器的发布节奏更快,有助于用户受益并推动行业快速迭代。
加入Bfloat16数据格式,AI能力全面提升
自第一代至强可扩展处理器起,英特尔就注重提升CPU的AI能力。第一代处理器引入了AVX-512指令,优化了FP32计算能力;2019年发布的第二代处理器则引入了深度学习加速技术(Intel Deep Learning Boost),提升了Int8推理能力。此次,第三代至强可扩展处理器在深度学习加速技术中加入了Bfloat16数据格式,进一步增强了AI能力。
Bfloat16最初由谷歌TPU引入,现已成为加速机器学习的流行浮点格式。英特尔、ARM及众多AI芯片公司均将其视为核心功能。Bfloat16在大多数情况下具有与FP32相同的精度,但效率更高,可视为FP32的改进版本。
根据英特尔的数据,第三代至强可扩展处理器在AI性能方面表现出色。Bfloat16的加入显著提升了训练和推理能力,尤其是推理性能。与第二代处理器相比,训练性能最高提升1.96倍,推理性能最高提升1.9倍。在图像分类任务中,训练性能提升了1.93倍,推理性能提升了1.7倍。
第三代至强可扩展处理器包括白金8300系列、黄金6300和5300系列。8300系列支持四路和八路配置,最高28核心,6内存通道,最大支持单路4.5TB内存,标称TDP最高达250瓦。黄金6300和5300系列仅支持四路配置。
第三代至强可扩展处理器主要强化了安全性和多核计算性能,适用于业务关键性负载、实时分析、机器学习及混合云等工作负载。与五年前的平台相比,平均性能提升1.9倍,数据库性能最高提升1.98倍,虚拟机数量提升2.2倍。作为市场上唯一提供八路x86服务器处理器的平台,至强集成了深度学习加速功能。
对开发者而言,只需少量代码改动即可使用新平台。目前,包括阿里云、蚂蚁金服、腾讯云、东软等国内厂商已采用带有Bfloat16的处理器,推理和训练性能提升近两倍。
第二代傲腾持久内存发布:性能更强,容量更高
发布会上,英特尔还推出了新一代傲腾产品——Optane Persistent Memory 200系列,以更好地支持第三代至强可扩展处理器。与第三代至强可扩展处理器相比,傲腾产品的发布节奏明显较慢。
Optane Persistent Memory 200系列不仅容量更大,性能也更高。与上一代傲腾持久内存配合第二代至强可扩展处理器相比,带宽平均提升25%,与主流NAND SSD相比,数据传输访问效率提升225倍。
在容量方面,单路最高支持6条512GB持久内存,最大3TB持久内存。200系列在单路第三代至强可扩展处理器上可提供最高4.5TB内存,包括3TB的傲腾持久内存和普通DRAM内存。单条容量有128GB、256GB和512GB三种,支持与普通DRAM混插。
傲腾持久内存掉电不丢数据,能加速系统故障后的重启时间。大容量内存有助于支持内存数据库,减少服务器数量,从而降低License授权费用,对TCO有显著好处。
此外,英特尔还发布了D7-P5500和P5600两个系列的NAND SSD。这些SSD采用96层TLC技术,支持PCIe 4.0和NVMe 1.3c,4K随机读最高可达100万IOPS,4K随机写IOPS最高达26万,延迟显著降低。该系列SSD主要用于全闪存阵列,支持人工智能和大数据分析等IO密集型场景。这是英特尔首款PCIe 4.0 SSD,标志着市场正式转向4.0。
面向AI优化,新品FPGA-Stratix 10 NX性能大幅提升
除了第三代至强可扩展处理器和第二代傲腾持久内存,英特尔还发布了FPGA-Stratix 10 NX FPGA新产品。该产品嵌入了AI优化模块AI Tensor,数据显示,其Int8计算性能比现有Stratix 10 MX高出15倍。
Stratix 10 NX作为至强处理器的补充,专为特定应用提供定制化解决方案。英特尔重新设计了计算模块(DSP模块),使其在自然语言处理、欺诈检测、智慧城市等场景中的表现远超英伟达V100显卡。
尽管GPU在AI计算领域应用广泛,但面向AI场景设计的芯片,如Stratix 10 NX FPGA和IPU等,在某些场景下表现优于GPU。AI芯片将随着AI计算负载的变化继续演进。