当前位置: 开发笔记 > 编程语言 > 正文

英特尔芯片上的半精度浮点运算

作者：mobiledu2502852753 | 来源：互联网 | 2022-12-19 17:00

如何解决《英特尔芯片上的半精度浮点运算》经验，为你挑选了1个好方法。

是否可以在英特尔芯片上执行半精度浮点运算？

我知道如何加载/存储/转换半精度浮点数[1],但我不知道如何在不转换为单精度浮点数的情况下添加/相乘它们.

[1] https://software.intel.com/en-us/articles/performance-benefits-of-half-precision-floats

1> Peter Cordes..：

是否可以在英特尔芯片上执行半精度浮点运算？

是的,显然是Skylake的片上GPU以及后来的FP16和FP64以及FP32的硬件支持.使用足够新的驱动程序,您可以通过OpenCL使用它.

在早期的芯片上,您可以获得与FP16相比吞吐量相同的FP32(可能只是快速转换几乎免费),但在SKL/KBL芯片上,您可以获得 GPGPU Mandelbrot FP32吞吐量的两倍(请注意对数刻度)该链接中图表的Mpix/s轴).

FP64(double)性能的提升也是巨大的.

但在IA核心(英特尔架构)没有 ; 即使使用AVX512,除了转换它们之外,没有任何硬件支持.

您当然可以实现软件浮点,甚至可能在SIMD寄存器中实现,所以从技术上讲,答案对于您提出的问题仍然是"肯定",但它不会比使用F16C VCVTPH2PS/ VCVTPS2PH指令+打包单vmulps/ vfmadd132ps硬件支持更快.

技术上是肯定但不是有用的,除了GPGPU.使用HW-支持从SIMD转换/ float/ __m256在x86代码.

@PeterCordes：有趣。[Anandtech文章]（https://www.anandtech.com/show/14179/intel-manual-updates-bfloat16-for-cooper-lake-xeon-scalable-only）和[Intel文件]（https： //software.intel.com/sites/default/files/managed/c5/15/architecture-instruction-set-extensions-programming-reference.pdf），建议BF16仅包含转换说明和点积。

推荐阅读

go
华为鲲鹏平台适配的Redis Docker镜像构建指南

本文详细介绍如何在华为鲲鹏平台上构建和使用适配ARM架构的Redis Docker镜像，解决常见错误并提供优化建议。 ... [详细]

蜡笔小新 2024-11-19 15:04:08
shell
Ubuntu 14.04 环境下搭建 Caffe（仅限 CPU）

本文详细介绍了如何在 Ubuntu 14.04 系统上搭建仅使用 CPU 的 Caffe 深度学习框架，包括环境准备、依赖安装及编译过程。 ... [详细]

蜡笔小新 2024-11-22 16:43:30
java
兆芯X86 CPU架构的演进与现状（国产CPU系列）

本文详细介绍了兆芯X86 CPU架构的发展历程，从公司成立背景到关键技术授权，再到具体芯片架构的演进，全面解析了兆芯在国产CPU领域的贡献与挑战。 ... [详细]

蜡笔小新 2024-11-14 15:04:34
go
解决 ClickOnce 部署时自动更新功能失效的问题

本文探讨了在使用 ClickOnce 部署方式时遇到的自动更新失败问题，包括本地安装与服务器安装的不同表现，并提供了详细的解决方案。 ... [详细]

蜡笔小新 2024-11-28 17:00:42
uri
微服务自动化.dockercompose

目录一、docker-compose二、docker-compose安装与配置1、修改docker.service2、下载文件3、将刚才下载的docker-compose文 ... [详细]

蜡笔小新 2024-11-25 10:14:20
uri
英特尔推出第三代至强可扩展处理器及傲腾持久内存，AI性能显著提升

英特尔在数据创新峰会上发布了第三代至强可扩展处理器和第二代傲腾持久内存，全面增强AI能力和系统性能。 ... [详细]

蜡笔小新 2024-11-17 13:07:14
uri
英特尔x86_64处理器不仅是流水线架构,还是超标量？

如何解决《英特尔x86_64处理器不仅是流水线架构,还是超标量？》经验，为你挑选了1个好方法。 ... [详细]

蜡笔小新 2023-05-25 18:19:19
uri
使用.intel_syntax使用GAS时出现错误。 - Error when using GAS with .intel_syntax

Accordingtosomedocumentationandthisanswer,itispossibletouseGASinLinuxwiththeIntels ... [详细]

蜡笔小新 2023-05-19 01:02:01
schema
Android显示时间和日期的控件的使用总结

获取年月日，之前的日期不能选择日历cCalendar.getInstance（）;获取系统的工具类【可以获取时间】DatePickerDialogdate ... [详细]

蜡笔小新 2024-11-29 17:38:31
python
Mac环境下Python与MySQL交互指南

本文详细介绍了在Mac操作系统中使用Python连接MySQL数据库的方法，包括常见的错误处理及解决方案。 ... [详细]

蜡笔小新 2024-11-26 17:41:41
shell
深入解析：Linux下的GCC编译器

GCC（GNU Compiler Collection）是GNU项目下的一款功能全面且高效的多平台编译工具，广泛应用于Linux操作系统中。本文将详细介绍GCC的特点及其基本使用方法。 ... [详细]

蜡笔小新 2024-11-26 11:20:38
go
Jupyter Notebook多语言环境搭建指南

本文详细介绍了如何在Linux环境下为Jupyter Notebook配置Python、Python3、R及Go四种编程语言的环境，包括必要的软件安装和配置步骤。 ... [详细]

蜡笔小新 2024-11-20 18:37:27
go
MongoDB 高可用集群搭建指南：分片、读写分离与负载均衡

本文详细介绍了如何搭建一个高可用的MongoDB集群，包括环境准备、用户配置、目录创建、MongoDB安装、配置文件设置、集群组件部署等步骤。特别关注分片、读写分离及负载均衡的实现。 ... [详细]

蜡笔小新 2024-11-20 18:28:16
input
Linux环境下MySQL的安装与部署指南

本文详细介绍了在Linux操作系统上安装和部署MySQL数据库的过程，包括必要的环境准备、安装步骤、配置优化及安全设置等内容。 ... [详细]

蜡笔小新 2024-11-20 18:10:53
input
探究64位Linux系统下32位程序的兼容性问题——以OpenVPN为例

本文通过分析一个具体的案例，探讨了64位Linux系统对32位应用程序的兼容性问题。案例涉及OpenVPN客户端在64位系统上的异常行为，通过逐步排查和代码测试，最终定位到了与TUN/TAP设备相关的系统调用兼容性问题。 ... [详细]

蜡笔小新 2024-11-20 16:34:58

mobiledu2502852753

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章