快速平方根倒数算法

作者：手机用户2602938185 | 来源：互联网 | 2023-09-07 16:16

原文很以前久，看《DOOM启示录》的时候就看到，当年卡马克大神在《雷神之锤》中使用了一个神奇的数字，能够通过位操作快速计算平方根倒数y1x√。但是当时并没有深究，这两天偶然看到了这篇文章，终于将

原文

很以前久，看《DOOM启示录》的时候就看到，当年卡马克大神在《雷神之锤》中使用了一个神奇的数字，能够通过位操作快速计算平方根倒数 y=1x√ 。但是当时并没有深究，这两天偶然看到了这篇文章，终于将我这个多年的“未解之谜”解开了，特此做下笔记，图片取自原文。

代码实现
首先是这个神奇算法的代码：

float fast_inverse_sqrt(float x)
{
float half_x = 0.5 * x;
int i = ((int )&x); // 以整数方式读取X
i = 0x5f3759df - (i>>1); // 神奇的步骤
x = ((float )&i); // 再以浮点方式读取i
x = x(1.5 - (half_x x * x)); // 牛顿迭代一遍提高精度
return x;
}
其中最最重要的就是第二步，通过这个神奇的步骤，能够得到x平方根倒数的近似值。前后穿插着用整型读取浮点数等等，实在是不知所云。但实际上，其中包含着很有意思的数学背景（每次一提到数学，我就觉得好方）。

背后的数学
首先来重新温习一下机组里面的浮点数基础知识（机组60分默默飘过）。

单精度浮点数
单精度浮点数有32bit，包括1位符号位s，8位指数位e，23位尾数位m（赞一下CSDN的markdown编辑器的latex数学公式的功能~)：

s e⋯e8 m⋯m23
其表示的数值为： (1+m′)2e′ ，这里的m’代表尾数部分的数值，m’只包含小数位，即 m′=0.m⋯m23 ，e’则是指数部分的数值，只有整数位， e′=e⋯e8−B 。为了表示负的指数，指数部分要减去一个偏移量B。
再规定M表示以整数方式解释尾数二进制位的值，E表示相同的方式解释指数部分的值。可以得到以下的转换关系：

m′=MLL=223
e′=E−BB=127
那么对于一个浮点数的二进制位 s e⋯e8 m⋯m23 以整数方式解读的话，其值就为： I=EL+M （因为平方根输入只能为正，所以默认s为0）。

平方根倒数近似计算
下面开始进入正题：
对于输入x，我们要计算的是 y=1x√ ，将该式子两边取对数： log2(y)=−12log2(x) 。然后我们将x，y都替换为浮点数表示形式：

log2((1+m′y)2e′y)=−12log2((1+m′x)2e′x)
log2(1+m′y)+e′y=−12(log2(1+m′x)+e′x)
观察发现，上式等号两边均有 log2(1+v) 形式的式子，v的范围是0到1，而该式在这个定义域内的函数图像非常接近一条直线：

这里写图片描述

因此我们近似的用 x+σ 替换得到：

m′y+σ+e′y=−12(m′x+σ+e′x)
σ 为预先计算的一个常数。接下来将数值转为整形方式读取二进制位的形式：

MyL+σ+Ey−B=−12(MxL+σ+Ex−B)
移项合并后得到：

32L(σ−B)+My+LEy=−12(Mx+LEx)
恰好我们又发现，在等式的两边都含有以整数方式解释浮点数的表示 I=M+LE ，进一步化简有：

Iy=−12Ix+κκ=32L(B−σ)
由此，我们得到了一个比较有用的近似公式， κ 便是神奇的数字0x5f3759df 。该公式表明计算x的平方根倒数时，我们只需要用整型方式读取x，再代入上式计算得到结果的整形解释值，然后再用浮点数方式读取即可！我当时就震惊了。

牛顿迭代提高精度
经过上一步，我们有了初步的近似结果，为了进一步提高精度，我们再用牛顿迭代法计算一次。牛顿迭代法描述的是，给定连续函数f(x)，对于方程f(x)=0，确定任意初始的 x0 ，我们可以通过下面这个迭代式计算得到其解：

xn+1=xn−f(xn)f′(xn)
我们要计算的式子为 y=1x0√，x0 为已知（这个 x0 是指输入，不是牛顿迭代的初始值），将其转换为关于y的方程就是 f(y)=1y2−x0=0 ，根据牛顿迭代可得：

yn+1=yn−1y2n−x0−2y3n
yn+1=32yn−12x0y3n
也就是最后一步的代码了。

这里写图片描述

更多讨论
上述推导过程中可以看出，不同次方根在我们的计算中仅仅是作为一个因子而存在的，因此将该近似算法完全可以推广到其他次方根的情况下。另外，对于64位浮点数，我们也可以采用完全相同的推导过程来得到相似的结果。这只是一个近似算法，它与真实计算值之间的偏差与神奇数字的取值有很微妙的关系，这篇博客对这个问题进行了一些讨论。

真是神奇的算法！

推荐阅读

ascii
网络留言簿用户登录页面设计

用户登录 ... [详细]

蜡笔小新 2023-10-15 19:18:28
bit
Android开发笔记：使用Picasso加载网络图片等比例缩放

在Android开发中，使用Picasso库可以实现对网络图片的等比例缩放。本文介绍了使用Picasso库进行图片缩放的方法，并提供了具体的代码实现。通过获取图片的宽高，计算目标宽度和高度，并创建新图实现等比例缩放。 ... [详细]

蜡笔小新 2023-12-14 17:34:00
format
【机器学习】生成式对抗网络模型综述

生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型，可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]

蜡笔小新 2023-12-14 17:51:18
text
CSS3选择器的使用方法详解，提高Web开发效率和精准度

本文详细介绍了CSS3新增的选择器方法，包括属性选择器的使用。通过CSS3选择器，可以提高Web开发的效率和精准度，使得查找元素更加方便和快捷。同时，本文还对属性选择器的各种用法进行了详细解释，并给出了相应的代码示例。通过学习本文，读者可以更好地掌握CSS3选择器的使用方法，提升自己的Web开发能力。 ... [详细]

蜡笔小新 2023-12-14 14:37:52
bit
C#生成随机数的三种方法及其问题分析

本文介绍了C#中生成随机数的三种方法，并分析了其中存在的问题。首先介绍了使用Random类生成随机数的默认方法，但在高并发情况下可能会出现重复的情况。接着通过循环生成了一系列随机数，进一步突显了这个问题。文章指出，随机数生成在任何编程语言中都是必备的功能，但Random类生成的随机数并不可靠。最后，提出了需要寻找其他可靠的随机数生成方法的建议。 ... [详细]

蜡笔小新 2023-12-14 14:15:30
function
[译]技术公司十年经验的职场生涯回顾

本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同，令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望，认为人类有能力不断改善自己。 ... [详细]

蜡笔小新 2023-12-14 11:31:05
format
sklearn数据集库中的常用数据集类型介绍

本文介绍了sklearn数据集库中常用的数据集类型，包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集，包含了波士顿506处房屋的13种不同特征以及房屋价格，适用于回归任务。 ... [详细]

蜡笔小新 2023-12-13 17:45:15
bit
关于数论的开发笔记

本文由编程笔记#小编整理，主要介绍了关于数论相关的知识，包括数论的算法和百度百科的链接。文章还介绍了欧几里得算法、辗转相除法、gcd、lcm和扩展欧几里得算法的使用方法。此外，文章还提到了数论在求解不定方程、模线性方程和乘法逆元方面的应用。摘要长度：184字。 ... [详细]

蜡笔小新 2023-12-11 17:31:53
bit
Java 11相对于Java 8，OptaPlanner性能提升有多大？

本文通过基准测试比较了Java 11和Java 8对OptaPlanner的性能提升。测试结果表明，在相同的硬件环境下，Java 11相对于Java 8在垃圾回收方面表现更好，从而提升了OptaPlanner的性能。 ... [详细]

蜡笔小新 2023-12-11 10:59:22
sum
Android自定义控件绘图篇之Paint函数大汇总

本文介绍了Android自定义控件绘图篇中的Paint函数大汇总，包括重置画笔、设置颜色、设置透明度、设置样式、设置宽度、设置抗锯齿等功能。通过学习这些函数，可以更好地掌握Paint的用法。 ... [详细]

蜡笔小新 2023-12-10 23:11:57
bit
Android开发优化之软引用与弱引用的应用

本文介绍了在Android开发中使用软引用和弱引用的应用。如果一个对象只具有软引用，那么只有在内存不够的情况下才会被回收，可以用来实现内存敏感的高速缓存；而如果一个对象只具有弱引用，不管内存是否足够，都会被垃圾回收器回收。软引用和弱引用还可以与引用队列联合使用，当被引用的对象被回收时，会将引用加入到关联的引用队列中。软引用和弱引用的根本区别在于生命周期的长短，弱引用的对象可能随时被回收，而软引用的对象只有在内存不够时才会被回收。 ... [详细]

蜡笔小新 2023-12-10 16:33:12
format
关于ueditor富文本编辑器出现目录创建失败解决方案

在tp5项目中引入ueditor编辑器并实例化后插入图片出现目录创建失败问题在查看网络上各种解决方案之后总结如下：根据官网提示主要是因为图片保存的路径无权限导致，官方文档链接:ht ... [详细]

蜡笔小新 2023-10-17 20:15:53
format
简单了解markdown语法

Markdown语法标题三个“#”表示三级标题四个“#”表示四级标题字体粗体左右加俩“*”斜体左右加一’‘*“粗斜体左右加三个”*“表示删掉用俩波浪线引用加空格分割线图片![ ... [详细]

蜡笔小新 2023-10-16 14:37:32
const
伊振华作品 | 沈阳市智慧城市运行管理中心的设计与建设

本文介绍了设计师伊振华受邀参与沈阳市智慧城市运行管理中心项目的整体设计，并以数字赋能和创新驱动高质量发展的理念，建设了集成、智慧、高效的一体化城市综合管理平台，促进了城市的数字化转型。该中心被称为当代城市的智能心脏，为沈阳市的智慧城市建设做出了重要贡献。 ... [详细]

蜡笔小新 2023-12-14 16:35:39
const
P1651 塔 (动态规划) 的最大高度计算方法

本文介绍了P1651题目的描述和要求，以及计算能搭建的塔的最大高度的方法。通过动态规划和状压技术，将问题转化为求解差值的问题，并定义了相应的状态。最终得出了计算最大高度的解法。 ... [详细]

蜡笔小新 2023-12-13 19:52:19

手机用户2602938185

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章