当前位置: 开发笔记 > 编程语言 > 正文

优化Shader中复杂数学函数的高效计算方法

作者：daadhkiw_267 | 来源：互联网 | 2024-11-15 10:39

本文介绍了在Shader中优化常见数学函数的方法，包括特化和近似计算，以提高渲染性能。这些方法适用于HDR格式和RGBE编码的优化。

本文转载自：https://zhuanlan.zhihu.com/p/130428432

前言

在学习HDR格式和RGBE编码的过程中，我萌生了一个关于优化Shader中数学函数计算的想法。虽然游戏厂商在这方面可能已经有丰富的经验，但公开的资料相对较少，因此我整理了一些相关内容。

渲染优化不仅涉及场景管理、LOD、管线优化、裁剪、分辨率和mipmaps等技术，还可以从计算层面进行优化。本文主要介绍一些常用的耗时公式的优化方法。

公式优化的基本思路是：如果库函数效率不高，可以使用特化版本或近似版本。通过不断积累，形成一个高效的快速计算数学库。

本文内容多来自IDTech6、7和GitHub上的一个开源库：

https://github.com/michaldrobot/ShaderFastLibs/blob/master/ShaderFastMathLib.h

我重新整理了一份，并添加了一些新的内容，放在GitHub上：

https://github.com/ifeuille/FastMathTests/blob/master/ShaderFastMathLib.h

前置计算机或数学基础知识关键词：ALU、Newton-Raphson迭代、IEEE

特化方法

1. pow(x)

直接使用特化版本，例如：

float pow(float x, float y) { ... }

近似方法

pow(x)

这是在IDTech6、7中看到的一种方法：

float fast_pow(float x, float y) { ... }

log2(x)

同样来自IDTech6、7：

float fast_log2(float x) { ... }

exp2(x)

这也是在IDTech6、7中看到的：

float fast_exp2(float x) { ... }

RCP

// RCP float fast_rcp(float x) { ... }

基于NR的sqrt

// 基于IEEE浮点数算法的近似值计算 float fast_sqrt(float x) { ... }

acos

使用4阶多项式逼近：

4 VGRP, 16 ALU

7*10^-5弧度精度

参考资料：Handbook of Mathematical Functions (chapter : Elementary Transcendental Functions), M. Abramowitz and I.A. Stegun, Ed.

float fast_acos(float x) { ... }

asin

使用4阶多项式逼近：

4 VGRP, 16 ALU

7*10^-5弧度精度

float fast_asin(float x) { ... }

atan

使用4阶多项式逼近：

4 VGRP, 12 ALU

7*10^-5弧度精度

参考资料：Efficient approximations for the arctangent function, Rajan, S. Sichun Wang Inkol, R. Joyal, A., May 2006

float fast_atan(float x) { ... }

参考资料

https://github.com/michaldrobot/ShaderFastLibs/blob/master/ShaderFastMathLib.h

Efficient approximations for the arctangent function, Rajan, S. Sichun Wang Inkol, R. Joyal, A., May 2006

Handbook of Mathematical Functions (chapter : Elementary Transcendental Functions), M. Abramowitz and I.A. Stegun, Ed.

https://github.com/ifeuille/FastMathTests/blob/master/ShaderFastMathLib.h

推荐阅读

main
扫描线三巨头 hdu1928hdu 1255 hdu 1542 [POJ 1151]

学习链接：http:blog.csdn.netlwt36articledetails48908031学习扫描线主要学习的是一种扫描的思想，后期可以求解很 ... [详细]

蜡笔小新 2024-12-26 20:04:36
main
优化ListView性能

本文深入探讨了如何通过多种技术手段优化ListView的性能，包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]

蜡笔小新 2024-12-28 10:36:30
blob
构建基于BERT的中文NL2SQL模型：一个简明的基准

本文探讨了将自然语言转换为SQL语句（NL2SQL）的任务，这是人工智能领域中一项非常实用的研究方向。文章介绍了笔者在公司举办的首届中文NL2SQL挑战赛中的实践，该比赛提供了金融和通用领域的表格数据，并标注了对应的自然语言与SQL语句对，旨在训练准确的NL2SQL模型。 ... [详细]

蜡笔小新 2024-12-27 17:36:19
cmd
Dockerfile 编写与 Docker 网络配置详解

本文详细介绍了 Dockerfile 的编写方法及其在网络配置中的应用，涵盖基础指令、镜像构建与发布流程，并深入探讨了 Docker 的默认网络、容器互联及自定义网络的实现。 ... [详细]

蜡笔小新 2024-12-27 17:31:41
email
JQuery基础：省市联动与表单验证

本文介绍了如何使用JQuery实现省市二级联动和表单验证。首先，通过change事件监听用户选择的省份，并动态加载对应的城市列表。其次，详细讲解了使用Validation插件进行表单验证的方法，包括内置规则、自定义规则及实时验证功能。 ... [详细]

蜡笔小新 2024-12-27 17:10:48
replace
使用 Azure Service Principal 和 Microsoft Graph API 获取 AAD 用户列表

本文介绍了一段通用代码示例，该代码不仅能够操作 Azure Active Directory (AAD)，还可以通过 Azure Service Principal 的授权访问和管理 Azure 订阅资源。Azure 的架构可以分为两个层级：AAD 和 Subscription。 ... [详细]

蜡笔小新 2024-12-27 16:07:12
replace
LeetCode 991：故障计算器的最优解法

探讨一个显示数字的故障计算器，它支持两种操作：将当前数字乘以2或减去1。本文将详细介绍如何用最少的操作次数将初始值X转换为目标值Y。 ... [详细]

蜡笔小新 2024-12-27 14:34:44
replace
Java面试题解析

本文详细介绍了Java编程语言中的核心概念和常见面试问题，包括集合类、数据结构、线程处理、Java虚拟机（JVM）、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题，帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]

蜡笔小新 2024-12-27 13:55:14
object
DNN Community 和 Professional 版本的主要差异

本文详细解析了 DotNetNuke (DNN) 的两种主要版本：Community 和 Professional。通过对比两者的功能和附加组件，帮助用户选择最适合其需求的版本。 ... [详细]

蜡笔小新 2024-12-27 13:14:08
case
HTML Attribute Naming Conventions for Fast Components

This document outlines the recommended naming conventions for HTML attributes in Fast Components, focusing on readability and consistency with existing standards. ... [详细]

蜡笔小新 2024-12-26 19:13:45
yaml
使用Python在SAE上开发新浪微博应用的初步探索

最近重新审视了新浪云平台（SAE）提供的服务，发现其已支持Python开发。本文将详细介绍如何利用Django框架构建一个简单的新浪微博应用，并分享开发过程中的关键步骤。 ... [详细]

蜡笔小新 2024-12-26 13:36:52
replace
深入解析 org.apache.xmlbeans.SchemaType.getBaseEnumType() 方法及其应用

本文详细介绍了 Java 中 org.apache.xmlbeans.SchemaType 类的 getBaseEnumType() 方法，提供了多个代码示例，并解释了其在不同场景下的使用方法。 ... [详细]

蜡笔小新 2024-12-26 11:46:55
replace
libsodium 1.0.15 发布：引入重大不兼容更新

最新发布的 libsodium 1.0.15 版本带来了若干不兼容的变更，其中包括默认密码散列算法的更改和其他重要调整。 ... [详细]

蜡笔小新 2024-12-26 11:03:58
email
ECharts线性渐变色应用实例

本文详细介绍了如何在ECharts中使用线性渐变色，通过echarts.graphic.LinearGradient方法实现。文章不仅提供了完整的代码示例，还解释了各个参数的具体含义及其应用场景。 ... [详细]

蜡笔小新 2024-12-26 08:13:53
cmd
编写有趣的VBScript恶作剧脚本

本文将介绍如何编写一些有趣的VBScript脚本，这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例，帮助您了解VBScript的基本语法和功能。 ... [详细]

蜡笔小新 2024-12-28 09:46:23

daadhkiw_267

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章