热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

优化Shader中复杂数学函数的高效计算方法

本文介绍了在Shader中优化常见数学函数的方法,包括特化和近似计算,以提高渲染性能。这些方法适用于HDR格式和RGBE编码的优化。

本文转载自:https://zhuanlan.zhihu.com/p/130428432

前言

在学习HDR格式和RGBE编码的过程中,我萌生了一个关于优化Shader中数学函数计算的想法。虽然游戏厂商在这方面可能已经有丰富的经验,但公开的资料相对较少,因此我整理了一些相关内容。

渲染优化不仅涉及场景管理、LOD、管线优化、裁剪、分辨率和mipmaps等技术,还可以从计算层面进行优化。本文主要介绍一些常用的耗时公式的优化方法。

公式优化的基本思路是:如果库函数效率不高,可以使用特化版本或近似版本。通过不断积累,形成一个高效的快速计算数学库。

本文内容多来自IDTech6、7和GitHub上的一个开源库:

https://github.com/michaldrobot/ShaderFastLibs/blob/master/ShaderFastMathLib.h

我重新整理了一份,并添加了一些新的内容,放在GitHub上:

https://github.com/ifeuille/FastMathTests/blob/master/ShaderFastMathLib.h

前置计算机或数学基础知识关键词:ALU、Newton-Raphson迭代、IEEE

特化方法

1. pow(x)

直接使用特化版本,例如:

float pow(float x, float y) { ... }

近似方法

pow(x)

这是在IDTech6、7中看到的一种方法:

float fast_pow(float x, float y) { ... }

log2(x)

同样来自IDTech6、7:

float fast_log2(float x) { ... }

exp2(x)

这也是在IDTech6、7中看到的:

float fast_exp2(float x) { ... }

RCP

// RCP
float fast_rcp(float x) { ... }

基于NR的sqrt

// 基于IEEE浮点数算法的近似值计算
float fast_sqrt(float x) { ... }

acos

使用4阶多项式逼近:

4 VGRP, 16 ALU

7*10^-5弧度精度

参考资料:Handbook of Mathematical Functions (chapter : Elementary Transcendental Functions), M. Abramowitz and I.A. Stegun, Ed.

float fast_acos(float x) { ... }

asin

使用4阶多项式逼近:

4 VGRP, 16 ALU

7*10^-5弧度精度

float fast_asin(float x) { ... }

atan

使用4阶多项式逼近:

4 VGRP, 12 ALU

7*10^-5弧度精度

参考资料:Efficient approximations for the arctangent function, Rajan, S. Sichun Wang Inkol, R. Joyal, A., May 2006

float fast_atan(float x) { ... }

参考资料

https://github.com/michaldrobot/ShaderFastLibs/blob/master/ShaderFastMathLib.h

Efficient approximations for the arctangent function, Rajan, S. Sichun Wang Inkol, R. Joyal, A., May 2006

Handbook of Mathematical Functions (chapter : Elementary Transcendental Functions), M. Abramowitz and I.A. Stegun, Ed.

https://github.com/ifeuille/FastMathTests/blob/master/ShaderFastMathLib.h


推荐阅读
  • 扫描线三巨头 hdu1928hdu 1255  hdu 1542 [POJ 1151]
    学习链接:http:blog.csdn.netlwt36articledetails48908031学习扫描线主要学习的是一种扫描的思想,后期可以求解很 ... [详细]
  • 优化ListView性能
    本文深入探讨了如何通过多种技术手段优化ListView的性能,包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]
  • 构建基于BERT的中文NL2SQL模型:一个简明的基准
    本文探讨了将自然语言转换为SQL语句(NL2SQL)的任务,这是人工智能领域中一项非常实用的研究方向。文章介绍了笔者在公司举办的首届中文NL2SQL挑战赛中的实践,该比赛提供了金融和通用领域的表格数据,并标注了对应的自然语言与SQL语句对,旨在训练准确的NL2SQL模型。 ... [详细]
  • 本文详细介绍了 Dockerfile 的编写方法及其在网络配置中的应用,涵盖基础指令、镜像构建与发布流程,并深入探讨了 Docker 的默认网络、容器互联及自定义网络的实现。 ... [详细]
  • 本文介绍了如何使用JQuery实现省市二级联动和表单验证。首先,通过change事件监听用户选择的省份,并动态加载对应的城市列表。其次,详细讲解了使用Validation插件进行表单验证的方法,包括内置规则、自定义规则及实时验证功能。 ... [详细]
  • 使用 Azure Service Principal 和 Microsoft Graph API 获取 AAD 用户列表
    本文介绍了一段通用代码示例,该代码不仅能够操作 Azure Active Directory (AAD),还可以通过 Azure Service Principal 的授权访问和管理 Azure 订阅资源。Azure 的架构可以分为两个层级:AAD 和 Subscription。 ... [详细]
  • 探讨一个显示数字的故障计算器,它支持两种操作:将当前数字乘以2或减去1。本文将详细介绍如何用最少的操作次数将初始值X转换为目标值Y。 ... [详细]
  • 本文详细介绍了Java编程语言中的核心概念和常见面试问题,包括集合类、数据结构、线程处理、Java虚拟机(JVM)、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题,帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]
  • DNN Community 和 Professional 版本的主要差异
    本文详细解析了 DotNetNuke (DNN) 的两种主要版本:Community 和 Professional。通过对比两者的功能和附加组件,帮助用户选择最适合其需求的版本。 ... [详细]
  • This document outlines the recommended naming conventions for HTML attributes in Fast Components, focusing on readability and consistency with existing standards. ... [详细]
  • 使用Python在SAE上开发新浪微博应用的初步探索
    最近重新审视了新浪云平台(SAE)提供的服务,发现其已支持Python开发。本文将详细介绍如何利用Django框架构建一个简单的新浪微博应用,并分享开发过程中的关键步骤。 ... [详细]
  • 本文详细介绍了 Java 中 org.apache.xmlbeans.SchemaType 类的 getBaseEnumType() 方法,提供了多个代码示例,并解释了其在不同场景下的使用方法。 ... [详细]
  • libsodium 1.0.15 发布:引入重大不兼容更新
    最新发布的 libsodium 1.0.15 版本带来了若干不兼容的变更,其中包括默认密码散列算法的更改和其他重要调整。 ... [详细]
  • 本文详细介绍了如何在ECharts中使用线性渐变色,通过echarts.graphic.LinearGradient方法实现。文章不仅提供了完整的代码示例,还解释了各个参数的具体含义及其应用场景。 ... [详细]
  • 本文将介绍如何编写一些有趣的VBScript脚本,这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例,帮助您了解VBScript的基本语法和功能。 ... [详细]
author-avatar
daadhkiw_267
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有