动态范围控制原理

作者：H-蔡鸿晖_515 | 来源：互联网 | 2023-09-23 19:45

DRC介绍开门见山，动态范围的定义就是信号的最大幅值和最小幅值比值的对数(单位dB)，动态范围会受到系统中各个环节的影响。例如同样是这段音乐࿰

DRC介绍

　　开门见山&＃xff0c;动态范围的定义就是信号的最大幅值和最小幅值比值的对数(单位dB)&＃xff0c;

　　动态范围会受到系统中各个环节的影响。例如同样是这段音乐&＃xff0c;在一个40dB背景噪声的环境中播放&＃xff0c;那么由于掩蔽效应等因素的影响&＃xff0c;最终实际听到的音乐动态范围实际上是50dB。

　　动态范围会受到系统中各个环节的影响。例如同样是这段音乐&＃xff0c;在一个40dB背景噪声的环境中播放&＃xff0c;那么由于掩蔽效应等因素的影响&＃xff0c;最终实际听到的音乐动态范围实际上是50dB。如果对响度和动态范围感兴趣的可以移步看鬼斧神工的文章《详解音频中的响度与动态范围。(推力、耳放、响度战争、高解析度等)》

　　动态范围控制(Dynamic Range Control&＃xff0c;DRC)将输入音频信号的动态范围映射到指定的动态范围&＃xff0c;可以使声音听起来更柔和或更大声&＃xff0c;即一种信号幅度调节方式。通常映射后的动态范围小于映射前的动态范围&＃xff0c;因此称之为动态范围压缩。音频信号可以进行整体的动态范围控制&＃xff0c;也可以划分为若干子带分别进行动态范围控制。DRC广泛应用于音频信号处理领域&＃xff0c;例如助听器中最常见的宽动态范围压缩方法(Wide Dynamic Range Compression&＃xff0c;WDRC)、音频信号处理中最常用的自动增益控制(Automatic Gain Control&＃xff0c;AGC)方法等。DRC侧重于从数字域上对增益进行有选择、有目的地调整&＃xff0c;以保证最大信号有合适的headroom&＃xff0c;中间信号得到合适的amplify&＃xff0c;小信号或者底噪被cutoff掉。

作用

将音频信号电平与其环境相匹配
对输入的忽大忽小语音进行动态拉伸&＃xff0c;使语音听起来平稳。
抑制低电平噪声&＃xff0c;避免噪声在后续模块AGC中被放大。
保护 AD 转换器免受过载
优化信息&＃xff1b;也就是使音频信号使用到满幅的动态范围&＃xff1b;

动态范围控制的类型

动态范围压缩器(Dynamic range compressor)&＃xff1a;衰减超过给定阈值声音的音量&＃xff1b;通常用于录音系统以保护硬件并提高整体响度。
动态范围限幅器(Dynamic range limiter)&＃xff1a;是压缩器的一种&＃xff0c;可以限制超过给定阈值的信号&＃xff1b;
动态范围扩展器(Dynamic range expander)&＃xff1a;衰减低于给定阈值的安静声音音量。它们通常用于使安静的声音更加安静。
噪声门(Noise gate)&＃xff1a;是扩展器的一种&＃xff0c;可以限制声音低于给定阈值

DRC的增益调整基本上是三段&＃xff1a;对底噪&＃xff0c;中等幅度信号&＃xff0c;幅度较大的信号的三段不同的处理&＃xff0c;比如&＃xff1a;

底噪&＃xff1a;Cutoff&＃xff0c;attenuation
中等幅度信号&＃xff1a;Expander
幅度较大&＃xff0c;防止削顶的&＃xff1a;Limiter

　　整体而言算法较为简单&＃xff0c;其中最关键的地方在于曲线的设计。DRC的曲线一般具备下图这样的结构&＃xff0c;该图表示的是来滤除小信号的曲线图&＃xff0c;如果想要动态拉伸的功能&＃xff0c;那么整体曲线需要高于$y&＃61;x$这条直线。

静态曲线(图片来自《Digital Audio Signal Processing-Udo Zölzer》第七章)

名词解释

NT&＃xff1a;噪声门限(Noise Gate)&＃xff0c;低于NT的输入信号将会被滤除
LT&＃xff1a;限制器阈值(Limiter threshold)&＃xff0c;高于CT且低于LT的信号也会被压缩&＃xff0c;而高于LT的信号将会被直接限幅
CT&＃xff1a;压缩器阈值(Compressor threshold)&＃xff0c;高于ET且低于CT的信号将会保持不变
ET&＃xff1a;扩展器阈值(Expander threshold)&＃xff0c;高于NT且低于ET的信号将会被抑制

MALTAB的Audio Toolbox中实现了动态范围压缩器、动态范围限幅器、动态范围扩展器和噪声门。本教程还提供了动态范围限制器各个阶段的动态范围限制示例。

基本原理

　　DRC的原理其实很简单&＃xff0c;就是通过设计一条曲线&＃xff0c;将输入语音幅度$x(n)$通过曲线进行映射得到另一语音幅度值$y(n)$。然后计算两者之间的差值得到增益值$g_c(n)$&＃xff0c;然后根据设置的attack time和release time进行增益平滑以及计算make-up增益&＃xff0c;最后再应用到语音得到处理后的语音。基本流程如下

通用的动态范围控制系统 (来自Matlab官网)

1、线性到dB转换

从线性值转换为dB值

$$x_{dB}(n) &＃61; 20log_{10}(x(n))$$

2、计算增益

通过将$x_{dB}(n) $信号传递到静态特征方程(DRC静态曲线)&＃xff0c;假设设计的曲线函数关系为$f(x)$

$$x_{sc}(x_{db})&＃61;f(x_{db}(n))$$

计算差值&＃xff1a;$g_c(n)&＃61;x_{sc}(n)-x_{dB}(n)$

不同类型的DRC都具有不同的静态特征和不同的可调属性&＃xff1a;

Threshold&＃xff1a;所有的静态特性都有一个阈值。在阈值的一侧&＃xff0c;信号不变。在阈值的另一侧&＃xff0c;应用compression, expansion, limiting, 或 gating。
Ratio&＃xff1a;Expanders 和 compressors 使您能够将静态特性的输入输出比调整为高于或低于给定阈值。
KneeWidth&＃xff1a;expander、compressors和 limiters 使您能够调整静态特性的拐点宽度。静态特性的拐点以阈值为中心。knee width的增加会在阈值周围产生更平滑的过渡。knee width为零不提供平滑&＃xff0c;称为硬拐点(hard knee)。knee width大于零被称为软拐点(soft knee)。

在下面这些静态特性图中&＃xff0c;expander、limiter和compressor 各有一个 knee width 的拐点宽度。

3、增益平滑

　　增益平滑减少了增益的急剧变化&＃xff0c;避免伪像和不自然的声音。expander和noiseGate具有相同的平滑方程(都是扩展器)&＃xff0c;limiter和compressor具有相同的平滑方程(都是压缩器)。

　　增益平滑的类型由启动时间(attack time)、释放时间(release time)和保持时间(hold time)组合指定。启动时间和释放时间对应于增益信号从其最终值的10%上升到90%所需的时间。保持时间是应用增益之前的延迟时间。

expander 和 noiseGate 的平滑方程

$$g_s[n]&＃61;\left\{\begin{array}{cl}
\alpha_A g_s[n-1]&＃43;\left(1-\alpha_A\right) g_c[n] & \text { if }\left(C_A>k\right) \&\left(g_c[n] \leq g_s[n-1]\right) \\
g_S[n-1] & \text { if } C_A \leq k \\
\alpha_{R}g_s[n-1]&＃43;\left(1-\alpha_R\right) g_c[n] & \text { if }\left(C_R>k\right) \&\left(g_c[n]>g_s[n-1]\right) \\
g_S[n-1] & \text { if } C_R \leq k
\end{array}\right.$$

$\alpha_A$和$\alpha_R$由采样率和指定的启动和释放时间确认&＃xff1a;$\alpha_A&＃61;exp(\frac{-log(9)}{Fs*T_A})$&＃xff0c;$\alpha_R&＃61;exp(\frac{-log(9)}{Fs*T_R})$

$k$是以样本为单位的指定保持时间。$C_A$和$C_R$分别是启动和释放hold counters

compressor 和 limiter 的平滑方程

$$g_s(n)&＃61;\left\{\begin{matrix}
a_Ag_s(n-1)&＃43;(1-\alpha_A)g_c(n),\ \ g_c\le g_s(n-1) \\
a_Rg_s(n-1)&＃43;(1-\alpha_R)g_c(n),\ \ g_c > g_s(n-1)
\end{matrix}\right.$$

$\alpha_A$和$\alpha_R$由采样率和指定的启动和释放时间确认&＃xff1a;$\alpha_A&＃61;exp(\frac{-log(9)}{Fs*T_A})$&＃xff0c;$\alpha_R&＃61;exp(\frac{-log(9)}{Fs*T_R})$

增益平滑实例

输入信号两步动态范围压缩的一个简单案例。在此示例中&＃xff0c;压缩器的阈值为 –10 dB&＃xff0c;压缩比为 5&＃xff0c;拐点较硬。

下图为了显示了增益平滑的几种变化。

在顶部&＃xff0c;显示了针对不同启动时间值的平滑增益曲线&＃xff0c;释放时间设置为零秒
在中间&＃xff0c;释放时间是变化的&＃xff0c;启动时间保持在零秒不变
在底部&＃xff0c;启动和释放时间均由非零值指定

4、补偿增益(make-up gain)

　　补偿增益适用于compressors 和 limiters&＃xff0c;其中信号的较高 dB 部分被衰减或阻塞。dB 降低会显著降低总信号功率。在这些情况下&＃xff0c;增益平滑后应用补偿增益以增加信号功率。在MATLAB的 Audio Toolbox 中&＃xff0c;可以指定一个设定的补偿量或将补偿模式指定为&＃39;auto&＃39;。

&＃39;auto&＃39;补偿增益确保 0 dB 输入产生 0 dB 输出。例如&＃xff0c;假设具有软拐点的compressors 的静态特性&＃xff1a;

$$x_{s c}\left(x_{d B}\right)&＃61;\left\{\begin{array}{cc}
x_{d B} & x_{d B}<\left(T-\frac{W}{2}\right) \\
x_{d B}&＃43;\frac{\left(\frac{1}{R}-1\right)\left(x_{d B}-T&＃43;\frac{W}{2}\right)^2}{2 W} & \left(T-\frac{W}{2}\right) \leq x_{d B} \leq\left(T&＃43;\frac{W}{2}\right) \\
T&＃43;\frac{\left(x_{d B}-T\right)}{R} & x_{d B}>\left(T&＃43;\frac{W}{2}\right)
\end{array}\right.$$

$T$是threshold&＃xff0c;$W$是knee width&＃xff0c;$R$是compression ratio。计算出的自动补偿增益是在 0 dB 时评估的静态特性方程的负值&＃xff1a;

$$\text { MAKE-UP GAIN }&＃61;-x_{s c}(0)&＃61;\left\{\begin{array}{cl}
0 & \frac{W}{2}-\frac{\left(\frac{1}{R}-1\right)\left(T-\frac{W}{2}\right)^2}{2 W} & -\frac{W}{2} \leq T \leq \frac{W}{2} \\
-T&＃43;\frac{T}{R} & -\frac{W}{2}>T
\end{array}\right.$$

5、dB到线性转换

将增益从dB域变换到线性域&＃xff1a;$g_{lin}(n)&＃61;10^{\frac{g_m(n)}{20}}$

6、应用增益

$$y(n)&＃61;x(n)*g_{lin}(n)$$

栗子

示例&＃xff1a;动态范围限制器

本例中描述的音频信号是 0.5 秒间隔的鼓音。limiter属性是&＃xff1a;

Threshold &＃61; –15 dB
Knee width &＃61; 0(硬膝盖)
Attack time &＃61; 0.004 秒
Release time &＃61; 0.1 秒
Make-up gain &＃61; 1 dB

此示例提供了动态范围限制器系统各个阶段的可视化演练。

线性到 dB 转换

增益计算

静态特性将 dB 信号限制在 –15 dB。为了确定导致此限制的 dB 增益&＃xff0c;增益计算从静态特性处理的 dB 信号中减去原始 dB 信号。

增益平滑

当所应用的增益突然增加时&＃xff0c;相对较短的启动时间规格会导致陡峭的曲线。相对较长的释放时间会导致应用增益逐渐减小。

补偿增益

假设限制器具有 1 dB 补偿增益值。补偿增益被添加到平滑增益信号。

dB 到线性转换

以 dB 为单位的增益逐个元素转换为线性标度。

应用计算增益

原始信号乘以线性增益

参考

【书籍】Digital Audio Signal Processing 2nd Edition

【音频探险记】DRC--动态范围控制

【MATLAB】Dynamic Range Control

【MATLAB】Multiband Dynamic Range Compression

【知乎】详解音频中的响度与动态范围。(推力、耳放、响度战争、高解析度等)

【论文】Zolzer, Udo. "Dynamic Range Control." Digital Audio Signal Processing. 2nd ed. Chichester, UK: Wiley, 2008.

【论文】Giannoulis, Dimitrios, Michael Massberg, and Joshua D. Reiss. "Digital Dynamic Range Compressor Design –– A Tutorial And Analysis." Journal of Audio Engineering Society. Vol. 60, Issue 6, 2012, pp. 399–408.

推荐阅读

int
探索CNN的可视化技术

神经网络的可视化在理论学习与实践应用中扮演着至关重要的角色。本文深入探讨了三种有效的CNN（卷积神经网络）可视化方法，旨在帮助读者更好地理解和优化模型。 ... [详细]

蜡笔小新 2024-11-24 11:30:28
int
视觉Transformer综述

本文综述了视觉Transformer在计算机视觉领域的应用，从原始Transformer出发，详细介绍了其在图像分类、目标检测和图像分割等任务中的最新进展。文章不仅涵盖了基础的Transformer架构，还深入探讨了各类增强版Transformer模型的设计思路和技术细节。 ... [详细]

蜡笔小新 2024-11-22 19:53:16
int
雨林木风 GHOST XP SP3 经典珍藏版 YN2014.04

雨林木风 GHOST XP SP3 经典珍藏版 YN2014.04 ... [详细]

蜡笔小新 2024-11-24 21:04:30
int
使用R语言进行Foodmart数据的关联规则分析与可视化

本文探讨了如何利用R语言中的arules和arulesViz包对Foodmart数据集进行关联规则的挖掘与可视化。文章首先介绍了数据集的基本情况，然后逐步展示了如何进行数据预处理、规则挖掘及结果的图形化呈现。 ... [详细]

蜡笔小新 2024-11-24 19:13:01
int
如何高效学习鸿蒙操作系统：开发者指南

本文探讨了开发者如何更有效地学习鸿蒙操作系统，提供了来自行业专家的建议，包括系统化学习方法、职业规划建议以及具体的开发技巧。 ... [详细]

蜡笔小新 2024-11-23 19:22:14
int
深入解析Java并发之ArrayBlockingQueue

本文详细探讨了ArrayBlockingQueue，这是一种基于数组实现的阻塞队列。ArrayBlockingQueue在初始化时需要指定容量，因此它是一个有界的阻塞队列。文章不仅介绍了其基本概念和数据结构，还深入分析了其源码实现，包括各种入队、出队、获取元素和删除元素的方法。 ... [详细]

蜡笔小新 2024-11-25 03:29:14
int
Android 开发框架整合：MVP + Retrofit + Dagger2 + RxAndroid 配置指南

本文将详细介绍如何配置并整合MVP架构、Retrofit网络请求库、Dagger2依赖注入框架以及RxAndroid响应式编程库，构建高效、模块化的Android应用。 ... [详细]

蜡笔小新 2024-11-24 20:16:02
int
Python 高级编程技巧：多线程与多进程的对比分析

本文探讨了在Python中多线程与多进程的性能差异，特别是在处理CPU密集型任务和I/O密集型任务时的表现。由于全局解释器锁（GIL）的存在，多线程在利用多核CPU方面表现不佳，而多进程则能有效利用多核资源。 ... [详细]

蜡笔小新 2024-11-24 17:41:05
int
[NOI2012]

来自FallDream的博客，未经允许，请勿转载，谢谢。一天一套noi简直了.昨天勉强做完了noi2011今天教练又丢出来一套noi ... [详细]

蜡笔小新 2024-11-24 17:13:08
case
Implementing and Testing Ext Ajax Calls with Promises

This article explores the process of integrating Promises into Ext Ajax calls for a more functional programming approach, along with detailed steps on testing these asynchronous operations. ... [详细]

蜡笔小新 2024-11-24 15:29:28
byte
SSE图像算法优化系列三：超高速导向滤波实现过程纪要（欢迎挑战）

自从何凯明提出导向滤波后，因为其算法的简单性和有效性，该算法得到了广泛的应用，以至于新版的matlab都将其作为标准自带的函数之一了&#x ... [详细]

蜡笔小新 2024-11-23 10:46:33
byte
DedeCMS 手机端站点配置与优化指南

本文详细介绍如何安装和配置DedeCMS的移动端站点，包括新版本安装、老版本升级、模板适配以及必要的代码修改，以确保移动站点的正常运行。 ... [详细]

蜡笔小新 2024-11-22 18:44:25
int
深入理解PHP中的超全局变量与AJAX技术

本文详细介绍了PHP中的几种超全局变量，包括$GLOBAL、$_SERVER、$_POST、$_GET等，并探讨了AJAX的工作原理及其优缺点。通过具体示例，帮助读者更好地理解和应用这些技术。 ... [详细]

蜡笔小新 2024-11-24 16:35:09
int
根据数据规模确定力扣问题的时间复杂度策略

在解决ACM竞赛题目或力扣挑战时，通常面临1秒到2秒的时间限制。为了确保程序能够高效运行，C++等语言的代码执行次数建议不超过1千万次。 ... [详细]

蜡笔小新 2024-11-22 13:38:24
int
CentOS 6.5环境下Redis 3.0.6的安装与配置

本文详细介绍了如何在CentOS 6.5系统上安装和配置Redis 3.0.6，包括必要的环境准备、软件包下载、编译安装及基本功能测试。 ... [详细]

蜡笔小新 2024-11-22 11:42:46

H-蔡鸿晖_515

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章