语音去混响算法之WPE(WeightedPredictionErrorforspeechdereverberation)

作者：夏未夏至青_872 | 来源：互联网 | 2023-09-17 06:44

目录简介信号模型WPE算法（Weightedpredictionerror）参考文献简介背景噪声和空间内声反射产生的混响是声学信号处理和远场语音识别的两大障碍。WPE(Weig

简介

背景噪声和空间内声反射产生的混响是声学信号处理和远场语音识别的两大障碍。WPE(Weighted Prediction Error)算法主要用于去除信号中的混响成分，此算法基于线性预测估计，是目前针对去混响（dereverberation）问题的主流算法之一。

信号模型

假设观测信号由D个麦克风采集，则该信号由STFT变换之后可表示为一个D维向量 $y_{t, f} y_{t,f}$ ，其中时间index为t，频率index为f。
在远场情境之下，信号被卷性混响（观测信号为干净信号与混响的卷积）干扰。我们认为信号靠近声源的部分为空间冲击响应(RIR room impulse response)，是有益的信号，而尾部的信号干扰ASR，需要被消除。我们假设信号主峰之后的50ms为 $h^{(early)}$ ，剩下的部分为 $h^{(tail)}$ 。
在STFT域我们建立如下模型：
$Y_{t,f} = X_{t,f}^{(early) }+ X_{t,f}^{(tail)}$
图片来源：https://www.sonible.com/de/blog/nachhall-audioproduktion/

WPE 算法（Weighted prediction error）

WPE的主要思路是首先估计信号的混响尾部，然后再从观测信号中减去混响尾部，得到对弱混响信号的极大似然意义下的最优估计。
混响信号的时域可表达为：
$x_{t, f, d}^{(e a r l y)} = y_{t, f, d} - \sum_{τ = Δ}^{Δ + K - 1} \sum_{d^{'}} g_{τ, f, d, d^{'}}^{*} y_{t - τ, f, d^{'}} x_{t,f,d}^{(early)} = y_{t,f,d} - \sum_{\tau=\Delta}^{\Delta+K-1} {\sum_{d'}{g_{\tau,f,d,d'}^* y_{t-\tau,f,d'} } }$
经过STFT变换后记作：
$X_{t,f}^{(early)} = Y_{t,f} - G_f^H Y_{t-\tau,f}$

$d$ 为麦克风的编号， $K$ 为滤波器的抽头(Filter Tap)数，预测步长 $\Delta>0$ 。 $G_f$ 代表滤波器权重， $Y_{t,f}$ 为观测信号。下图描述了WPE一步预测。
在这里插入图片描述
未完待续。。。

参考文献

Yoshioka, Takuya, and Tomohiro Nakatani. “Generalization of multi-channel linear prediction methods for blind MIMO impulse response shortening.” IEEE Transactions on Audio, Speech, and Language Processing 20.10 (2012): 2707-2720.

推荐阅读

text
文本生成图像简要回顾 text to image synthesis

摘要文本生成图像作为近几年的热门研究领域，其解决的问题是从一句描述性文本生成与之对应的图片。近一周来，我通过阅读了近几年发表于顶会的近10篇论文，做出本文中对该方向的 ... [详细]

蜡笔小新 2024-09-29 11:02:00
数组
图像处理(7) : 边缘检测

边缘检测是图形图像处理、计算机视觉和机器视觉中的一个基本工具，通常用于特征提取和特征检测，旨在检测一张数字图像中有明显变化的边缘或者不连续的区域 ... [详细]

蜡笔小新 2024-09-28 20:28:40
tree
FP-Growth 和 K-Means 学习报告

最近学习了数据挖掘常用的两种算法：FP-Growth和K-Means。现在把我的学习结果分享给大家。以下是本文的目录，大家可以根据需要跳过一些章节：1.FP-Grow ... [详细]

蜡笔小新 2024-09-28 09:23:32
tree
安卓系统上位机搭配科大讯飞核心板AEC的评估方法

获取原始语音系统图使用matlab生成一个测试用的单频信号，1KHz，1Vrmsclcclearall;closeall;f1000;%定义信号频 ... [详细]

蜡笔小新 2024-09-30 19:06:04
nodejs
ajax 跨域webapi 最简单的demo（只介绍Get）

这几天遇到一个nodejs的项目，使用VSCode开发，需要连接数据库的，但是用nodejs连接数据库比较繁琐，需要安装很多 ... [详细]

蜡笔小新 2024-09-29 19:42:09
replace
外层|条件下_MySQL还能这样玩第五篇之视图应该这样玩

篇首语：本文由编程笔记#小编为大家整理，主要介绍了MySQL还能这样玩---第五篇之视图应该这样玩相关的知识，希望对你有一定的参考价值。 ... [详细]

蜡笔小新 2024-09-29 16:30:33
function
Lodash 中文文档 (v3.10.1)“Collection” 要领

Lodash中文文档(v3.10.1)–“Collection”要领TranslatedbyPeckZegOriginalDocs:Lodashv3.10.1Docs乞助翻译文档的 ... [详细]

蜡笔小新 2024-09-28 08:08:39
function
结对编程地铁最短路径张波朱新远

结对编程地铁最短路径一、任务：实现一个帮助进行地铁出行路线规划的命令行程序。PSP2.1PersonalSoftwareProcessStagesTimePlanni ... [详细]

蜡笔小新 2024-09-27 17:32:27
function
每日一书丨AI圣经《深度学习》作者斩获2018年图灵奖

2019年3月27日——ACM宣布，深度学习之父YoshuaBengio,YannLeCun,以及GeoffreyHinton获得了2018年的图灵奖， ... [详细]

蜡笔小新 2024-09-27 16:03:32
function
Flink 自定义trigger 同时按照计数和时间触发窗口计算

自定义窗口实现同时按照计数和时间（processing-time）触发计算 TriggersA Trigger determineswhenawindow(asformedbyth ... [详细]

蜡笔小新 2024-09-27 10:30:04
copy
Android JNI学习之Concepts

2019独角兽企业重金招聘Python工程师标准ConceptsBeforeBeginningThisguideassumesthatyouare:Alreadyfamili ... [详细]

蜡笔小新 2024-09-27 09:16:45
input
使用位运算符快速字符串搜索 - Fast string search using bitwise operators

Whatisthefastest(parallel?)waytofindasubstringinaverylongstringusingbitwiseoperator ... [详细]

蜡笔小新 2024-09-26 22:09:45
copy
【JVM技术专题】深入分析CG管理和原理查缺补漏「番外篇」

前提概要本文主要针对HotspotVM中“CMSParNew”组合的一些使用场景进行总结。自Sun发布Java语言以来，开始使用GC技术来进行内存自动管理࿰ ... [详细]

蜡笔小新 2024-09-26 17:30:39
tree
从分布式数据库选型的第一件事谈起

本文很长，谨慎阅读现在在我们的面前摆着太多的分布式数据库可以让我们选择，那么如果我想先让 ... [详细]

蜡笔小新 2024-09-26 15:36:10
tree
百度_音频转文字

手机49kbps转换比特率256Kpbs{‘corpus_no’:‘7045177033217452815’,‘err_msg’:‘success.’,‘err_no’:0,‘re ... [详细]

蜡笔小新 2024-09-26 17:35:21

夏未夏至青_872

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章