作者:DLDLBABY1_182 | 来源:互联网 | 2023-07-04 16:54
语音信号处理1 ----- 基础知识
- 1. 语音信号处理的目的:
- 2. 语音发音和感知系统
- 2.1 语音发音系统
- 2.2 语音感知系统(听觉系统)
- 2.3 语音信号生成的数学模型
- 3. 语音基本概念及参数
- 4. 语音信号数字化处理
- 参考
1. 语音信号处理的目的:
- 转换语音信号为语音参数,方便传输和存储。
- 提取语音特征用于实际应用。
2. 语音发音和感知系统
2.1 语音发音系统
发音器官:肺、气管、喉(含声带)、咽、鼻、口
- 肺:
- 肺部气流是发生的音源。
- 对音源有共振和反共振作用,使其有音色。
- 从嘴唇或者鼻孔向空间辐射的作用
- 喉:
- 声门
- 声带有周期的震动。振动周期称基音周期
- 基音周期决定音调高低
- 声道:
- 包括咽、鼻、口。就是声门到嘴唇的呼气通道
- 泛音与音色有较大关系
2.2 语音感知系统(听觉系统)
2.2.1 听觉系统
听觉系统有两部分:
- 听觉外周
- 包括外耳、中耳、内耳
- 完成声音采集、频率分解、声能转换
- 听觉中枢
2.2.2 听觉特性
- 听觉选择性
- 频率: 20Hz ~ 20KHz ; 强度: -5 db ~ 130db
- 一部分由耳蜗决定。耳蜗像是一个频谱分析仪。
- 因此在信号分析时, 可以采用不同的滤波器,以是处理后的特征符合人耳听觉特性(如MEL)
- 掩蔽效应
- 强信号附近,弱信号被屏蔽变得不可闻。
- 被屏蔽信号的最大声压级成掩蔽门限或者掩蔽阈值
- 对1KHz附近声音最敏感
2.3 语音信号生成的数学模型
依据语音产生机理:声门子系统(激励模型)、声道(声道系统)、嘴唇以外(辐射系统)
- 激励模型
- 浊音机理 : 声带振动
- 清音机理 : 声带不振动
- 声道模型
- 级联 : 将声道看做一组级联的二阶谐振器
- 并联 :
- 混合
- 辐射模型
3. 语音基本概念及参数
- 声压 : 描述声波的最基本物理量。是空间和时间的函数。常用于 定量 描述声波性质。
- 有效声压 : 一定时间间隔内,将顺势声压对时间求方均根值。
- 声压级(SPL) :Lp = 20 lg (pe) / (pref) , pe : 待测声压, pref: 参考声压
- 声强: 强度。单位时间内与传播方向垂直的单位面积上的能量。
- 响度 : 主观感受。计量单位是 宋。与声压、频率等有关。
4. 语音信号数字化处理
数字化处理过程:
- 预滤波
- 已知输入信号各频域分量频率超出 fs/2 的所有分量。fs为采样率。
- 已知50Hz电源工频干扰。
- 因此必须是带通滤波器
- 预加重与去加重
- 原因: 语音、图像信号,低频能量大,高频能量小。鉴频器输出的噪声功率谱密度随频率的平方增加(低频噪声小、高频噪声大),使得信号低频信噪比过大,高频信噪比不足, 高频传输困难。
- 预加重:提升高频分量。
- 去加重:压低高频分量。
参考
- 语音信号处理, 赵力, 2019
- 带通滤波器,带阻滤波器,陷波滤波器简单概括