当前位置: 开发笔记 > 人工智能 > 正文

声学模型GMM-HMM训练

作者：然姐2502870593 | 来源：互联网 | 2023-02-06 04:01

语音识别中声学模型是重中之重，常用到的声学模型是GMM-HMM，本文记录下声学模型训练的细节。下图是识别某个孤立字的GMM-HMM示意图。HMM部分是文字所占的音素以及其转移概率。语音帧

语音识别中声学模型是重中之重，常用到的声学模型是GMM-HMM，本文记录下声学模型训练的细节。

下图是识别某个孤立字的GMM-HMM示意图。HMM部分是文字所占的音素以及其转移概率。语音帧通过已经训练好的GMM得属于某个音素的概率，如0.016。

GMM-HMM

问题是这样的一个模型怎么训练呢？

问题一、一段语音是怎么切割音素的，如’我‘的拼音是wo，我们按声韵母分开是：w o？

如果要训练w和o的分界点在哪我们不知道，所以HMM模型的训练就是问题。

这里使用EM算法，开始随机对语音分帧，例如平均分割语音，使用EM算法和前向后向算法（具体内容还需再熟悉）。

E 步是求出每一帧位于哪个音素，M 步是对于每个音素，找到它对应的所有帧，从这些帧的特征中估计音素模型的参数。

对齐之后就可以对每个状态进行GMM训练，之后循环E步M步。其中E步只要判断相邻音素的那一帧属于左边音素还是右边音素就可以了。

问题二、孤立词识别中的GMM-HMM和连续词识别中的GMM-HMM有什么不一样？

孤立词识别中每个词都有自己的GMM-HMM，也就是说虽然有的词包括有相同的音素，但是数据不共享。

大词汇量的训练中，是对音素建立GMM-HMM模型，所以数据共享。

推荐阅读

算法
本周三大青年学术分享会即将开启

由雷锋网旗下的AI研习社主办，旨在促进AI领域的知识共享和技术交流。通过邀请来自学术界和工业界的专家进行在线分享，活动致力于搭建一个连接理论与实践的平台。 ... [详细]

蜡笔小新 2024-11-21 17:13:10
算法
计算机学报精选论文概览（2020-2022）

本文汇总了2020年至2022年间《计算机学报》上发表的若干重要论文，旨在为即将投稿的研究者提供参考。 ... [详细]

蜡笔小新 2024-11-20 11:08:21
算法
自动驾驶中的9种传感器融合算法

来源丨AI修炼之路在自动驾驶汽车中，传感器融合是融合来自多个传感器数据的过程。该步骤在机器人技术中是强制性的，因为它提供了更高的可靠性、冗余性以及最终的 ... [详细]

蜡笔小新 2024-11-16 12:07:16
算法
Java 网站开发指南

本文详细介绍了 Java 网站开发的相关资源和步骤，包括常用网站、开发环境和框架选择。 ... [详细]

蜡笔小新 2024-11-14 22:39:58
算法
非计算机专业的朋友如何拿下多个Offer

大家好，我是归辰。秋招结束后，我已顺利入职，并应公子龙的邀请，分享一些秋招面试的心得体会，希望能帮助到学弟学妹们，让他们在未来的面试中更加顺利。 ... [详细]

蜡笔小新 2024-11-13 18:41:58
算法
利用OpenCV和线性SVM实现人脸识别

本文介绍如何使用OpenCV和线性支持向量机（SVM）模型来开发一个简单的人脸识别系统，特别关注在只有一个用户数据集时的处理方法。 ... [详细]

蜡笔小新 2024-11-13 14:50:37
算法
Python 数据可视化实战指南

本文详细介绍如何使用 Python 进行数据可视化，涵盖从环境搭建到具体实例的全过程。 ... [详细]

蜡笔小新 2024-11-13 06:03:30
算法
飞桨助力产业智能化：百度自研AI硬件深度融合

在2019中国国际智能产业博览会上，百度董事长兼CEO李彦宏强调，人工智能应务实推进其在各行业的应用。随后，在“ABC SUMMIT 2019百度云智峰会”上，百度展示了通过“云+AI”推动AI工业化和产业智能化的最新成果。 ... [详细]

蜡笔小新 2024-11-12 00:45:20
算法
机器学习的持续探索与进展

在机器学习领域，深入探讨了概率论与数理统计的基础知识，特别是这些理论在数据挖掘中的应用。文章重点分析了偏差（Bias）与方差（Variance）之间的平衡问题，强调了方差反映了不同训练模型之间的差异，例如在K折交叉验证中，不同模型之间的性能差异显著。此外，还讨论了如何通过优化模型选择和参数调整来有效控制这一平衡，以提高模型的泛化能力。 ... [详细]

蜡笔小新 2024-11-11 10:27:39
算法
理解与实现动态赋值

本文深入探讨了动态赋值的概念及其在编程实践中的应用，特别是通过Java代码示例来展示如何利用循环结构动态地为数组分配值。 ... [详细]

蜡笔小新 2024-11-22 14:17:01
算法
根据数据规模确定力扣问题的时间复杂度策略

在解决ACM竞赛题目或力扣挑战时，通常面临1秒到2秒的时间限制。为了确保程序能够高效运行，C++等语言的代码执行次数建议不超过1千万次。 ... [详细]

蜡笔小新 2024-11-22 13:38:24
算法
吴石访谈：腾讯安全科恩实验室如何引领物联网安全研究

腾讯安全科恩实验室曾两次成功破解特斯拉自动驾驶系统，并远程控制汽车，展示了其在汽车安全领域的强大实力。近日，该实验室负责人吴石接受了InfoQ的专访，详细介绍了团队未来的重点方向——物联网安全。 ... [详细]

蜡笔小新 2024-11-22 13:27:32
算法
变量间相关性分析

本文探讨了如何通过统计方法评估两个变量之间的关系强度，重点介绍了皮尔森相关系数的计算及其应用。除了数学公式外，文章还提供了Python编程实例，展示如何利用实际数据集（如泰坦尼克号乘客数据）进行相关性检验。 ... [详细]

蜡笔小新 2024-11-22 12:53:03
算法
解决Android Studio意外崩溃及重启后Import错误问题

本文提供了一种有效的方法来解决当Android Studio因电脑意外重启而导致的所有import语句出现错误的问题。通过清除缓存和重建项目结构，可以快速恢复开发环境。 ... [详细]

蜡笔小新 2024-11-22 11:53:00
深度学习
深度学习为何可以实现图像的分类

本笔记为自用，倘若没有相关的学习基础，也确实无法看懂文章写的是什么。近来有点越学越回去的感觉。竟然突然在想，为什么深度学习模型可以对图像进行分类或者语义分割。可怕的是，当时想到这里 ... [详细]

蜡笔小新 2024-11-20 22:02:30

然姐2502870593

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章