语音识别基本流程

作者：Mx丶seven | 来源：互联网 | 2023-05-19 18:57

所谓语音识别，就是将一段语音信号转换成相对应的文本信息，系统主要包含特征提取、声学模型，语言模型以及字典与解码四大部分，此外为了更有效地提取特征往往还需要对所采集到的声音信号进行滤波、分帧等

所谓语音识别，就是将一段语音信号转换成相对应的文本信息，系统主要包含特征提取、声学模型，语言模型以及字典与解码四大部分，此外为了更有效地提取特征往往还需要对所采集到的声音信号进行滤波、分帧等音频数据预处理工作，将需要分析的音频信号从原始信号中合适地提取出来；特征提取工作将声音信号从时域转换到频域，为声学模型提供合适的特征向量；声学模型中再根据声学特性计算每一个特征向量在声学特征上的得分；而语言模型则根据语言学相关的理论，计算该声音信号对应可能词组序列的概率；最后根据已有的字典，对词组序列进行解码，得到最后可能的文本表示。

预处理：1. 首尾端的静音切除，降低对后续步骤造成的干扰，静音切除的操作一般称为VAD。

2. 声音分帧，也就是把声音切开成一小段一小段，每小段称为一帧，使用移动窗函数来实现，不是简单的切开，各帧之间一般是有交叠的。

特征提取：主要算法有线性预测倒谱系数（LPCC）和Mel 倒谱系数（MFCC），目的是把每一帧波形变成一个包含声音信息的多维向量；

声学模型（AM）：通过对语音数据进行训练获得，输入是特征向量，输出为音素信息；

字典：字或者词与音素的对应，简单来说，中文就是拼音和汉字的对应，英文就是音标与单词的对应；

语言模型（LM）：通过对大量文本信息进行训练，得到单个字或者词相互关联的概率；

解码：就是通过声学模型，字典，语言模型对提取特征后的音频数据进行文字输出；

语音识别流程的举例（只是形象表述，不是真实数据和过程）：

1. 语音信号：PCM文件等（我是机器人）

2. 特征提取：提取特征向量[1 2 3 4 56 0 ...]

3. 声学模型：[1 2 3 4 56 0]-> w o s i j i q i r n

4. 字典：窝：w o；我：w o；是：s i；机：j i；器：q i；人：r n；级：j i；忍：r n；

5. 语言模型：我：0.0786，是： 0.0546，我是：0.0898，机器：0.0967，机器人：0.6785；

6. 输出文字：我是机器人；

不正之处，欢迎提出！~~~谢谢

推荐阅读

机器人
ROS主机与从机之间的通信原理及机制分析

本文深入探讨了ROS（Robot Operating System）主机与从机之间的通信原理及机制。通过分析ROS网络架构，详细阐述了节点间的通信方式、消息传递流程以及数据同步机制。此外，还介绍了ROS中常用的通信模式，如发布/订阅、服务调用和参数服务器，为开发者提供了全面的技术指导。 ... [详细]

蜡笔小新 2024-11-03 15:18:56
机器人
安川机器人位置变量解析与变量配置技巧（维护指南）

“没有变量的机器人如同没有灵魂。”本文详细介绍了安川机器人中位置变量的解析方法与配置技巧，帮助维护人员更好地理解和操作这些关键参数。通过深入探讨变量的功能和应用场景，本文为技术人员提供了实用的指导，确保机器人在各种任务中能够高效、准确地运行。 ... [详细]

蜡笔小新 2024-11-05 10:51:13
机器人
HTML 页面中调用 JavaScript 函数生成随机数值并自动展示

在HTML页面中，通过调用JavaScript函数生成随机数值，并将其自动展示在页面上。具体实现包括构建HTML页面结构，定义JavaScript函数以生成随机数，以及在页面加载时自动调用该函数并将结果呈现给用户。 ... [详细]

蜡笔小新 2024-11-06 12:20:41
神经网络
能够感知你情绪状态的智能机器人即将问世 | 科技前沿观察

本周科技前沿报道了多项重要进展，包括美国多所高校在机器人技术和自动驾驶领域的最新研究成果，以及硅谷大型企业在智能硬件和深度学习技术上的突破性进展。特别值得一提的是，一款能够感知用户情绪状态的智能机器人即将问世，为未来的人机交互带来了全新的可能性。 ... [详细]

蜡笔小新 2024-11-05 20:45:31
机器人
巴巴腾机器人视频：揭秘你意想不到的智能功能与表现

2016年5月3日，巴巴腾机器人正式亮相，仅一天时间便突破百万众筹。这款机器人凭借其独特的智能功能和出色的表现引起了广泛关注。它不仅具备多种令人意想不到的智能化特性，还在人机交互方面展现出卓越的能力，深受用户喜爱。 ... [详细]

蜡笔小新 2024-11-05 19:30:06
机器人
当前物联网领域十大核心技术解析：涵盖哪些关键技术？

经过近十年的技术革新，物联网已悄然渗透到日常生活中，对社会产生了深远影响。本文将详细解析当前物联网领域的十大核心关键技术，包括但不限于：1. 军事物联网技术，该技术通过先进的感知设备实现战场环境的实时监测与数据传输，提升作战效能和决策效率。其他关键技术还包括传感器网络、边缘计算、大数据分析等，这些技术共同推动了物联网的快速发展和广泛应用。 ... [详细]

蜡笔小新 2024-11-05 19:25:03
机器人
Python 微信机器人实现自动聊天、表情包回应及 Adidas 官方账号自动抽签功能——智能回复系统优化

本章节在上一章的基础上，深入探讨了如何通过引入机器人实现自动聊天、表情包回应以及Adidas官方账号的自动抽签功能。具体介绍了使用wxpy库进行微信机器人的开发，优化了智能回复系统的性能和用户体验。通过详细的代码示例和实践操作，展示了如何实现这些高级功能，进一步提升了机器人的智能化水平。 ... [详细]

蜡笔小新 2024-11-05 11:06:27
机器人
如何正确安装Python：详细步骤与常见问题解答

本文详细介绍了如何正确安装Python，包括环境准备、下载与安装过程、路径配置等关键步骤，并针对初学者常见的安装问题提供了详细的解答和解决方案，帮助读者顺利搭建Python开发环境。 ... [详细]

蜡笔小新 2024-11-03 11:47:48
机器人
每日精选Codeforces训练题：1119E（贪心算法）、821C（栈模拟）和645D（拓扑排序）

题目涉及三种不同类型的算法问题：1119E（贪心算法）、821C（栈模拟）和645D（拓扑排序）。其中，1119E的问题背景是有n种不同长度的棍子，长度分别为2^0, 2^1, …, 2^(n-1)，每种棍子的数量为a[i]。任务是计算可以组成的三角形数量。根据三角形的性质，任意两边之和必须大于第三边。该问题可以通过贪心算法高效解决，通过合理选择棍子组合来最大化三角形的数量。 ... [详细]

蜡笔小新 2024-11-03 11:42:58
机器人
魏德米勒展会季大放异彩，独特展示技术魅力与品牌风采

魏德米勒展会季大放异彩，独特展示技术魅力与品牌风采 ... [详细]

蜡笔小新 2024-11-03 11:10:09
机器人
扎克伯格透露：一种新型类皮肤材料可能加速“元宇宙”愿景实现

Meta公司的人工智能团队与卡内基梅隆大学的科学家合作，开发出了一种厚度不足3毫米的可变形塑料材料，这种低成本的“皮肤”有望加速“元宇宙”愿景的实现。该材料具有高度的灵活性和响应性，能够模拟真实皮肤的触感，为虚拟现实和增强现实技术提供更加沉浸式的体验。 ... [详细]

蜡笔小新 2024-11-01 05:58:50
机器人
如何巧妙运用米家智能设备实现高效联动与互联互通设置

如何巧妙运用米家智能设备实现高效联动与互联互通设置 ... [详细]

蜡笔小新 2024-10-31 19:10:43
机器人
全栈工程师在当今技术领域的角色与价值探析

当前，众多初创企业对全栈工程师的需求日益增长，但市场中却存在大量所谓的“伪全栈工程师”，尤其是那些仅掌握了Node.js技能的前端开发人员。本文旨在深入探讨全栈工程师在现代技术生态中的真实角色与价值，澄清对这一角色的误解，并强调真正的全栈工程师应具备全面的技术栈和综合解决问题的能力。 ... [详细]

蜡笔小新 2024-10-31 10:28:12
机器人
从用户转型为开发者：一场思维升级的旅程 | 专访 StarRocks Committer 周威

从用户转变为开发者，不仅是一次角色的转换，更是一场深刻的思维升级之旅。本次专访中，StarRocks Committer 周威分享了他如何在这一过程中逐步提升技术能力与思维方式，为开源社区贡献自己的力量。 ... [详细]

蜡笔小新 2024-10-31 09:21:44
机器人
点云技术初探（三）：PCL基础知识与学习路径指南

点云技术初探（三）：PCL基础知识与学习路径指南本文首先介绍了点云库（PCL）的基本概念，PCL是一个在前人点云研究成果基础上发展而来的大型跨平台开源C++编程库，旨在为点云数据处理提供全面的支持。文章详细阐述了PCL的核心功能及其在三维数据处理、特征提取、分割与配准等方面的应用，并为初学者提供了系统的学习路径和资源推荐，帮助读者快速掌握PCL的使用方法。 ... [详细]

蜡笔小新 2024-10-30 13:00:32

Mx丶seven

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章