热门标签 | HotTags
当前位置:  开发笔记 > 数据库 > 正文

海天瑞声提出用户语言一致性检查方案帮助实现录制语音一致性

【嘉勤点评】海天瑞声发明的用户语音一致性检查方案,通过为用户构建的模板语音特征库即可实现实时对用户录制语音的一致性检测,无需人工多次回放收听dbscan。从而解决了检测语音一致性的成本较高以及时效性较

海天瑞声提出用户语言一致性检查方案 帮助实现录制语音一致性

【嘉勤点评】海天瑞声发明的用户语音一致性检查方案,通过为用户构建的模板语音特征库即可实现实时对用户录制语音的一致性检测,无需人工多次回放收听dbscan。从而解决了检测语音一致性的成本较高以及时效性较低的技术问题,并提高了语音一致性的检测效率和检测时效性。

集微网消息,在生成语音合成数据库的过程中,通常要求同一个发音人在不同时期、不同环境所录制的数据保持较高的一致性,即从听感上保证所录制的各个批次的语音尽量保持一致dbscan

例如,同一发音人在不同时期录制的音频的音量是否忽高忽低、语速是否时快时慢、音调是否忽高忽低等dbscan。但是,针对同一发音人在不同时期录制的音频是否在听感上保持一致,目前没有一个标准的评价方法。

现有的技术通常依赖于人工检查,即人为反复多次回放音频来判断是否一致dbscan。然而,该方法人工成本、时间成本较多,并且不能实时判断出发音人当前录制的语音是否具备一致性,时效性也较低。

为此,海天瑞声在2022年5月19日申请了一项名为“语音一致性检测方法、装置、设备及存储介质”的发明专利(申请号:202210541377.2),申请人为北京海天瑞声科技股份有限公司dbscan

根据该专利目前公开的相关资料,让我们一起来看看这项技术方案吧dbscan

海天瑞声提出用户语言一致性检查方案 帮助实现录制语音一致性

展开全文

如上图,为该专利中发明的语音一致性检测方法的流程示意图,该方案可以用于判断用户录制的语音、视频中的音频是否与模板语音特征库中的模板语音一致dbscan。首先,系统获取目标用户的模板语音特征库,该特征库包括模板语音中各模板元音音素的音素特征,例如包括语音的发音、音量语速等。

其次,获取目标用户的待判定语音,确定待判定语音中各待判定元音音素的音素特征dbscan。待判定语音通常是目标用户所录制的需要判断是否与模板语音具备一致性的语音,如目标用户实时录制的语音,或者目标用户所录制的视频中的语音。

例如对于用户的全部元音音素进行判断时,包括元音音素的基音频率(基频)、元音音素的平均能量、元音音素的平均语速和元音音素的共振峰等多种因素及指标dbscan

最后,基于各待判定元音音素的音素特征以及模板语音特征库中与各待判定元音音素对应的模板元音音素的音素特征,就可以检测待判定语音与模板语音之间是否具备一致性dbscan。例如,待判定元音音素的元音类型为i,则与待判定元音音素对应的模板元音音素的元音类型也为i。

因此,该方法通过为用户构建的模板语音特征库即可实现实时对用户录制语音的一致性检测,无需人工多次回放收听,解决了检测语音一致性的成本较高以及时效性较低的技术问题,提高了语音一致性的检测效率和检测时效dbscan

海天瑞声提出用户语言一致性检查方案 帮助实现录制语音一致性

如上图dbscan,为该专利中发明的模板元音音素的音素信息的提取流程图,其中共包括有六个步骤:

1)将所有模板语音输入至预先训练的语音检测模型dbscan,以使语音检测模型丢弃模板语音中的静音片段和噪声片段,输出有效语音片段;

2)按照预设帧长和预设帧移长度对全部有效语音片段进行截取dbscan,得到各个待特征提取帧,进而根据全部待特征提取帧提取MFCC特征;

3)将提取到的MFCC特征使用“隐马尔可夫‑高斯混合模型”并经过Viterbi解码dbscan,得到每个音素对应的音素信息;

4)将全部音素的音素信息输入至预先训练的音素置信度过滤模型dbscan,以使音素置信度过滤模型过滤掉置信度低于预设置信度阈值的音素,输出置信度大于或等于该音素;

5)将音素置信度过滤模型输出的音素输入元音检测模型dbscan,使元音检测模型检测各音素是否为元音音素,即确定全部音素中的模板元音音素;

6)最后,在获取到全部模板元音音素后,按照元音种类,统计各元音种类对应的各模板元音音素的音素信息dbscan

海天瑞声提出用户语言一致性检查方案 帮助实现录制语音一致性

如上图,展示了一种模板语音特征库的构建流程图,其中,根据所得到的各模板元音音素的音素信息,分别计算模板元音音素的平均能量和平均语速,并进行基频和共振峰(包括共振峰F1和共振峰F2)的提取dbscan

之后,根据基频和共振峰对各模板元音音素进行聚类处理,并丢弃聚类后的簇外音素(即离群点),以实现对模板元音音素的去噪,即DBSCAN去除噪声数据dbscan。进而将剩余的模板元音音素的音素特征融合,得到各个模板元音音素的特征向量,得到维度为5的特征向量。

以上就是海天瑞声发明的用户语音一致性检查方案,该方案通过为用户构建的模板语音特征库即可实现实时对用户录制语音的一致性检测,无需人工多次回放收听dbscan。从而解决了检测语音一致性的成本较高以及时效性较低的技术问题,并提高了语音一致性的检测效率和检测时效性。


推荐阅读
  • 本文详细介绍了如何使用libpq库与PostgreSQL后端建立连接。通过探讨PQconnectdb()函数的工作原理及其在实际应用中的使用方法,帮助读者理解并掌握建立高效、稳定的数据库连接的关键步骤。 ... [详细]
  • 优化ListView性能
    本文深入探讨了如何通过多种技术手段优化ListView的性能,包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]
  • CSS 布局:液态三栏混合宽度布局
    本文介绍了如何使用 CSS 实现液态的三栏布局,其中各栏具有不同的宽度设置。通过调整容器和内容区域的属性,可以实现灵活且响应式的网页设计。 ... [详细]
  • IT项目管理过程中的方法、工具、技术
    工欲善其事,必先利其器。而对于一个软件开发项目,最重要的器就是方法,工具和技术。而这三要素中重要的又是方法论,方法是基础&# ... [详细]
  • Linux 系统启动故障排除指南:MBR 和 GRUB 问题
    本文详细介绍了 Linux 系统启动过程中常见的 MBR 扇区和 GRUB 引导程序故障及其解决方案,涵盖从备份、模拟故障到恢复的具体步骤。 ... [详细]
  • 本文介绍了如何使用jQuery根据元素的类型(如复选框)和标签名(如段落)来获取DOM对象。这有助于更高效地操作网页中的特定元素。 ... [详细]
  • 1:有如下一段程序:packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]
  • PHP 5.2.5 安装与配置指南
    本文详细介绍了 PHP 5.2.5 的安装和配置步骤,帮助开发者解决常见的环境配置问题,特别是上传图片时遇到的错误。通过本教程,您可以顺利搭建并优化 PHP 运行环境。 ... [详细]
  • 数据管理权威指南:《DAMA-DMBOK2 数据管理知识体系》
    本书提供了全面的数据管理职能、术语和最佳实践方法的标准行业解释,构建了数据管理的总体框架,为数据管理的发展奠定了坚实的理论基础。适合各类数据管理专业人士和相关领域的从业人员。 ... [详细]
  • 深入理解Cookie与Session会话管理
    本文详细介绍了如何通过HTTP响应和请求处理浏览器的Cookie信息,以及如何创建、设置和管理Cookie。同时探讨了会话跟踪技术中的Session机制,解释其原理及应用场景。 ... [详细]
  • 本文介绍如何在 Xcode 中使用快捷键和菜单命令对多行代码进行缩进,包括右缩进和左缩进的具体操作方法。 ... [详细]
  • 深入理解 SQL 视图、存储过程与事务
    本文详细介绍了SQL中的视图、存储过程和事务的概念及应用。视图为用户提供了一种灵活的数据查询方式,存储过程则封装了复杂的SQL逻辑,而事务确保了数据库操作的完整性和一致性。 ... [详细]
  • 构建基于BERT的中文NL2SQL模型:一个简明的基准
    本文探讨了将自然语言转换为SQL语句(NL2SQL)的任务,这是人工智能领域中一项非常实用的研究方向。文章介绍了笔者在公司举办的首届中文NL2SQL挑战赛中的实践,该比赛提供了金融和通用领域的表格数据,并标注了对应的自然语言与SQL语句对,旨在训练准确的NL2SQL模型。 ... [详细]
  • 数据库内核开发入门 | 搭建研发环境的初步指南
    本课程将带你从零开始,逐步掌握数据库内核开发的基础知识和实践技能,重点介绍如何搭建OceanBase的开发环境。 ... [详细]
  • 本文介绍了一款用于自动化部署 Linux 服务的 Bash 脚本。该脚本不仅涵盖了基本的文件复制和目录创建,还处理了系统服务的配置和启动,确保在多种 Linux 发行版上都能顺利运行。 ... [详细]
author-avatar
一颗顽石
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有