热门标签 | HotTags
当前位置:  开发笔记 > 人工智能 > 正文

爱奇艺HomeAI在语音交互领域的探索

爱奇艺HomeAI服务于iQIYI内的多个平台和产品,提供以视频点播为中心的智能语音交互解决方案,同时也在不断通过创新,利用最新的语音相关技术打造全新的玩法。对于目前大部分的语音交互系统,语音识别,语义理解和操作执行都是独立的模块,因此语音识别的错误后续的模块无法感知也无法反馈,将会在传递的过程中不断放大,最终导致错误的结果。随着智能语音助手所支持的领域越来越多,语言模型的缺陷所导致的语音识别结果

前言

爱奇艺HomeAI服务于iQIYI内的多个平台和产品,提供以视频点播为中心的智能语音交互解决方案,同时也在不断通过创新,利用最新的语音相关技术打造全新的玩法。

对于目前大部分的语音交互系统,语音识别,语义理解和操作执行都是独立的模块,因此语音识别的错误后续的模块无法感知也无法反馈,将会在传递的过程中不断放大,最终导致错误的结果。随着智能语音助手所支持的领域越来越多,语言模型的缺陷所导致的语音识别结果误差正在逐步成为整个系统的瓶颈。本文将介绍HomeAI目前的初步成果和未来的思考。

语言模型的局限性

统计语言模型是通过对大量文本语料学习得到的描述词序列的出现概率的模型,被广泛应用在语音识别,自然语言处理等领域,它相比传统的基于规则的语言模型具有更好的鲁棒性。

正因如此,语音识别和意图识别的语言模型无法快速的扩展,因此这两个模块对社会热点或者新播热剧很难有效的响应。

相对的,执行层面在进行视频搜索时的基于片库的语言模型在日新月异的变化。两种模型的差异导致语音识别过程中无法更倾向于解析出和片库内容相符的实体。

爱奇艺HomeAI在语音交互领域的探索

一个典型的错误

先让我们通过一个简单的例子来看一下,语音识别的错误是如何影响最终的结果的。

爱奇艺HomeAI在语音交互领域的探索

由于用户输入的“声临其境”没有在语音识别的语言模型中,但是却存在与其发音非常接近的成语存在(这种命名方式当前非常普遍),导致语音识别输出了高置信度的错误结果,得到了不符合用户预期的结果(路径1)。

通常,我们会尝试通过执行端的纠错,在这个例子中为搜索时的模糊匹配(路径2)来修复此类问题。但是由于模糊匹配的结果置信度较低,因此当整个系统支持多个领域的技能时,将有可能被其他领域的结果PK掉(路径3)。

而由于之前提到的语言模型的缺陷,即使让ASR提供排名前N的识别结果,也无法包含正确的结果。在HomeAI中,我们尝试在意图识别层面,利用自己的语言模型对ASR的结果进行纠错(路径4),从而更好的解决类似的问题。

分离语言模型

既然ASR中的语言模型一定程度上导致了对于实体的识别错误,那首先我们要做的就是要淡化语义在ASR中所起的作用,将发音信息和语义信息分层解耦。

爱奇艺HomeAI在语音交互领域的探索

在传统的语音识别模型最后,我们把解码部分分成了两层,先解码到拼音(即发音信息),再解码到文字,这样输出中可以同时保留两层结果供后续模块使用。对于外部的语言识别服务的结果,我们也会基于其输出的拼音信息进行实体的检索,以减少ASR的错误结果对后续意图识别的影响。

意图识别进行实体增强

HomeAI采用了主流的领域->意图->填槽的方式进行自然语言处理。由于之前在语音识别中弱化了发音到文字的转换,因此需要在意图识别时进行增强。HomeAI在意图识别过程中分两步对实体信息进行纠错:

1.结合ASR的语义层和声学层输出,以及意图识别的语言模型,尝试对原输出中的实体进行纠错

2.在词向量中拼接拼音特征,增强模型对相似发音的泛化能力

爱奇艺HomeAI在语音交互领域的探索

总结

由于语言模型在语音交互的各个模块中无法同步,且模块之间无反向反馈。导致语音识别的错误在模块自身不感知的情况下被后续处理模块初步放大,并最终产生了不符合用户预期的结果。为此,HomeAI通过将语音识别过程中,语义理解部分,即拼音到文本的转化弱化,交由后续的意图识别模块进一步增强,结合片库中的实体信息,在视频点播场景对用户体验有明显的提升。

未来发展

从语音交互向智能助手的发展还有很长的道要走,HomeAI也会继续在这个领域不断投入。除了扩展视频点播以外更多的使用场景,可针对用户和环境自适应的交互模型也会是我们的研究重点。许多言语只有与特定人和特定上下文环境结合才能正确的理解,这些是单一的云端模型所无法解决的。我们希望能够以一个通用的模型为基础,结合用户端的自适应能力,使系统在交互过程中能够通过反馈,逐渐适应用户的口音,习惯,常用词汇,相关实体等等,打造私人定制的语音助手。


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 我们


推荐阅读
  • 提升Python编程效率的十点建议
    本文介绍了提升Python编程效率的十点建议,包括不使用分号、选择合适的代码编辑器、遵循Python代码规范等。这些建议可以帮助开发者节省时间,提高编程效率。同时,还提供了相关参考链接供读者深入学习。 ... [详细]
  • GetWindowLong函数
    今天在看一个代码里头写了GetWindowLong(hwnd,0),我当时就有点费解,靠,上网搜索函数原型说明,死活找不到第 ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 知识图谱——机器大脑中的知识库
    本文介绍了知识图谱在机器大脑中的应用,以及搜索引擎在知识图谱方面的发展。以谷歌知识图谱为例,说明了知识图谱的智能化特点。通过搜索引擎用户可以获取更加智能化的答案,如搜索关键词"Marie Curie",会得到居里夫人的详细信息以及与之相关的历史人物。知识图谱的出现引起了搜索引擎行业的变革,不仅美国的微软必应,中国的百度、搜狗等搜索引擎公司也纷纷推出了自己的知识图谱。 ... [详细]
  • 本文介绍了如何使用python从列表中删除所有的零,并将结果以列表形式输出,同时提供了示例格式。 ... [详细]
  • Java在运行已编译完成的类时,是通过java虚拟机来装载和执行的,java虚拟机通过操作系统命令JAVA_HOMEbinjava–option来启 ... [详细]
  • 本文讨论了Kotlin中扩展函数的一些惯用用法以及其合理性。作者认为在某些情况下,定义扩展函数没有意义,但官方的编码约定支持这种方式。文章还介绍了在类之外定义扩展函数的具体用法,并讨论了避免使用扩展函数的边缘情况。作者提出了对于扩展函数的合理性的质疑,并给出了自己的反驳。最后,文章强调了在编写Kotlin代码时可以自由地使用扩展函数的重要性。 ... [详细]
  • 深度学习与神经网络——邱锡鹏
    深度学习与神经网络——邱锡鹏-一、绪论人工智能的一个子领域神经网络:一种以(人工))神经元为基本单元的模型深度学习:一类机器学习问题,主要解决贡献度分配问题知识结构:路线图:顶 ... [详细]
  • 聊聊 中国人工智能科技产业 区域竞争力分析及趋势
    原文链接:聊聊中国人工智能科技产业区域竞争力分析及趋势最近看了一个关于国内AI的报告《中国新一代人工智能科技产业区域竞争力评价指数(2021ÿ ... [详细]
  • 武汉市正式发布促进元宇宙创新发展实施方案
    武汉市正式发布促进元宇宙创新发展实施方案 ... [详细]
  • 关键词:塞尔达旷传说野之息、switch、cemu设置、Wii U、租赁、游戏机 ... [详细]
  • 近年来,大数据成为互联网世界的新宠儿,被列入阿里巴巴、谷歌等公司的战略规划中,也在政府报告中频繁提及。据《大数据人才报告》显示,目前全国大数据人才仅46万,未来3-5年将出现高达150万的人才缺口。根据领英报告,数据剖析人才供应指数最低,且跳槽速度最快。中国商业结合会数据剖析专业委员会统计显示,未来中国基础性数据剖析人才缺口将高达1400万。目前BAT企业中,60%以上的招聘职位都是针对大数据人才的。 ... [详细]
  • 本文讨论了同事工资打听的话题,包括同工不同酬现象、打探工资的途径、为什么打听别人的工资、职业的本质、商业价值与工资的关系,以及如何面对同事工资比自己高的情况和凸显自己的商业价值。故事中的阿巧发现同事的工资比自己高后感到不满,通过与老公、闺蜜交流和搜索相关关键词来寻求解决办法。 ... [详细]
  • 本文分享了一个关于在C#中使用异步代码的问题,作者在控制台中运行时代码正常工作,但在Windows窗体中却无法正常工作。作者尝试搜索局域网上的主机,但在窗体中计数器没有减少。文章提供了相关的代码和解决思路。 ... [详细]
  • 如何配置小米wifi放大器来增强家庭无线路由器信号?
    本文介绍了如何通过配置小米wifi放大器来增强家庭无线路由器信号的方法。通过打开米家APP,选择设备添加,搜索并选择需要添加的wifi放大器,根据系统提示进行下一步操作即可完成配置。配置完成后,家庭无线路由器信号将得到增强。 ... [详细]
author-avatar
荆灬樊小姐_526
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有