热门标签 | HotTags
当前位置:  开发笔记 > 运维 > 正文

挖一挖车载语音助手小P的背后,小鹏汽车为你呈现的便捷和周到

语音交互是未来主要的车内交互方式p助手。时下语音助手几乎开始向标配化的趋势发展。有资料显示:截止2021年,中国乘用车智能语音交互功能的搭载率已经高达86%。在小鹏汽车的上一代语音产品中,可见即可说的

语音交互是未来主要的车内交互方式p助手。时下语音助手几乎开始向标配化的趋势发展。有资料显示:截止2021年,中国乘用车智能语音交互功能的搭载率已经高达86%。

在小鹏汽车的上一代语音产品中,可见即可说的全场景语音能力和极低的误识别率,让语音成为鹏友连接座舱最主要的交互方式,用户使用率34个月高达99%p助手。而随着全场景语音2.0的推出,更强大的功能体验有望继续刷新这一数字。

到底什么样的语音助手才能让鹏友用起来更爽?今天我们单独聊一聊速度对于交互体验的影响,挖一挖大家都爱用的车载语音助手小P的背后,工程师为你呈现的便捷和周到p助手

挖一挖车载语音助手小P的背后,小鹏汽车为你呈现的便捷和周到

根据统计,一般来说,人与人之间的对话的间隔时间平均是在200ms,这也基本等同于大脑的反馈速度p助手。也就是说,当两个人之间对话的时候,维持在这个速度左右会比较舒服,太慢会让人着急,太快也会让人有压迫感。

在搭载全场景语音2.0的小鹏G9车载交互系统中,工程师在设计交互速度的时候充分考虑到了用户的舒适区间:从唤醒小P到界面反馈仅需245ms,而小P给出语音反馈的时间则小于700ms,是目前最快的语音助手p助手

虽然小P语音助手的交互反馈速度正在逐步接近人人交互p助手,但智能语音交互系统毕竟不同于真正会思考的人类大脑,让我们一起来看看它是通过哪些技术优化探索来实现这一效果的:

响应速度更快

在智能座舱领域,每一个功能的开发都是经过场景化的思考来决定的p助手。而这一次,工程师们将用户所有常用场景所包括的语音控制车辆、控制应用,都下放到了车端直接实现,这就大大提升了响应速度。目前,全场景语音2.0可以做到,从用户发出指令到执行动作用时在1秒以内。这也是行业最快的极速响应。

像同声传译员一样p助手,边听边想边做边答

我们刚刚讲到,从用户发出指令到执行动作用时在1秒以内,这已经是行业领先的速度p助手。但当用户指令语义模糊时,目前仍然需要更强大的服务器在线处理,联网则需要更多时间,这样的情况下,如何做到更快?为了达到更快的目标,工程师们模拟了类似“同声传译”的工作方法:用户还没说完就开始行动。同声传译员需要在工作中听得准,且不断根据新收到的信息用最快的速度调整输出语言。语音助手则需要有强大的思考能力应对不断增加的新信息带来的语义变化,同时维持准确的理解力,每一个字都可能引起巨量的服务器访问请求。拥有了流式理解能力的小P,可以边听边想边做边答,像同声传译员一样,让需求在语音指令结束的一瞬间完成全部理解。流式理解能力应用在车载语音助手领域是非常罕见的,不过,有了它,用户的在线请求的满足效率可大幅提速200ms以上。

一次多说几个指令p助手,一起执行

一般来说,我们在与人交流时,如果需要对方提供多个帮助,可能会尽量一次性告诉对方,不然对方可能会说:你能不能一次性说完?在与智能座舱的交互中,也会遇到这个场景,小P虽然不会不耐烦,但逐个发布指令到响应后再发出,多个来回大大降低执行效率,让对话过程变得很机械化,影响用户的体验p助手。面对2-4个同时发出的并行指令,其实也可以让小P同时做到。比如:当你在雨中驾车,突然雨势变大,视线也因车窗起雾开始看不清时,一句“帮我打开远光灯和雾灯打开前除雾并把雨刷速度设为高”,一句话坐享其成,安全又从容。

挖一挖车载语音助手小P的背后,小鹏汽车为你呈现的便捷和周到

为了让语音功能好用,用户能够常用,并且始终不断迭代更高的能力,小鹏的语音工程师团队在看不见的地方不断尝试着突破新的挑战,比如G9的杜比全景声的效果对于用户而言是震撼的声学效果,但对于语音控制来说,高回声的座舱空间意味着极度恶劣的声学条件,类似在卡拉OK厅里听清正常讲话,对于一台机器,其处理难度可想而知p助手

在高噪声、高混响、低信噪比环境下,通过语音基础能力的自研方案,小鹏解决了低信噪比下的回声消除难题,达到对播放中的杜比全景声音乐“充耳不闻”,并进一步,将其它噪声源发出的噪声也限制在不影响语音信号收听的程度,唤醒率和语音识别准确率都达到了97%,保障了真正准确且极速的语音控制效果p助手

小鹏全场景语音2.0所带来的极速体验以及背后所展现的能力就先讲这么多,其实,语音工程师在看不见的地方的努力还有很多,未来也会慢慢跟大家交流p助手。与智能座舱的交互伴随着用户几乎所有用车时间,所以语音交互的体验也贯穿用户的每一次出行驾乘体验。这也是小鹏为什么坚持在语音能力的研发上大力投入的原因:我们希望鹏友选择小鹏后,能够在日常用车中通过语音充分调动智能座舱的服务能力,享受科技带来的快乐和简单。

挖一挖车载语音助手小P的背后,小鹏汽车为你呈现的便捷和周到


推荐阅读
  • 容器与微服务基础:快速入门指南
    探索容器和微服务的基础知识,了解如何通过先进的应用性能管理(APM)工具提升监控效能。加入AppDynamics APM的导览,掌握容器与微服务实施及监控的最佳实践。 ... [详细]
  • 探索Squid反向代理中的远程代码执行漏洞
    本文深入探讨了在网站渗透测试过程中发现的Squid反向代理系统中存在的远程代码执行漏洞,旨在帮助网站管理者和开发者了解此类漏洞的危害及防范措施。 ... [详细]
  • Spring Cloud因其强大的功能和灵活性,被誉为开发分布式系统的‘一站式’解决方案。它不仅简化了分布式系统中的常见模式实现,还被广泛应用于企业级生产环境中。本书内容详实,覆盖了从微服务基础到Spring Cloud的高级应用,适合各层次的开发者。 ... [详细]
  • 本文详细介绍了如何使用 PHP 编程语言输出 99 乘法表,包括使用不同的循环结构如 do-while、for 循环等方法,并提供了具体的代码示例。 ... [详细]
  • 在服务器虚拟化领域,用户面临多种选择,尤其是来自同一供应商的不同产品。正确评估这些选项对于项目的成功至关重要。本文将深入探讨VMware提供的两款主要虚拟化平台——免费的VMware Server和付费的ESX Server之间的区别,旨在为决策提供专业指导。 ... [详细]
  • 本文深入探讨Java编程语言的关键特性,包括但不限于其简洁性、强大的面向对象能力、跨平台兼容性、安全机制、高效性能及多线程支持等方面。文章旨在为开发者提供全面理解Java特性的指导。 ... [详细]
  • 本文介绍了Java语言开发的远程教学系统,包括源代码、MySQL数据库配置以及相关文档,适用于计算机专业的毕业设计。系统支持远程调试,采用B/S架构,适合现代教育需求。 ... [详细]
  • 如何配置浏览器以阻止网页自动跳转及直接访问HTML文件
    本文介绍通过调整浏览器的安全设置来防止网页自动跳转的方法,同时提供了一些额外的技巧来增强网络安全性和用户体验。 ... [详细]
  • Spring Security核心概念与应用实践
    本文详细介绍了Spring Security的核心机制,包括其作为一系列过滤器的工作原理,如何实现用户认证与授权,以及常见的配置方法和高级特性如CSRF防护。 ... [详细]
  • 本文探讨了局端设备与终端设备的基本概念及其在网络架构中的作用,详细分析了两者的工作原理、分类及应用场景。 ... [详细]
  • 2017年人工智能领域的十大里程碑事件回顾
    随着2018年的临近,我们一同回顾过去一年中人工智能领域的重要进展。这一年,无论是政策层面的支持,还是技术上的突破,都显示了人工智能发展的迅猛势头。以下是精选的2017年人工智能领域最具影响力的事件。 ... [详细]
  • 智慧城市建设现状及未来趋势
    随着新基建政策的推进及‘十四五’规划的实施,我国正步入以5G、人工智能等先进技术引领的智慧经济新时代。规划强调加速数字化转型,促进数字政府建设,新基建政策亦倡导城市基础设施的全面数字化。本文探讨了智慧城市的发展背景、全球及国内进展、市场规模、架构设计,以及百度、阿里、腾讯、华为等领军企业在该领域的布局策略。 ... [详细]
  • 本文介绍了如何在 GitHub 的 Markdown 文件中正确显示数学公式的方法,适用于非博客环境。 ... [详细]
  • 正则表达式是一种强大的文本匹配工具,但在不当使用时,也可能成为安全漏洞的源头,特别是当它们被恶意利用以触发拒绝服务(DoS)攻击时。本文将深入探讨正则表达式如何成为攻击者的目标,并提供防范策略。 ... [详细]
  • 本文详细介绍了在耳觅应用中解绑或注销手机号的方法,以及如何修改绑定的手机号。 ... [详细]
author-avatar
俊谚怡雯綺修
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有