热门标签 | HotTags
当前位置:  开发笔记 > 开放平台 > 正文

陈孝良:为什么国内做不好智能音响?

雷锋网按:2017年7月8日,由CCF中国计算机学会主办,雷锋网与香港中文大学(深圳)承办的全球人工智能与机器人峰会CCF-GAIR大会进入第二天。在智能助手专场,中国科学院声学研

雷锋网按:2017 年 7 月 8 日,由 CCF 中国计算机学会主办,雷锋网与香港中文大学(深圳)承办的全球人工智能与机器人峰会 CCF-GAIR 大会进入第二天。在智能助手专场,中国科学院声学研究所副研究员、声智科技创始人陈孝良带来了以《人机语音交互的技术趋势与商业机遇》为题的主题演讲。

陈孝良:为什么国内做不好智能音响? | CCF-GAIR 2017

雷锋网注:声智科技创始人陈孝良

语音加速人机交互方式的变革,可能会重新定义很多消费电子。极端一点,如果将来所有消费电子都支持语音交互,那这个市场很大,基本上会在全球范围内重构整个产业链条。

首先,麦克风在性能、低功耗方面要做很大改进。事实上,整个全球市场,国内的麦克风产业占比很小,即便国内有些麦克风利用国外的技术来进行生产,但核心技术还是不在国内。而且我们现在做的麦克风是标量麦克风,只能取一个物理量,如果要解决很复杂的声学问题,就需要矢量麦克风。当然,矢量麦克风还有点遥远。

第二个挑战是芯片。我们现在所有的消费电子,特别是偏重人工智能的,前端大量用了 ARM 架构,GPU 比较少。GPU 用在服务端离线数据的训练,这是我们很大的问题。比较灵活的 GPU,国外三家巨头和国内基本没有太大关联。

第三个挑战是算法。声学是每个国家比较封闭的领域,因为声学主要是为军工服务,所以各个国家相互保密,只能各自发展。比如大量使用的机器学习,国内在做改进性技术,我们如何在原创方面比国外领先,这是很大的技术挑战。

陈孝良:为什么国内做不好智能音响? | CCF-GAIR 2017

第四个挑战是商业化挑战,它又分为三个层面。

  • 第一是产品。国外最著名的是亚马逊 Echo,国内有京东、联想、小米的产品。这些产品有的做过评测,我相信很难得到大家 100% 的认同,甚至大家能给 80 分就不错了。这是个比较大的问题。

  • 第二是内容和服务。国内的内容和服务比较割裂,腾讯在国内占有很大的音乐版权,百度有很大的搜索,交易大量在阿里,但亚马逊就把很多优势集中在一起。所以国内的产品很难避免和巨头合作,但是三家巨头如何合作?怎么选你的产品有很大的缺失。

  • 第三是知识产权,标准。亚马逊、微软都在联合生态做标准,甚至包括 ARM,本身我们也是 ARM 生态联盟的。如果大家查专利,可以看到中文的专利也不是国内公司占领先地位。2010 年到 2015 年的排名顺序,我们挤不进前列。

陈孝良:为什么国内做不好智能音响? | CCF-GAIR 2017

刚才说了很多挑战,下面和大家交流一下技术的发展趋势。

  1. 麦克风现在是标量麦克风,下一步做智能麦克风,最后要做到矢量麦克风。这么大的会场,如果大家小声交流,这个声音对机器来说就很难处理。另外芯片到底是什么架构?低功耗,对接云端,都是需要我们考虑的问题。

  2. 下一代 AI 技术是融合的。麦克风和视频、雷达的融合,声光电三个学术合在一起应该怎么做,这也是下一步需要整个研究和开发的。

  3. 算法与模型,我们做得更多。比如我们的声源定位,目前只能跟踪一个目标,能不能同时跟踪多个目标,这是非常重要的,包括离线唤醒、离线语音识别。另外,机器学习是不是只用大数据,还是可以用别的方法做一些小样数据的处理,进行冷启动,这是我们下一步要研究的方法。

  4. 音响不存在死不死的问题,它是除了笔记本和手机以外,消费电子里面拥有量最多的。但我们做这个事情需要数据,特别是远场数据,不像近场数据可以直接录,这是非常严重的问题。冷启动的时候必须要选一个品类获得启动数据。

陈孝良:为什么国内做不好智能音响? | CCF-GAIR 2017

在产品定位方面,国内外也有很大不同。

国外亚马逊 Echo、谷歌 Home、苹果 Homepod、微软 Invoke,国内就是叮咚智能音响、联想智能音响、小雅智能音响、天猫精灵。

国外的产品很忌讳叫 Speaker。当时苹果推Homepod,大家都就猜是不是会带“Speaker”,结果选了Homepod,它天然加了两个因素,一个是Home,一个是pod,这和国内的定位有很大的差异。

现在智能音响的产品玩家很多,不光是巨头,包括国内的、深圳很多厂商都做,这里面比较严重的问题是亚马逊对生态链的重视,可能远不如我们想的那么重要。因为亚马逊比较喜欢玩自由生态。前段时间亚马逊和苹果联合降价就可以看出,它可以把产品突然降 100 美元,如果考虑生态链,这是非常严重的,可能导致很多厂商的产品卖不出去。

远场语音交互的开始是智能音响,但是将来绝对不仅仅是智能音响,其他人也不会把技术限定在智能音响,还包括很多其他的产品。

来自雷锋网(公众号:雷锋网)报道。


推荐阅读
  • 如何使用PLEX播放组播、抓取信号源以及设置路由器
    本文介绍了如何使用PLEX播放组播、抓取信号源以及设置路由器。通过使用xTeve软件和M3U源,用户可以在PLEX上实现直播功能,并且可以自动匹配EPG信息和定时录制节目。同时,本文还提供了从华为itv盒子提取组播地址的方法以及如何在ASUS固件路由器上设置IPTV。在使用PLEX之前,建议先使用VLC测试是否可以正常播放UDPXY转发的iptv流。最后,本文还介绍了docker版xTeve的设置方法。 ... [详细]
  • 微软头条实习生分享深度学习自学指南
    本文介绍了一位微软头条实习生自学深度学习的经验分享,包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性,并提供了一些建议。 ... [详细]
  • 2018年人工智能大数据的爆发,学Java还是Python?
    本文介绍了2018年人工智能大数据的爆发以及学习Java和Python的相关知识。在人工智能和大数据时代,Java和Python这两门编程语言都很优秀且火爆。选择学习哪门语言要根据个人兴趣爱好来决定。Python是一门拥有简洁语法的高级编程语言,容易上手。其特色之一是强制使用空白符作为语句缩进,使得新手可以快速上手。目前,Python在人工智能领域有着广泛的应用。如果对Java、Python或大数据感兴趣,欢迎加入qq群458345782。 ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 本文介绍了adg架构设置在企业数据治理中的应用。随着信息技术的发展,企业IT系统的快速发展使得数据成为企业业务增长的新动力,但同时也带来了数据冗余、数据难发现、效率低下、资源消耗等问题。本文讨论了企业面临的几类尖锐问题,并提出了解决方案,包括确保库表结构与系统测试版本一致、避免数据冗余、快速定位问题等。此外,本文还探讨了adg架构在大版本升级、上云服务和微服务治理方面的应用。通过本文的介绍,读者可以了解到adg架构设置的重要性及其在企业数据治理中的应用。 ... [详细]
  • 统一知识图谱学习和建议:更好地理解用户偏好
    本文介绍了一种将知识图谱纳入推荐系统的方法,以提高推荐的准确性和可解释性。与现有方法不同的是,本方法考虑了知识图谱的不完整性,并在知识图谱中传输关系信息,以更好地理解用户的偏好。通过大量实验,验证了本方法在推荐任务和知识图谱完成任务上的优势。 ... [详细]
  • GPT-3发布,动动手指就能自动生成代码的神器来了!
    近日,OpenAI发布了最新的NLP模型GPT-3,该模型在GitHub趋势榜上名列前茅。GPT-3使用的数据集容量达到45TB,参数个数高达1750亿,训练好的模型需要700G的硬盘空间来存储。一位开发者根据GPT-3模型上线了一个名为debuid的网站,用户只需用英语描述需求,前端代码就能自动生成。这个神奇的功能让许多程序员感到惊讶。去年,OpenAI在与世界冠军OG战队的表演赛中展示了他们的强化学习模型,在限定条件下以2:0完胜人类冠军。 ... [详细]
  • Learning to Paint with Model-based Deep Reinforcement Learning
    本文介绍了一种基于模型的深度强化学习方法,通过结合神经渲染器,教机器像人类画家一样进行绘画。该方法能够生成笔画的坐标点、半径、透明度、颜色值等,以生成类似于给定目标图像的绘画。文章还讨论了该方法面临的挑战,包括绘制纹理丰富的图像等。通过对比实验的结果,作者证明了基于模型的深度强化学习方法相对于基于模型的DDPG和模型无关的DDPG方法的优势。该研究对于深度强化学习在绘画领域的应用具有重要意义。 ... [详细]
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • 杭州PHP大厂有哪些(2023年最新分享)
    导读:今天编程笔记来给各位分享关于杭州PHP大厂有哪些的相关内容,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!本文目录一览: ... [详细]
  • 老牌医药收割AI红利:先投个15亿美元抢中国人才
    萧箫发自凹非寺量子位报道|公众号QbitAI没想到,一场大会把我的“刻板印象”攻破了。2021世界人工智能大会现场,能看见不少熟悉的身影, ... [详细]
  • 驭势科技签约禾赛科技,携手推进“全场景”自动驾驶商业化
    2021年12月8日,全球领先的激光雷达公司禾赛科技和自动驾驶商业化全球领跑的公司驭势科技共同宣布,双方达成战略合作协议。根据协议,禾赛将 ... [详细]
  • 周鸿祎火力全开
    “在这个IoT时代,只是孤立地搞大数据,孤立地搞云,或谈AI,或做一个智能硬件,我觉得都是不完备的,必须将这几项技术综合运用起来,才是一个真正的IoT时代,也是IoT真正的春天。” ... [详细]
  • Ansem 最新雄文:软着陆后,加密市场下阶段趋势与核心叙事
    市场最糟糕的时候已经过去,以太坊合并前不太会看到新的低点;但仍需来自关注宏观市场的不确定风险。撰文:Ansem ... [详细]
  • 2017亚马逊人工智能奖公布:他们的AI有什么不同?
    事实上,在我们周围,“人工智能”让一切都变得更“智能”极具讽刺意味。随着人类与机器智能之间的界限变得模糊,我们的世界正在变成一个机器 ... [详细]
author-avatar
YYANNILl_242
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有