当前位置: 开发笔记 > 编程语言 > 正文

惹怒程序员的下场！阿里达摩院大神受不了骚扰电话，业余发起“二哈”AI，315后爆红...

作者：zhu宝宝meng | 来源：互联网 | 2023-07-08 18:51

李根发自首都机场量子位报道|公众号QbitAI不要惹怒程序员。不要惹怒程序员。不要惹怒程序员。即便你是一年呼出40亿次的机器人骚扰电话。在3.15晚会曝光机器人拨打骚扰电话黑色产业

李根发自首都机场
量子位报道 | 公众号 QbitAI

不要惹怒程序员。不要惹怒程序员。不要惹怒程序员。

即便你是一年呼出40亿次的机器人骚扰电话。

在3.15晚会曝光机器人拨打骚扰电话黑色产业链后&＃xff0c;大众震惊&＃xff0c;舆论哗然&＃xff0c;AI从业者痛心。

没想到最前沿的AI技术&＃xff0c;正被别有用心企业引向黑暗面。

但数小时后&＃xff0c;阿里就宣布推出防骚扰电话AI技术&＃xff0c;称机器人的问题交给机器人对付。

在放出的视频Demo中&＃xff0c;阿里AI实验室推出防骚扰电话AI&＃xff0c;并且在一段完整推销电话中&＃xff0c;人类女推销员一方&＃xff0c;全程毫无察觉……

640?wx_fmt&＃61;gif

其后&＃xff0c;阿里还在支付宝小程序和天猫精灵App推出开放体验&＃xff0c;反馈也不错。

当然&＃xff0c;聂再清也未曾料到&＃xff0c;自己的业余项目&＃xff0c;就这样受到如此空前的关注。

640?wx_fmt&＃61;jpeg

这位阿里巴巴AI实验室语音助手首席科学家、阿里AI北京研发中心负责人&＃xff0c;前微软亚洲研究院首席研究员解释项目初衷时说&＃xff1a;

经常收到骚扰电话实在太烦了&＃xff0c;而且团队开会&＃xff0c;经常被各种电话骚扰、打断&＃xff0c;以致会都没法儿开&＃xff0c;于是就想——能不能用技术的方式解决一下。

于是&＃xff0c;阿里防骚扰电话AI“二哈”就此诞生。

让机器对付机器

在阿里AI实验室内部&＃xff0c;“二哈”是这个智能防骚扰电话技术的项目代号。

当用户在手机上开通了这项服务&＃xff0c;在接到骚扰来电时&＃xff0c;用户可以直接转接给机器人接听。

阿里还放出演示视频&＃xff0c;展示“二哈”的工作状态。

当一名推销贷款的女推销员接入电话后&＃xff0c;1分钟时间内&＃xff0c;“二哈”不但对答如流&＃xff0c;甚至化被动为主动&＃xff0c;向这她咨询“北京能不能贷款&＃xff1f;”“最多能贷多少钱&＃xff1f;”

640?wx_fmt&＃61;gif

甚至还在对话中“调戏”道&＃xff1a;“你之前给我打过电话吧&＃xff0c;听起来挺耳熟的&＃xff1f;”全程中女推销员丝毫没有察觉到与自己通话的是一个机器人。

最后&＃xff0c;“二哈”AI还被女推销员索要“微信号”。

640?wx_fmt&＃61;gif

视频一出&＃xff0c;微博上就炸了锅。

有吃惊的&＃xff0c;“不看标题根本不会知道有机器人。”

640?wx_fmt&＃61;png

有提出小建议&＃xff0c;搞“机机大战”的&＃xff1a;

640?wx_fmt&＃61;png

还有来自AI学者的评价&＃xff0c;比如清华大学刘知远就说&＃xff0c;不仅防骚扰&＃xff0c;还能变相收集数据集&＃xff0c;点赞了该技术应用。

640?wx_fmt&＃61;png

另外&＃xff0c;阿里AI实验室旗下的“天猫精灵”还表示&＃xff0c;这是一个已经通过了很多人的“图灵测试”的机器人&＃xff0c;现在就可以打开天猫精灵App或支付宝搜索天猫精灵调戏“二哈”了。

640?wx_fmt&＃61;png

总之&＃xff0c;AI的问题&＃xff0c;正在由AI解决。

技术原理&＃xff1a;智能聊天

阿里AI北京研发中心负责人聂再清博士解释&＃xff0c;“二哈”背后&＃xff0c;主要使用了智能聊天技术。

所谓“智能聊天”&＃xff0c;需要理解用户请求&＃xff0c;同时用强大的知识图谱制作聊天的知识点&＃xff0c;通过跟用户对话&＃xff0c;把知识图谱里的知识灌输给用户&＃xff0c;同时也引导用户反馈。

640?wx_fmt&＃61;png

该过程中&＃xff0c;AI跟用户聊的越多越好&＃xff0c;AI会学到很多知识&＃xff0c;用户聊完以后也会“教学相长”并慢慢把AI当朋友。

更具体来说&＃xff0c;智能聊天是用深度强化学习来学习对话策略的&＃xff0c;因为不是精度要求非常高的任务完成。

所以就算AI聊错一点&＃xff0c;没有多大的关系&＃xff0c;用户只是会对这个回复不太高兴&＃xff08;不像任务完成时需要100%准确完成主人的任务&＃xff09;。

640?wx_fmt&＃61;png

通过强化学习&＃xff0c;下次对话策略算法就可能更好地知道&＃xff0c;到底应该怎么和这类用户聊天。

如果从垂直技术应用划分&＃xff0c;过程中交叉使用了语音识别、NLP、知识图谱&＃xff0c;以及语音合成&＃xff08;TTS&＃xff09;等技术。

聂再清解释&＃xff1a;

首先用到了语音识别技术把用户的语音转成文字。
接着自然语言理解技术&＃xff0c;把来电者的意图和具体的槽值抽取出来。
紧接着对应到一个精准的知识图谱上面去&＃xff0c;这样“二哈”就能把用户输入和现实世界的人与物联系起来。
然后&＃xff0c;基于对用户当前输入的理解以及历史交互的上下文信息&＃xff0c;“二哈”需要决定下一句应该是回答来电者的一个问题还是给来电者提一个问题。
最后&＃xff0c;二哈还需要用的语音合作技术&＃xff08;TTS&＃xff09;把文字变成人声。

但听起来章法清晰、步骤明确&＃xff0c;要真正做到真假难辨却不容易。

如何做到真假难辨&＃xff1f;

聂再清认为核心要做到以下3大方面&＃xff1a;

第一&＃xff0c;接住用户的每一句话。

因为用户的输入空间非常大&＃xff0c;要理解和聪明的回复来电者的每一句话很有难度。

对于一些不是“二哈”知识领域的问题&＃xff0c;阿里AI目前采用了闲聊&＃xff08;ChitChat&＃xff09;的技术&＃xff0c;从互联网上公开的人类对话库中来找到最适合回复&＃xff0c;这是一种基于 information retrieval 思路来找到排名最高的相关回复。

目标是让来电者看不出“二哈”可能的知识缺乏。

第二&＃xff0c;主动提出一个相关问题。

这更多是一个对话策略学习的工作&＃xff0c;需要让来电者知道“二哈”真能理解他们的话&＃xff0c;并提出只有理解了对话上下文&＃xff0c;才能提出的好问题。

一味被动接话&＃xff0c;很容易被识破。

该项挑战非常大&＃xff0c;聂再清在2018年AAAI上有一篇参与发表的论文&＃xff08;CoChat: Enabling Bot and Human Collaboration for Task Completion&＃xff09;&＃xff0c;核心就是提出一套聊天机器人对话策略学习框架&＃xff0c;让“二哈”这样的聊天机器人在不同的场景下都可以持续学习。

640?wx_fmt&＃61;png

包括监督学习、在线学习、和深度强化学习&＃xff08;使用sentiment analysis提供奖惩反馈信号&＃xff09;。不同的聊天机器人根据自己的场景要求可以选择使用不同的学习策略。

比方说有人工worker的客服领域就可以更多使用在线学习&＃xff0c;“二哈”这样的机器人可以用监督学习启动&＃xff0c;深度强化学习不断进步。

并且通过和人类不断对话&＃xff0c;“二哈”AI会通过深度强化学习越来越好地知道如何提问才能更好地达成他的目标。

最后&＃xff0c;像真人一样的语音语调以及停顿。

如果推销广告的骚扰电话&＃xff0c;通过声音判断初接电话的是个机器人&＃xff0c;他们就不会继续聊下去了。

所以“二哈”在语音合成&＃xff08;TTS&＃xff09;方面做了很多工作。

阿里AI最新算法利用Tacotron加上基于神经网络的声码器算法&＃xff0c;合成出极其逼真的人声&＃xff0c;但遗憾的是还有很大比例情况不能通过图灵测试。

于是“二哈”现在采取了过渡性方案&＃xff0c;把非常高频的回复借用真人录播。但毫无疑问&＃xff0c;未来该方案会不断减少。

而且值得注意的是&＃xff0c;“二哈”最初只是一个课余项目。

640?wx_fmt&＃61;jpeg

不要惹怒程序员

“二哈”研发初衷&＃xff0c;实在是对日益普遍的骚扰电话很生气。

聂再清说&＃xff0c;自己一直都是同一个电话号&＃xff0c;于是泄露越来越严重&＃xff0c;经常收到骚扰电话。

还影响到团队工作&＃xff0c;会议进行中&＃xff0c;同事们经常被各类电话打断导致会议终中断&＃xff0c;于是开始思考着如何用技术的方式解决。

而且更可气的是&＃xff0c;大量骚扰电话是机器自动拨出的&＃xff0c;成本越来越低。

此外也算天时地利人和。

640?wx_fmt&＃61;jpeg

在阿里AI实验室&＃xff0c;聂再清团队负责天猫精灵的算法&＃xff0c;所以所有相关人才团队里都有&＃xff1a;语音识别、NLP、知识图谱……全链条覆盖。

并且跟语音助手一致&＃xff0c;智能对话的基础算法也都通用。

于是他们先以“课余”项目开始&＃xff0c;兴趣驱动&＃xff0c;参与的工程师都很开心&＃xff0c;一方面是解气&＃xff0c;另一方面也是知道背后带来的意义。

其后一切也进展飞快&＃xff0c;最终在本月月初&＃xff0c;开始向公司申报&＃xff0c;并立项启动。

没想到在今年3.15晚会上&＃xff0c;机器人骚扰电话引起如此大关注。

于是团队决定公开最新研发成果&＃xff0c;“二哈”也正式从幕后走到台前。

一炮而红。

640?wx_fmt&＃61;gif

AI电话秘书

但“二哈”就只是帮对付骚扰电话而已嘛&＃xff1f;

不。

聂再清说&＃xff0c;“二哈”的进一步的目标是成为每个人的AI电话秘书&＃xff0c;除了帮主人应付骚扰电话&＃xff0c;还可以在主人繁忙的时候询问来电的主要意图&＃xff0c;也能帮主人预约议程。

640?wx_fmt&＃61;jpeg

而且相比之前人类的电话、议程为工作核心的秘书助理&＃xff0c;“二哈”这样的AI电话秘书&＃xff0c;可以利用个性化TTS&＃xff0c;模仿出跟主人声音极尽逼真的声音。

另外&＃xff0c;这样的目标也并不是遥不可及的“憧憬”。

至少现在&＃xff0c;利用“二哈”实现AI呼叫转移&＃xff0c;已经不再是技术难题。

AI可以在你不方便接电话时帮接听来电&＃xff0c;并转换成文字向你“汇报”。

你愿意为这样的AI服务买单吗&＃xff1f;

640?wx_fmt&＃61;png

论文传送门&＃xff1a;

CoChat: Enabling Bot and Human Collaboration for Task Completion

https://www.aaai.org/ocs/index.php/AAAI/AAAI18/paper/download/16748/16081

Learning-to-Ask: Knowledge Acquisition via 20 Questions

https://arxiv.org/abs/1806.08554

— 完 —

订阅AI内参&＃xff0c;获取行业资讯

640?wx_fmt&＃61;jpeg

诚挚招聘

量子位正在招募编辑/记者&＃xff0c;工作地点在北京中关村。期待有才气、有热情的同学加入我们&＃xff01;相关细节&＃xff0c;请在量子位公众号(QbitAI)对话界面&＃xff0c;回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ&＃39;ᴗ&＃39; ի 追踪AI技术和产品新动态

喜欢就点「好看」吧 !

推荐阅读

io
aw多模态融合,多模态话语分析

本博文基于《Amalgamationofproteinsequence,structureandtextualinformationforimprovingprote ... [详细]

蜡笔小新 2023-10-17 19:16:14
js
【机器学习】生成式对抗网络模型综述

生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型，可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]

蜡笔小新 2023-12-14 17:51:18
io
【论文】ICLR 2020 九篇满分论文！！！

点击上方，选择星标或置顶，每天给你送干货！阅读大概需要11分钟跟随小博主，每天进步一丢丢来自：深度学习技术前沿 ... [详细]

蜡笔小新 2023-10-17 18:45:53
import
也就是|小窗_卷积的特征提取与参数计算

篇首语：本文由编程笔记#小编为大家整理，主要介绍了卷积的特征提取与参数计算相关的知识，希望对你有一定的参考价值。Dense和Conv2D根本区别在于，Den ... [详细]

蜡笔小新 2023-12-13 12:59:48
js
浏览器中的异常检测算法及其在深度学习中的应用

本文介绍了在浏览器中进行异常检测的算法，包括统计学方法和机器学习方法，并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测，可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率，而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]

蜡笔小新 2023-12-12 16:22:39
io
Learning to Paint with Model-based Deep Reinforcement Learning

本文介绍了一种基于模型的深度强化学习方法，通过结合神经渲染器，教机器像人类画家一样进行绘画。该方法能够生成笔画的坐标点、半径、透明度、颜色值等，以生成类似于给定目标图像的绘画。文章还讨论了该方法面临的挑战，包括绘制纹理丰富的图像等。通过对比实验的结果，作者证明了基于模型的深度强化学习方法相对于基于模型的DDPG和模型无关的DDPG方法的优势。该研究对于深度强化学习在绘画领域的应用具有重要意义。 ... [详细]

蜡笔小新 2023-12-11 10:27:44
io
ICRA2019最佳论文 Making Sense of Vision and Touch: SelfSupervised Learning of Multimodal Representatio

文章目录摘要模型架构模态编码器自监督预测控制器设计策略学习控制器设计实验结论和展望会议：ICRA2019标题：《MakingSenseofVision ... [详细]

蜡笔小新 2023-10-17 12:49:25
io
微软头条实习生分享深度学习自学指南

本文介绍了一位微软头条实习生自学深度学习的经验分享，包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性，并提供了一些建议。 ... [详细]

蜡笔小新 2023-12-14 20:58:32
import
Python张量流中的device spec make_merged_spec()方法使用说明

本文介绍了在Python张量流中使用make_merged_spec()方法合并设备规格对象的方法和语法，以及参数和返回值的说明，并提供了一个示例代码。 ... [详细]

蜡笔小新 2023-12-11 12:15:19
io
统一知识图谱学习和建议：更好地理解用户偏好

本文介绍了一种将知识图谱纳入推荐系统的方法，以提高推荐的准确性和可解释性。与现有方法不同的是，本方法考虑了知识图谱的不完整性，并在知识图谱中传输关系信息，以更好地理解用户的偏好。通过大量实验，验证了本方法在推荐任务和知识图谱完成任务上的优势。 ... [详细]

蜡笔小新 2023-12-11 11:11:02
io
揭秘阿里云WAF背后神秘的AI智能防御体系

背景应用安全领域，各类攻击长久以来都危害着互联网上的应用，在web应用安全风险中，各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]

蜡笔小新 2023-12-11 01:30:52
io
顾客信息表mysql_客户基本信息数据库表

{moduleinfo:{card_count:[{count_phone:1,count:1}],search_count:[{count_phone:4 ... [详细]

蜡笔小新 2023-10-17 23:09:27
io
深入理解线程、进程、多线程、线程池

本文以QT的方式来走进线程池的应用、线程、进程、线程池、线程锁、互斥量、信号量、线程同步等的详解，一文让你小白变大神!为什么要使用多线程、线程锁、互斥量、信号量？为什么需要线程 ... [详细]

蜡笔小新 2023-10-17 21:29:01
io
人工智能推理能力与假设检验

最近Google的Deepmind开始研究如何让AI做数学题。这个问题的提出非常有启发，逻辑推理，发现新知识的能力应该是强人工智能出现自我意识之前最需要发展的能力。深度学习目前可以 ... [详细]

蜡笔小新 2023-10-17 10:01:37
io
Windows7 安装TensorflowGPU文档

安装Tensorflow-GPU文档第一步：通过Anaconda安装python从这个链接https:www.anaconda.comdownload#window ... [详细]

蜡笔小新 2023-10-17 07:23:13