热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

陶大程:判断人工智能是否可信的“四把尺子”

作者|维克多编辑|青暮在2021年世界人工智能大会的可信AI论坛上,陶大程进行了主题为《可信人工智能的前世今生》的报告。他在报告中表示,在人工智能的

陶大程:判断人工智能是否可信的“四把尺子”

作者 | 维克多

编辑 | 青暮

在2021年世界人工智能大会的可信AI论坛上,陶大程进行了主题为《可信人工智能的前世今生》的报告。他在报告中表示,在人工智能的技术落地浪潮中,AI的可信度将成为一大关键难点,他还基于国内实践提出了人工智能是否可信的四个度量标准,并指出在可信AI的框架探索方面,我们还有很长的路要走。

陶大程是人工智能和信息科学领域国际知名学者、澳大利亚尤里卡(Eureka)奖获得者、IEEE ICDM研究贡献奖(数据科学领域技术成就最高奖之一)。他目前担任京东探索研究院院长。

以下是报告原文,AI科技评论进行了不改变原意的整理。

1 前世今生

今天介绍一下可信人工智能的前世今生。人工智能并不是一个新的概念,从1950年的图灵之问开始,到今天产业的蓬勃发展。起起伏伏,人工智能已经走过了三次浪潮,甚至有学者认为,我们今天正处在第四次浪潮,其特点是:广泛的产业落地。

正是由于“落地”,所以才带来了一些问题,因此讨论可信AI正是时候。先来看一些可信AI的例子,大家在网上购物的时候,经常会使用拍照购这一功能,其使用的是计算机识别技术。如果拍照购识别的照片含有“小标签”或者被遮挡了一下,那么这个时候,AI系统就无法准确识别;我们曾经对自动驾驶系统做过一个实验,如果将小广告贴在道路交通牌上,那么就到导致自动驾驶系统误判。

因为人工智能缺乏可解释性,这也限制了人工智能更广泛的应用和赋能。举个例子,无人驾驶车辆在道路上出现事故,该如何定责任?由于无法解释,在将驾驶权从人类转交到人工智能系统的过程中就会产生困难。毕竟,人类驾驶员无法在短短的几秒钟之内对道路情况进行及时的判断。

此外,无论是欧盟的GDPR,还是中国的个人信息保护法,都表明用户的个人信息在使用的时候必须谨慎。这其实也对人工智能系统的模型提出了很多要求。

另一方面,不仅仅是成年人在使用人工智能系统,儿童同样在使用,如何公平地考虑各种因素,保证所有人都公平享受到技术带来的价值,也是人工智能领域从业者所要思考的。

在上述急迫的需求下,2016年欧洲颁布《通用数据保护条例》,2017年12月份,IEEE提出了《人工智能的伦理设计准则》。之后澳洲、美国等多个国家和地区也相继发布相关政策、指南、白皮书。

国内情况如何呢?中国科学家何积丰院士于 2017 年11 月香山科学会议第 S36 次学术研讨会首次在国内提出了 可信人工智能的概念,即人工智能技术本身应具备可信的品质。2017年12月份,工信部发布了《促进新一代人工智能产业发展三年行动计划》,在此之后,中国的科技公司都提出了相应的可信人工智能发展规划。

2019年10月,京东首次在乌镇世界互联网大会提出践行“可信赖AI”六大维度;2021年4月份,可信人工智能正式列为京东探索研究院主要研究方向之一。

其实,可信人工智能也并不是一个新的概念,很多组织或者机构都在谈论可信人工智能。从2017年到今天,已经诞生了许多概念,例如IEEE提出了透明性,以正确的方式使用技术,以人为本,明确责任,造福人类。澳大利亚提出了隐私保护,明确责任,提高透明性和可解释性等。

在中国,我们更多地谈到包容共享、和谐友好、公平公正、安全可控等等几个维度。在学术研究方面,在1998年甚至更早,就有隐私保护、数据治理、公平包容、明确责任等等相关方面的科技文献。

综上,可信涉及的领域非常多,那么这些领域之间有何关系?例如安全可靠意味着什么?它和稳定性和可解释性有什么关系?而在造福社会等主题中,可解释性、隐私保护、公平性在其中发挥怎样的作用?

2 四把尺子

接下来,我会从四个方面进行“可信”度量,包括:稳定性、可解释性、隐私保护、公平性,可以称之为可信AI判断的四把尺子。

其中,稳定性是指:人工智能系统能够抵抗恶意攻击;可解释性是指:人工智能系统所作出的决策需要让人类能够理解;隐私保护是指:人工智能系统不能把个人的隐私信息或者群体的隐私信息进行泄露;公平性是指:人工智能公平对待所有用户。

如果人工智能在以上四大度量上都达到很高的水平,就能够做到明确责任、透明可信。

稳定性的度量有很多种方式,例如对抗攻击、中毒攻击和后门攻击。这些攻击都会影响人工智能系统,我们需要度量系统在面对这些攻击时,是否足够稳定。这些攻击技术既可互相独立也可以同时存在。

下面举例说明这几种攻击方式:中毒攻击通过按照特殊的规则进行恶意评论等方式,向训练数据集投入干扰数据,继而影响推荐系统的准确度;对抗攻击通过在道路交通标志牌上贴上特殊设计的图案,可以误导自动驾驶系统使其错误识别路牌上的信息,进而造成交通事故;后门攻击具有隐蔽性,可能会被用于对 AI 供应链发动攻击。相比于传统的软件系统,此类干扰对人工智能系统的稳定性影响更大。

可解释性的度量包含很多方面,例如我们如何描述模型的泛化能力?如何理解神经网络损失曲面的几何结构等等。其实,除了模型和算法的可解释性之外,训练样本、测试样本的可解释性也非常重要。人工智能的可解释性还有非常远的路要走,需要学术界在深度学习及人工智能的基础数学理论方面继续发力,只有找到合适的数学工具、统计工具、几何工具才能够有效的描述人工智能系统的可解释性。

今天,人们越来越重视隐私保护,我们在使用人工智能系统的时候,非常想了解它是否保护了我们的个人隐私不受侵犯。如何度量模型的隐私保护能力呢?差分隐私是一个主要的量化指标。其核心思想是,一个具有优秀隐私保护能力的人工智能算法,应当对输入数据中的微小扰动不敏感。

通俗理解是:我们使用一个数据库进行模型训练,对此数据库进行微调之后,就得到了另外一个数据库,然后用微调的数据库再次训练人工智能模型,就会得到另一个模型,最后,衡量两个模型之间的差异,量化模型的隐私保护能力。

基于该思想,可以通过对数据进行下采样、顺序置换、添加噪声等方式,来防御攻击者的隐私窃取行为。

此外,隐私攻击方式也可以用来衡量模型的隐私保护能力。常用的攻击方式有成员推断攻击、模型反转攻击等等。如果攻击的成功率越低,表明模型的隐私保护能力越强。

关于公平性,我们需要考虑个体公平和群体公平两个方面。对于不同的个体,我们希望系统不要有偏差。这非常困难,即使对于人类而言,这也是很难达到的。例如,在参加委员会表决的过程中,为了消除Cultural Specials,通常会有专门的培训。至于群体的公平性,则需要考虑大群体和小群体。

3 统一框架

陶大程:判断人工智能是否可信的“四把尺子”

那么,稳定性、隐私保护、公平性、可解释性(泛化能力),它们之间有何联系?如何相互影响?其实需要深入研究。目前对于隐私保护和可解释性之间的关系,我们已经有了初步的研究成果:例如,通过利用差分隐私来解释泛化能力,我们发现模型的泛化能力和隐私保护能力具有协同性。

至于泛化能力和公平性,稳定性和公平性,公平性和隐私保护之间是什么样的关系,有待于我们进一步考察,有可能是协同的,也可能是平衡的。

要想最终实现可信人工智能,就要找到统一的综合治理框架。也就是说,我们需要构建可信人工智能的大一统理论,帮助我们实现有效的可信治理。


推荐阅读
  • 强人工智能时代,区块链的角色与前景
    随着强人工智能的崛起,区块链技术在新的技术生态中扮演着怎样的角色?本文探讨了区块链与强人工智能之间的互补关系及其在未来技术发展中的重要性。 ... [详细]
  • 2017年人工智能领域的十大里程碑事件回顾
    随着2018年的临近,我们一同回顾过去一年中人工智能领域的重要进展。这一年,无论是政策层面的支持,还是技术上的突破,都显示了人工智能发展的迅猛势头。以下是精选的2017年人工智能领域最具影响力的事件。 ... [详细]
  • 智慧城市建设现状及未来趋势
    随着新基建政策的推进及‘十四五’规划的实施,我国正步入以5G、人工智能等先进技术引领的智慧经济新时代。规划强调加速数字化转型,促进数字政府建设,新基建政策亦倡导城市基础设施的全面数字化。本文探讨了智慧城市的发展背景、全球及国内进展、市场规模、架构设计,以及百度、阿里、腾讯、华为等领军企业在该领域的布局策略。 ... [详细]
  • 能够感知你情绪状态的智能机器人即将问世 | 科技前沿观察
    本周科技前沿报道了多项重要进展,包括美国多所高校在机器人技术和自动驾驶领域的最新研究成果,以及硅谷大型企业在智能硬件和深度学习技术上的突破性进展。特别值得一提的是,一款能够感知用户情绪状态的智能机器人即将问世,为未来的人机交互带来了全新的可能性。 ... [详细]
  • 机器学习中的相似度度量与模型优化
    本文探讨了机器学习中常见的相似度度量方法,包括余弦相似度、欧氏距离和马氏距离,并详细介绍了如何通过选择合适的模型复杂度和正则化来提高模型的泛化能力。此外,文章还涵盖了模型评估的各种方法和指标,以及不同分类器的工作原理和应用场景。 ... [详细]
  • 本文档旨在帮助开发者回顾游戏开发中的人工智能技术,涵盖移动算法、群聚行为、路径规划、脚本AI、有限状态机、模糊逻辑、规则式AI、概率论与贝叶斯技术、神经网络及遗传算法等内容。 ... [详细]
  • 本文探讨了亚马逊Go如何通过技术创新推动零售业的发展,以及面临的市场和隐私挑战。同时,介绍了亚马逊最新的‘刷手支付’技术及其潜在影响。 ... [详细]
  • 大数据时代的机器学习:人工特征工程与线性模型的局限
    本文探讨了在大数据背景下,人工特征工程与线性模型的应用及其局限性。随着数据量的激增和技术的进步,传统的特征工程方法面临挑战,文章提出了未来发展的可能方向。 ... [详细]
  • ICML2020: 利用贝叶斯元学习在全局关系图上实现小样本关系抽取
    本文介绍了加拿大蒙特利尔大学Mila研究所唐建教授团队在ICML2020上发布的一项研究,该研究探讨了如何利用全局关系图来探索句子间的新关系,并提出了一种创新的贝叶斯元学习方法。 ... [详细]
  • 《计算机视觉:算法与应用》第二版初稿上线,全面更新迎接未来
    经典计算机视觉教材《计算机视觉:算法与应用》迎来了其第二版,现已开放初稿下载。本书由Facebook研究科学家Richard Szeliski撰写,自2010年首版以来,一直是该领域的标准参考书。 ... [详细]
  • 探索CNN的可视化技术
    神经网络的可视化在理论学习与实践应用中扮演着至关重要的角色。本文深入探讨了三种有效的CNN(卷积神经网络)可视化方法,旨在帮助读者更好地理解和优化模型。 ... [详细]
  • 自动驾驶中的9种传感器融合算法
    来源丨AI修炼之路在自动驾驶汽车中,传感器融合是融合来自多个传感器数据的过程。该步骤在机器人技术中是强制性的,因为它提供了更高的可靠性、冗余性以及最终的 ... [详细]
  • 机器学习核心概念与技术
    本文系统梳理了机器学习的关键知识点,涵盖模型评估、正则化、线性模型、支持向量机、决策树及集成学习等内容,并深入探讨了各算法的原理和应用场景。 ... [详细]
  • 本文探讨了图像标签的多种分类场景及其在以图搜图技术中的应用,涵盖了从基础理论到实际项目实施的全面解析。 ... [详细]
  • 本文详细介绍了 TensorFlow 的入门实践,特别是使用 MNIST 数据集进行数字识别的项目。文章首先解析了项目文件结构,并解释了各部分的作用,随后逐步讲解了如何通过 TensorFlow 实现基本的神经网络模型。 ... [详细]
author-avatar
贝贝2602932923
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有