热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

阿里达摩院2020趋势第一弹:感知智能的“天花板”和认知智能的“野望”

作者|Just出品|AI科技大本营(ID:rgznai100)“感知智能与认知智能是相辅相成的关系。认知智能需要感知系统来进行信号处理和概念识别

作者 | Just

出品 | AI科技大本营(ID:rgznai100)

 

“感知智能与认知智能是相辅相成的关系。认知智能需要感知系统来进行信号处理和概念识别,而感知系统也需要认知系统的反馈来决定如何进行更有效的提取和识别。”

 

1月2日,阿里巴巴达摩院发布2020十大科技趋势(https://damo.alibaba.com/events/57),其中趋势预测的第一弹即为“人工智能从感知智能向认知智能演进”。AI发展为什么会有这种演进?从技术层面,AI科技大本营(ID:Rgznai100)采访了达摩院资深算法专家杨红霞,就感知智能向认知智能的演进和变革进行更深入解读。

感知智能的“天花板”

 

如你所知,目前人工智能在图像、音频、文本的识别等感知操作方面取得了巨大成功,太多企业的新闻稿中传递着AI在诸多特定任务上已经达到或超越了人类水准的消息。很大程度上,感知智能技术的诸多成果归因于强大的算力和大量的标注数据。

 

杨红霞指出,AI目前对于单一任务上取得的成绩,如图像识别、机器翻译等均是通过海量样本的堆砌与合适深度学习模型架构得到,这与人类学习的过程非常不一样:目前感知智能技术的方式是learn from scratch(从无到有),而人类学习是有体系的、多模态、多任务的continuous learning(连续学习)。

 

她认为,感知智能目前还只是任务驱动,做到从底层信号到最终结果的条件反射,而不是经过显式的、高维的、概念的识别和组合。但这种概念识别和组合的能力才是人类能处理各种不同任务或者新任务的基础。

 

而单一任务模型的训练消耗已经非常庞大,“BERT模型需要30亿词量的训练数据,训练一次产生相当于1400磅的二氧化碳,这与一个人来回坐飞机穿越美洲的排放量相当。”

 

这样的技术路线难以为继。她称,想要再通过更大数据量和更大模型来继续这样的模型线路可能已经很难取得真正意义上的突破。

 

更重要的是,感知智能本身存在的技术问题并没有真正得到解决。“我们可以轻易攻击一个模型从而产生极大的安全隐患,换到另一个没有样本覆盖的场景模型就像傻瓜一样,这都对人工智能模型和机制层面的改进都提出了迫切的要求。”

 

杨红霞总结了三点感知智能技术存在的缺陷,包括但不限于:

 

  • 模型鲁棒性差。对于样本分布敏感,迁移到少样本新任务上的能力差,模型极易受到攻击;

  • 模型可解释性差,对于可靠性要求高的任务很难胜任;

  • 缺乏积累知识的能力,也没能和人类已有的知识体系进行很好的关联,缺乏可靠的推理方法。

 

总之,无论是在具备智能理解能力还是安全性方面,以感知智能技术为主的AI与人类智能相去甚远。

 

为了突破这些感知智能局限性,AI需要向认知智能演进。她给出了研究方向,“更多的去研究如何绑定、发现、积累可理解的可分解性的概念以及概念间的关系,融合基于高纬度概念的可靠的推理方法,从而提高模型的稳定性与可靠性,完成可靠的逻辑推理。”

 

达摩院指出,相较于感知智能这一人工智能1.0,人工智能2.0将更多基于数据,能够自动将数据变成知识,从非结构化的数据直接变成有结构化的知识,做到真正意义上的认知智能。在探索如何在保持大数据智能优势的同时下,赋予机器常识和因果逻辑推理能力,实现认知智能成为了当下人工智能研究的核心。

 

认知智能的“野望”

 

去年开始,认知智能开始被AI界摆在下一步AI技术变革的台面上进行广泛讨论。

 

认知智能可以帮助机器跨越模态理解数据,学习到最接近人脑认知的“一般表达”,获得类似于人脑的多模感知能力,有望带来颠覆性创新的产业价值。达摩院称,认知智能的出现使得AI系统主动了解事物发展的背后规律和因果关系、而不再只是简单的统计拟合,进一步推动下一代具有自主意识的AI系统。

 

一些学界的研究者已经率先出发,图灵奖得主Yoshua Bengio频繁强调可解释因果关系对深度学习的重要性。杨红霞也特意提及Bengio在近期的 NeurIPS 2019 上题为《From System 1 Deep Learning To System 2 Deep Learning》的报告,后者也指出认知智能是接下来人工智能的重点突破方向。

 

Bengio报告的核心内容提到,人的认知系统包含两个子系统(这是认知理论中的共识观点):System1直觉系统,主要负责快速、无意识、非语言的认知,这是目前深度学习主要做的事情;System2是逻辑分析系统,是有意识的、带逻辑、规划、推理以及可以语言表达的系统,这是未来深度学习需要着重考虑的。当然Bengio也提到计算机作为Agent实现AI,需要从计算机角度考虑,比如更好的模型和知识搜索等。

 

Bengio认为,对于计算机来说,最关键的是处理数据分布中的变化。对于System 2来说,基本的要素包括:注意力和意识。注意力(attention)实际在目前的深度学习模型中已经有大量的实现和探讨,比如GAT(图注意力机制)等;意识这部分则比较难,其实意识最关键的是定义到怎样的边界。在他看来,意识先验可以使用稀疏因子图模型来实现,这是一个思路,实现了因果关系。从整体的理论框架方面可以考虑元学习(Meta-learning)、局部修正假设(localized change hypothesis)、因果发现(causal discovery),最后架构方面可以考虑如何学习不同对象的操作。

 

这是认知智能技术的其中一条技术研究路径,杨红霞则概括了四大类将有所突破的关键方向。

 

a. 推理系统的建设

  • 基于(神经)符号系统的关系推理

  • 感知系统和认知系统协同推理 System 1&2

b. 与人类知识融合

  • 融合结构化知识图谱的推理模型

c.   从人类学习方式入手

  • Continuous Learning(连续学习)

d. 从认知发展的根源入手

  • Emergent language/communication/tool use

 

她称,目前比较亲民的应用主要来自于b(与人类知识融合),在各类问答系统中,都会融合外部知识图谱来完善。

 

当然,既然阿里将认知智能放在第一大趋势预测的位置,那么他们在其研究和应用上有何探索或进展?杨红霞提到,基于认知学Dual Process Theory(双重加工理论)将认知推理任务转化为System 1&2之间的迭代式交互,System 1利用感知系统进行语义解析形成一张概念图并作为类似人脑中的Working Memory,而System 2可以充分考虑Working Memory中的关系网络从而进行精细推理。多跳阅读理解任务中,他们利用这个系统取得了世界第一的成绩。

 

他们也在考虑如何发现Compositional的高级概念,这与人类的binding problem(捆绑问题)息息相关。他们首次在电商场景下研究怎样对用户和商品进行解离化表征,从而能够显式化的表示宏观的兴趣意图和微观的电商认知概念,从而利用这些显式的概念进行可控的搜索和推荐。

 

另外,阿里研究人员也结合电商知识图谱做了大量的工作,如结合图谱进行更好的主题标题、推荐理由生成,提升了用户的购物体验。

 

达摩院在趋势预测中还指出,认知智能将结合人脑的推理过程,进一步解决复杂的阅读理解问题和少样本的知识图谱推理问题,协同结构化的推理过程和非结构化的语义理解。认知智能也需要解决多模态预训练问题,帮助机器获得多模感知能力,赋能海量任务。其中,大规模图神经网络也被认为是认知智能计算的强有力的推理方法。

     

尽管未来人工智能热潮能否进一步打开天花板,形成更大的产业规模,认知智能被寄予厚望,不过在需要外部知识、逻辑推理或者领域迁移的认知智能领域,显然还处于初级探索阶段。

 

达摩院预计,认知智能将从认知心理学、脑科学及人类社会历史中汲取灵感,并结合扩领域知识图谱、因果推理、持续学习等技术,建立稳定获取和表达知识的有效机制,让知识能够被机器理解和运用,实现从感知智能到认知智能的关键突破。

(*本文为AI科技大本营原创文章,转载请微信联系1092722531)

精彩推荐

推荐阅读

  • 11年艺术学习“转投”数学,他出版首本TensorFlow中文教材,成为蚂蚁金服技术大军一员

  • 清华官宣:前百度总裁张亚勤正式加盟清华大学

  • 小米回应“米家”商标争议;人人 App 回归社交市场;TiDB 2.1.19 发布| 极客头条

  • 迁移学习前沿研究亟需新鲜血液,深度学习理论不能掉链子

  • 详解GPU技术关键参数和应用场景

  • 链版“微信”,27 岁身价达 2.5 亿美元

  • “微软让我损失了两亿美金!”

  • 太逆天!程序员当总统、拿下《国家地理》全球总冠军、成著名歌手!

  • 区块链重塑人类社群生态

  • 你点的每个“在看”,我都认真当成了AI



推荐阅读
  • 本文详细介绍了在Windows操作系统上使用Python 3.8.5编译支持CUDA 11和cuDNN 8.0.2的TensorFlow 2.3的步骤。文章不仅提供了详细的编译指南,还分享了编译后的文件下载链接,方便用户快速获取所需资源。此外,文中还涵盖了常见的编译问题及其解决方案,确保用户能够顺利进行编译和安装。 ... [详细]
  • 在Conda环境中高效配置并安装PyTorch和TensorFlow GPU版的方法如下:首先,创建一个新的Conda环境以避免与基础环境发生冲突,例如使用 `conda create -n pytorch_gpu python=3.7` 命令。接着,激活该环境,确保所有依赖项都正确安装。此外,建议在安装过程中指定CUDA版本,以确保与GPU兼容性。通过这些步骤,可以确保PyTorch和TensorFlow GPU版的顺利安装和运行。 ... [详细]
  • 该问题可能由守护进程配置不当引起,例如未识别的JVM选项或内存分配不足。建议检查并调整JVM参数,确保为对象堆预留足够的内存空间(至少1572864KB)。此外,还可以优化应用程序的内存使用,减少不必要的内存消耗。 ... [详细]
  • 【图像分类实战】利用DenseNet在PyTorch中实现秃头识别
    本文详细介绍了如何使用DenseNet模型在PyTorch框架下实现秃头识别。首先,文章概述了项目所需的库和全局参数设置。接着,对图像进行预处理并读取数据集。随后,构建并配置DenseNet模型,设置训练和验证流程。最后,通过测试阶段验证模型性能,并提供了完整的代码实现。本文不仅涵盖了技术细节,还提供了实用的操作指南,适合初学者和有经验的研究人员参考。 ... [详细]
  • 深入解析经典卷积神经网络及其实现代码
    深入解析经典卷积神经网络及其实现代码 ... [详细]
  • NVIDIA最新推出的Ampere架构标志着显卡技术的一次重大突破,不仅在性能上实现了显著提升,还在能效比方面进行了深度优化。该架构融合了创新设计与技术改进,为用户带来更加流畅的图形处理体验,同时降低了功耗,提升了计算效率。 ... [详细]
  • 在Windows命令行中,通过Conda工具可以高效地管理和操作虚拟环境。具体步骤包括:1. 列出现有虚拟环境:`conda env list`;2. 创建新虚拟环境:`conda create --name 环境名`;3. 删除虚拟环境:`conda env remove --name 环境名`。这些命令不仅简化了环境管理流程,还提高了开发效率。此外,Conda还支持环境文件导出和导入,方便在不同机器间迁移配置。 ... [详细]
  • 本文提供了PyTorch框架中常用的预训练模型的下载链接及详细使用指南,涵盖ResNet、Inception、DenseNet、AlexNet、VGGNet等六大分类模型。每种模型的预训练参数均经过精心调优,适用于多种计算机视觉任务。文章不仅介绍了模型的下载方式,还详细说明了如何在实际项目中高效地加载和使用这些模型,为开发者提供全面的技术支持。 ... [详细]
  • 在探索 Unity Shaders 的过程中,我逐渐意识到掌握 OpenGL 基础知识的重要性。本文将详细介绍 OpenGL 的核心概念和基本操作,帮助读者从零开始理解这一图形编程技术。通过实例和代码解析,我们将深入探讨如何利用 OpenGL 创建高效的图形应用。无论你是初学者还是有一定经验的开发者,都能从中受益匪浅。 ... [详细]
  • 如何在Linux中配置环境变量:命令与脚本详解
    请关注本头条号,每天坚持更新原创干货技术文章。当您在Linux命令行上键入命令时,您实际是在告诉shell运行指定名称的可执行文件。在Linux中,这些可执行程序通常位于系统上的几 ... [详细]
  • 能够感知你情绪状态的智能机器人即将问世 | 科技前沿观察
    本周科技前沿报道了多项重要进展,包括美国多所高校在机器人技术和自动驾驶领域的最新研究成果,以及硅谷大型企业在智能硬件和深度学习技术上的突破性进展。特别值得一提的是,一款能够感知用户情绪状态的智能机器人即将问世,为未来的人机交互带来了全新的可能性。 ... [详细]
  • 机器学习中的标准化缩放、最小-最大缩放及鲁棒缩放技术解析 ... [详细]
  • 在Hive中合理配置Map和Reduce任务的数量对于优化不同场景下的性能至关重要。本文探讨了如何控制Hive任务中的Map数量,分析了当输入数据超过128MB时是否会自动拆分,以及Map数量是否越多越好的问题。通过实际案例和实验数据,本文提供了具体的配置建议,帮助用户在不同场景下实现最佳性能。 ... [详细]
  • MySQL:不仅仅是数据库那么简单
    MySQL不仅是一款高效、可靠的数据库管理系统,它还具备丰富的功能和扩展性,支持多种存储引擎,适用于各种应用场景。从简单的网站开发到复杂的企业级应用,MySQL都能提供强大的数据管理和优化能力,满足不同用户的需求。其开源特性也促进了社区的活跃发展,为技术进步提供了持续动力。 ... [详细]
  • 根据不同环境需求,利用 Vue CLI 的 `npm run build` 命令对项目进行定制化打包,如测试、预发布和生产环境。通过配置 `process.env` 变量,实现不同环境下接口和服务的动态切换,确保应用在各阶段都能高效运行和调试。 ... [详细]
author-avatar
手机用户2502917325
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有