阿里达摩院2020趋势第一弹：感知智能的“天花板”和认知智能的“野望”

作者：手机用户2502917325 | 来源：互联网 | 2023-08-07 10:24

作者|Just出品|AI科技大本营（ID:rgznai100）“感知智能与认知智能是相辅相成的关系。认知智能需要感知系统来进行信号处理和概念识别

作者 | Just
出品 | AI科技大本营&＃xff08;ID:rgznai100&＃xff09;

“感知智能与认知智能是相辅相成的关系。认知智能需要感知系统来进行信号处理和概念识别&＃xff0c;而感知系统也需要认知系统的反馈来决定如何进行更有效的提取和识别。”

1月2日&＃xff0c;阿里巴巴达摩院发布2020十大科技趋势&＃xff08;https://damo.alibaba.com/events/57&＃xff09;&＃xff0c;其中趋势预测的第一弹即为“人工智能从感知智能向认知智能演进”。AI发展为什么会有这种演进&＃xff1f;从技术层面&＃xff0c;AI科技大本营&＃xff08;ID:Rgznai100&＃xff09;采访了达摩院资深算法专家杨红霞&＃xff0c;就感知智能向认知智能的演进和变革进行更深入解读。

感知智能的“天花板”

如你所知&＃xff0c;目前人工智能在图像、音频、文本的识别等感知操作方面取得了巨大成功&＃xff0c;太多企业的新闻稿中传递着AI在诸多特定任务上已经达到或超越了人类水准的消息。很大程度上&＃xff0c;感知智能技术的诸多成果归因于强大的算力和大量的标注数据。

杨红霞指出&＃xff0c;AI目前对于单一任务上取得的成绩&＃xff0c;如图像识别、机器翻译等均是通过海量样本的堆砌与合适深度学习模型架构得到&＃xff0c;这与人类学习的过程非常不一样&＃xff1a;目前感知智能技术的方式是learn from scratch&＃xff08;从无到有&＃xff09;&＃xff0c;而人类学习是有体系的、多模态、多任务的continuous learning&＃xff08;连续学习&＃xff09;。

她认为&＃xff0c;感知智能目前还只是任务驱动&＃xff0c;做到从底层信号到最终结果的条件反射&＃xff0c;而不是经过显式的、高维的、概念的识别和组合。但这种概念识别和组合的能力才是人类能处理各种不同任务或者新任务的基础。

而单一任务模型的训练消耗已经非常庞大&＃xff0c;“BERT模型需要30亿词量的训练数据&＃xff0c;训练一次产生相当于1400磅的二氧化碳&＃xff0c;这与一个人来回坐飞机穿越美洲的排放量相当。”

这样的技术路线难以为继。她称&＃xff0c;想要再通过更大数据量和更大模型来继续这样的模型线路可能已经很难取得真正意义上的突破。

更重要的是&＃xff0c;感知智能本身存在的技术问题并没有真正得到解决。“我们可以轻易攻击一个模型从而产生极大的安全隐患&＃xff0c;换到另一个没有样本覆盖的场景模型就像傻瓜一样&＃xff0c;这都对人工智能模型和机制层面的改进都提出了迫切的要求。”

杨红霞总结了三点感知智能技术存在的缺陷&＃xff0c;包括但不限于&＃xff1a;

模型鲁棒性差。对于样本分布敏感&＃xff0c;迁移到少样本新任务上的能力差&＃xff0c;模型极易受到攻击&＃xff1b;
模型可解释性差&＃xff0c;对于可靠性要求高的任务很难胜任&＃xff1b;
缺乏积累知识的能力&＃xff0c;也没能和人类已有的知识体系进行很好的关联&＃xff0c;缺乏可靠的推理方法。

总之&＃xff0c;无论是在具备智能理解能力还是安全性方面&＃xff0c;以感知智能技术为主的AI与人类智能相去甚远。

为了突破这些感知智能局限性&＃xff0c;AI需要向认知智能演进。她给出了研究方向&＃xff0c;“更多的去研究如何绑定、发现、积累可理解的可分解性的概念以及概念间的关系&＃xff0c;融合基于高纬度概念的可靠的推理方法&＃xff0c;从而提高模型的稳定性与可靠性&＃xff0c;完成可靠的逻辑推理。”

达摩院指出&＃xff0c;相较于感知智能这一人工智能1.0&＃xff0c;人工智能2.0将更多基于数据&＃xff0c;能够自动将数据变成知识&＃xff0c;从非结构化的数据直接变成有结构化的知识&＃xff0c;做到真正意义上的认知智能。在探索如何在保持大数据智能优势的同时下&＃xff0c;赋予机器常识和因果逻辑推理能力&＃xff0c;实现认知智能成为了当下人工智能研究的核心。

认知智能的“野望”

去年开始&＃xff0c;认知智能开始被AI界摆在下一步AI技术变革的台面上进行广泛讨论。

认知智能可以帮助机器跨越模态理解数据&＃xff0c;学习到最接近人脑认知的“一般表达”&＃xff0c;获得类似于人脑的多模感知能力&＃xff0c;有望带来颠覆性创新的产业价值。达摩院称&＃xff0c;认知智能的出现使得AI系统主动了解事物发展的背后规律和因果关系、而不再只是简单的统计拟合&＃xff0c;进一步推动下一代具有自主意识的AI系统。

一些学界的研究者已经率先出发&＃xff0c;图灵奖得主Yoshua Bengio频繁强调可解释因果关系对深度学习的重要性。杨红霞也特意提及Bengio在近期的 NeurIPS 2019 上题为《From System 1 Deep Learning To System 2 Deep Learning》的报告&＃xff0c;后者也指出认知智能是接下来人工智能的重点突破方向。

Bengio报告的核心内容提到&＃xff0c;人的认知系统包含两个子系统&＃xff08;这是认知理论中的共识观点&＃xff09;&＃xff1a;System1直觉系统&＃xff0c;主要负责快速、无意识、非语言的认知&＃xff0c;这是目前深度学习主要做的事情&＃xff1b;System2是逻辑分析系统&＃xff0c;是有意识的、带逻辑、规划、推理以及可以语言表达的系统&＃xff0c;这是未来深度学习需要着重考虑的。当然Bengio也提到计算机作为Agent实现AI&＃xff0c;需要从计算机角度考虑&＃xff0c;比如更好的模型和知识搜索等。

Bengio认为&＃xff0c;对于计算机来说&＃xff0c;最关键的是处理数据分布中的变化。对于System 2来说&＃xff0c;基本的要素包括&＃xff1a;注意力和意识。注意力&＃xff08;attention&＃xff09;实际在目前的深度学习模型中已经有大量的实现和探讨&＃xff0c;比如GAT&＃xff08;图注意力机制&＃xff09;等&＃xff1b;意识这部分则比较难&＃xff0c;其实意识最关键的是定义到怎样的边界。在他看来&＃xff0c;意识先验可以使用稀疏因子图模型来实现&＃xff0c;这是一个思路&＃xff0c;实现了因果关系。从整体的理论框架方面可以考虑元学习&＃xff08;Meta-learning&＃xff09;、局部修正假设&＃xff08;localized change hypothesis&＃xff09;、因果发现&＃xff08;causal discovery&＃xff09;&＃xff0c;最后架构方面可以考虑如何学习不同对象的操作。

这是认知智能技术的其中一条技术研究路径&＃xff0c;杨红霞则概括了四大类将有所突破的关键方向。

a. 推理系统的建设

基于&＃xff08;神经&＃xff09;符号系统的关系推理
感知系统和认知系统协同推理 System 1&2

b. 与人类知识融合

融合结构化知识图谱的推理模型

c. 从人类学习方式入手

Continuous Learning&＃xff08;连续学习&＃xff09;

d. 从认知发展的根源入手

Emergent language/communication/tool use

她称&＃xff0c;目前比较亲民的应用主要来自于b&＃xff08;与人类知识融合&＃xff09;&＃xff0c;在各类问答系统中&＃xff0c;都会融合外部知识图谱来完善。

当然&＃xff0c;既然阿里将认知智能放在第一大趋势预测的位置&＃xff0c;那么他们在其研究和应用上有何探索或进展&＃xff1f;杨红霞提到&＃xff0c;基于认知学Dual Process Theory&＃xff08;双重加工理论&＃xff09;将认知推理任务转化为System 1&2之间的迭代式交互&＃xff0c;System 1利用感知系统进行语义解析形成一张概念图并作为类似人脑中的Working Memory&＃xff0c;而System 2可以充分考虑Working Memory中的关系网络从而进行精细推理。多跳阅读理解任务中&＃xff0c;他们利用这个系统取得了世界第一的成绩。

他们也在考虑如何发现Compositional的高级概念&＃xff0c;这与人类的binding problem&＃xff08;捆绑问题&＃xff09;息息相关。他们首次在电商场景下研究怎样对用户和商品进行解离化表征&＃xff0c;从而能够显式化的表示宏观的兴趣意图和微观的电商认知概念&＃xff0c;从而利用这些显式的概念进行可控的搜索和推荐。

另外&＃xff0c;阿里研究人员也结合电商知识图谱做了大量的工作&＃xff0c;如结合图谱进行更好的主题标题、推荐理由生成&＃xff0c;提升了用户的购物体验。

达摩院在趋势预测中还指出&＃xff0c;认知智能将结合人脑的推理过程&＃xff0c;进一步解决复杂的阅读理解问题和少样本的知识图谱推理问题&＃xff0c;协同结构化的推理过程和非结构化的语义理解。认知智能也需要解决多模态预训练问题&＃xff0c;帮助机器获得多模感知能力&＃xff0c;赋能海量任务。其中&＃xff0c;大规模图神经网络也被认为是认知智能计算的强有力的推理方法。

尽管未来人工智能热潮能否进一步打开天花板&＃xff0c;形成更大的产业规模&＃xff0c;认知智能被寄予厚望&＃xff0c;不过在需要外部知识、逻辑推理或者领域迁移的认知智能领域&＃xff0c;显然还处于初级探索阶段。

达摩院预计&＃xff0c;认知智能将从认知心理学、脑科学及人类社会历史中汲取灵感&＃xff0c;并结合扩领域知识图谱、因果推理、持续学习等技术&＃xff0c;建立稳定获取和表达知识的有效机制&＃xff0c;让知识能够被机器理解和运用&＃xff0c;实现从感知智能到认知智能的关键突破。

&＃xff08;*本文为AI科技大本营原创文章&＃xff0c;转载请微信联系1092722531&＃xff09;

◆

精彩推荐

◆

推荐阅读

11年艺术学习“转投”数学&＃xff0c;他出版首本TensorFlow中文教材&＃xff0c;成为蚂蚁金服技术大军一员
清华官宣&＃xff1a;前百度总裁张亚勤正式加盟清华大学
小米回应“米家”商标争议&＃xff1b;人人 App 回归社交市场&＃xff1b;TiDB 2.1.19 发布| 极客头条
迁移学习前沿研究亟需新鲜血液&＃xff0c;深度学习理论不能掉链子
详解GPU技术关键参数和应用场景
链版“微信”&＃xff0c;27 岁身价达 2.5 亿美元
“微软让我损失了两亿美金&＃xff01;”
太逆天&＃xff01;程序员当总统、拿下《国家地理》全球总冠军、成著名歌手&＃xff01;
区块链重塑人类社群生态
你点的每个“在看”&＃xff0c;我都认真当成了AI

推荐阅读

ip
能够感知你情绪状态的智能机器人即将问世 | 科技前沿观察

本周科技前沿报道了多项重要进展，包括美国多所高校在机器人技术和自动驾驶领域的最新研究成果，以及硅谷大型企业在智能硬件和深度学习技术上的突破性进展。特别值得一提的是，一款能够感知用户情绪状态的智能机器人即将问世，为未来的人机交互带来了全新的可能性。 ... [详细]

蜡笔小新 2024-11-05 20:45:31
ip
独家解析：深度学习泛化理论的破解之道与应用前景

本文深入探讨了深度学习泛化理论的关键问题，通过分析现有研究和实践经验，揭示了泛化性能背后的核心机制。文章详细解析了泛化能力的影响因素，并提出了改进模型泛化性能的有效策略。此外，还展望了这些理论在实际应用中的广阔前景，为未来的研究和开发提供了宝贵的参考。 ... [详细]

蜡笔小新 2024-11-09 19:29:56
random
利用CIFAR10数据集快速掌握Mixup数据增强技术，显著提高图像分类精度

通过使用CIFAR-10数据集，本文详细介绍了如何快速掌握Mixup数据增强技术，并展示了该方法在图像分类任务中的显著效果。实验结果表明，Mixup能够有效提高模型的泛化能力和分类精度，为图像识别领域的研究提供了有价值的参考。 ... [详细]

蜡笔小新 2024-11-05 14:24:36
ip
从2019年AI顶级会议最佳论文，探索深度学习的理论根基与前沿进展

从2019年AI顶级会议最佳论文，探索深度学习的理论根基与前沿进展 ... [详细]

蜡笔小新 2024-11-03 10:42:12
web
全栈工程师在当今技术领域的角色与价值探析

当前，众多初创企业对全栈工程师的需求日益增长，但市场中却存在大量所谓的“伪全栈工程师”，尤其是那些仅掌握了Node.js技能的前端开发人员。本文旨在深入探讨全栈工程师在现代技术生态中的真实角色与价值，澄清对这一角色的误解，并强调真正的全栈工程师应具备全面的技术栈和综合解决问题的能力。 ... [详细]

蜡笔小新 2024-10-31 10:28:12
web
AI TIME联合2021世界人工智能大会，共探图神经网络与认知智能前沿话题

AI TIME携手2021世界人工智能大会，共同探讨图神经网络与认知智能的最新进展。自2018年在上海首次举办以来，WAIC已成为全球AI领域的年度盛会，吸引了众多专家学者和行业领袖参与。本次大会将聚焦图神经网络在复杂系统建模、知识图谱构建及认知智能应用等方面的技术突破和未来趋势。 ... [详细]

蜡笔小新 2024-10-29 11:34:09
web
从0到1搭建大数据平台

从0到1搭建大数据平台 ... [详细]

蜡笔小新 2024-11-12 15:26:03
merge
秒建一个后台管理系统？用这5个开源免费的Java项目就够了

秒建一个后台管理系统？用这5个开源免费的Java项目就够了 ... [详细]

蜡笔小新 2024-11-12 03:21:33
merge
飞桨助力产业智能化：百度自研AI硬件深度融合

在2019中国国际智能产业博览会上，百度董事长兼CEO李彦宏强调，人工智能应务实推进其在各行业的应用。随后，在“ABC SUMMIT 2019百度云智峰会”上，百度展示了通过“云+AI”推动AI工业化和产业智能化的最新成果。 ... [详细]

蜡笔小新 2024-11-12 00:45:20
merge
OpenAI首席执行官Sam Altman展望：人工智能的未来发展方向与挑战

OpenAI首席执行官Sam Altman展望：人工智能的未来发展方向与挑战 ... [详细]

蜡笔小新 2024-11-11 09:47:50
web
如何撰写初级和高级前端开发者的专业简历

如何撰写初级和高级前端开发者的专业简历 ... [详细]

蜡笔小新 2024-11-09 08:36:22
js
中国学者实现 CNN 全程可视化，详尽展示每次卷积、ReLU 和池化过程

中国学者实现 CNN 全程可视化，详尽展示每次卷积、ReLU 和池化过程 ... [详细]

蜡笔小新 2024-11-03 13:52:28
web
Python与R语言的功能对比及应用场景分析

Python与R语言在功能和应用场景上各有优势。尽管R语言在统计分析和数据可视化方面具有更强的专业性，但Python作为一种通用编程语言，适用于更广泛的领域，包括Web开发、自动化脚本和机器学习等。对于初学者而言，Python的学习曲线更为平缓，上手更加容易。此外，Python拥有庞大的社区支持和丰富的第三方库，使其在实际应用中更具灵活性和扩展性。 ... [详细]

蜡笔小新 2024-11-01 18:37:10
web
语义、实例与全景分割的对比分析（Comparative Analysis of Semantic, Instance, and Panoptic Segmentation）

图像分割技术在人工智能领域中扮演着关键角色，其中语义分割、实例分割和全景分割是三种主要的方法。本文对这三种分割技术进行了详细的对比分析，探讨了它们在不同应用场景中的优缺点和适用范围，为研究人员和从业者提供了有价值的参考。 ... [详细]

蜡笔小新 2024-10-29 18:51:14
uri
NVIDIA新一代Ampere架构详解：革新与优化并存的显卡技术飞跃

NVIDIA最新推出的Ampere架构标志着显卡技术的一次重大突破，不仅在性能上实现了显著提升，还在能效比方面进行了深度优化。该架构融合了创新设计与技术改进，为用户带来更加流畅的图形处理体验，同时降低了功耗，提升了计算效率。 ... [详细]

蜡笔小新 2024-10-29 14:10:54