热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

人和机器的视觉体验:为什么人工智能

Google的人工智能机器人将普通的照片生成了带有幻觉的图像,工程师们把这些图像和梦境进行比较,并将Google的这种图像生成手法命名为“盗梦风格”(I

Google 的人工智能机器人将普通的照片生成了带有幻觉的图像,工程师们把这些图像和梦境进行比较,并将 Google 的这种图像生成手法命名为“盗梦风格”(Inceptionism),将所使用的生成代码叫做“深度梦境”(Deep Dream)。

但是许多人在观看了这些图像之后都有一个相同感受:它们并不是来自一个梦幻的世界,而是嗑药之后的反应。

在电脑生成的图像中充斥着色彩的变幻,扭曲的线条,拉长的脸孔,漂浮着的眼睛,以及由阴影和光线组成的、令人不安的波浪形状。电脑看起来像是出现了幻觉,看起来有点像是人类,太奇怪了。


智搜(Giiso)公司成立于2013年是国内领先的“人工智能+资讯”领域技术服务商,在大数据挖掘、智能语义、知识图谱等领域都拥有国内顶尖技术。同时Giiso旗下研发产品包括编辑机器人、写作机器人等人工智能产品!凭借雄厚的技术实力,公司成立之初,就获得了天使轮投资,并在2015年8月获得了金沙江创投500万美元pre-A轮投资。

深度梦境

这个项目背后的主旨是,通过命令机器描述它所看到的画面,来测试计算机神经网络对不同动物和风景图像的学习达到了一种怎样的程度。与以往向计算机展示一幅树木的图片,之后让它“告诉我这是什么”的做法不同,工程师这一次让机器做的事情是“放大你看到的图像元素。”

这是给电脑看的原图

机器输出的结果是这样的:

Google 工程师表示,这种效果与人们可能从不同形状的云朵中看出形状的情况并无不同。当给出能够辨识出的图像时,人类——还有计算机——会分辨并“过度解读”(over-interpret) 已知事物的形状。

“(Google 所使用的) 神经网络主要靠动物图像进行训练,所以很自然地它就会将图形解读成动物。但因为数据是以很高的抽象程度被存储的,所以结果就是这些机器学习特征的有趣组合,”Google 工程师在该公司的官方博客上这样写道,“基于图像的不同,结果也非常不一样,因为输入图像的特征会导致神经网络倾向形成某些解读。比如,水平线条会用佛塔的造型填充,岩石和树木会变成建筑。鸟和昆虫出现在叶子的图像里。”

因为神经网络以层的形式分析图像——通过色彩、线条类型和形状描述,等等——生成结果的复杂程度取决于工程师要求计算机放大的是哪个层。最低一级的层是轮廓——线和阴影——最高一层则是更加复杂的画面。“比如,偏低的层往往会生成笔画线或是简单的像装饰一样的图案,因为这些层对于基本特征如边缘和方向这些属性来说要比较敏锐。”Google 工程师这样写道。

这些简单的图案模式,经由“深度梦境”放大强化之后,结果看上去就变得扭曲和魔幻。但是为什么画面会变成这样,仍旧没有回答 人们提出的问题:为什么电脑神经网络“梦到”的画面会反应出人类嗑药后才有的致幻体验?


视觉体验

“要记住很重要的一点是,人类所有正常的感观体验都是经由感观输入限制后的幻觉,”纽约大学兰恭神经科学所 (New York University's Langone Neuroscience Institute) 研究助教 Lucas Sjulson 这样说道,“我们的幻觉从某种程度上说反映出外在世界的真实情况。但是感知全都是在内部形成的。”

换句话说,所有人类感知都是由大脑思维形成,而不在真实世界形成,即便你感知到的是真实存在也是如此。“人们将眼睛看作像摄像头一样,但其实不是,”Lucas Sjulson 解释说。你的眼睛能够让你看到东西,但你的大脑才是真正将看到的事物进行解释的器官——无论是放在桌上的咖啡杯,还是在你脑中投射分型图像的万花筒。

当人们使用致幻药物的时候 (LSD),会刺激大脑的某个皮层“产生这一类模式的形成能力”。所以当习惯处理多层图像的电脑被命令针对某一层图像进行放大时,出现类似的视觉效果,就不奇怪了。“我认为这大概是类似现象的一个例子。如果你研究一下头脑的运作,会发现它参与长时间解决问题的活动,而且以一种高度优化的方式进行。人类在进化中学习,同样也要靠视觉体验。


人工智能与人类大脑的相似之处

视觉体验也是人类训练计算机视觉的方法。神经网络识图的方式,与电脑“看到的”具体图像相比,前者可能对回答之前的问题更有帮助。也就是,Google 工程师最初希望探索的到底是什么。

“我们实际上始终会‘看到’并没有的东西,”纽约大学心理学家 Jeffrey Guss 这样说道,他的研究课题是在一些毒蘑菇中出现的致幻物质如何帮助癌症患者进行治疗。“我们的视觉皮层——而不是我们的眼部——专门用于捕捉可识别的模式 去观察我们眼睛提供的信息。有许多心理学试验表明,我们经常看到期望看到的事物以及被事前告知将看到的事物,而不是真正存在的事物。”


尽管致幻体验常常和嗑药文化联系起来,但人们的确会稳定地出现奇异的视觉体验,即便是他们在没有受到影响的情况下。已故的神经科学家 Oliver Sacks 在他的作品《幻觉》一书中指出,这种体验要比许多人所意识到的更普遍。“在其他一些文化中,幻觉被认为是来自上帝或缪思的馈赠,但是当代社会在公众当中却有一种不详的含义,在医学上也是,往往被认为是严重精神或神经疾病的征兆,”他在 2012 年发布在《纽约时报》的文章中这样写道,“对许多人来说,拥有幻觉是一个恐怖的秘密——有数百万人——他们从不提起,也很难承认,但这并没有什么不寻常。”

在人类的大脑中,诡异的图像感知与眼部、头部和其他状况有一定联系:比如偏头痛、发热和痉挛等。在计算机的脑中,类似的图案表明,人工智能要比他们看上去更像人类。Google 的“盗梦风格”对人类来说好像服药后的致幻体验一样,这个事实说明我们的大脑机能从某种意义上说“在深层次中”与电脑神经网络有相似之处。


转:https://juejin.im/post/5b358c0cf265da599b74c750



推荐阅读
  • 探索CNN的可视化技术
    神经网络的可视化在理论学习与实践应用中扮演着至关重要的角色。本文深入探讨了三种有效的CNN(卷积神经网络)可视化方法,旨在帮助读者更好地理解和优化模型。 ... [详细]
  • 字符、字符串和文本的处理之Char类型
    .NetFramework中处理字符和字符串的主要有以下这么几个类:(1)、System.Char类一基础字符串处理类(2)、System.String类一处理不可变的字符串(一经 ... [详细]
  • 本文由公众号【数智物语】(ID: decision_engine)发布,关注获取更多干货。文章探讨了从数据收集到清洗、建模及可视化的全过程,介绍了41款实用工具,旨在帮助数据科学家和分析师提升工作效率。 ... [详细]
  • 视觉Transformer综述
    本文综述了视觉Transformer在计算机视觉领域的应用,从原始Transformer出发,详细介绍了其在图像分类、目标检测和图像分割等任务中的最新进展。文章不仅涵盖了基础的Transformer架构,还深入探讨了各类增强版Transformer模型的设计思路和技术细节。 ... [详细]
  • 本文将深入探讨 Unreal Engine 4 (UE4) 中的距离场技术,包括其原理、实现细节以及在渲染中的应用。距离场技术在现代游戏引擎中用于提高光照和阴影的效果,尤其是在处理复杂几何形状时。文章将结合具体代码示例,帮助读者更好地理解和应用这一技术。 ... [详细]
  • 本文探讨了在Qt框架下实现TCP多线程服务器端的方法,解决了一个常见的问题:服务器端仅能与最后一个连接的客户端通信。通过继承QThread类并利用socketDescriptor标识符,实现了多个客户端与服务器端的同时通信。 ... [详细]
  • 计算机视觉初学者指南:如何顺利入门
    本文旨在为计算机视觉领域的初学者提供一套全面的入门指南,涵盖基础知识、技术工具、学习资源等方面,帮助读者快速掌握计算机视觉的核心概念和技术。 ... [详细]
  • 本文介绍了多种将多行数据合并为单行的方法,包括使用动态SQL、函数、CTE等技术,适用于不同的SQL Server版本。 ... [详细]
  • VMware 15.5.7 中文版激活方法
    本文提供了一种有效的方法来激活 VMware 15.5.7 的中文版本,同时介绍了如何利用最新的激活码进行操作,确保用户能够顺利使用。 ... [详细]
  • C基本语法C程序可以定义为对象的集合,这些对象通过调用彼此的方法进行交互。现在让我们简要地看一下什么是类、对象,方法、即时变量。对象-对象具有状态和行为 ... [详细]
  • [编程题] LeetCode上的Dynamic Programming(动态规划)类型的题目
    继上次把backTracking的题目做了一下之后:backTracking,我把LeetCode的动态规划的题目又做了一下,还有几道比较难的Medium的题和Hard的题没做出来,后面会继续 ... [详细]
  • 分布式计算助力链力实现毫秒级安全响应,确保100%数据准确性
    随着分布式计算技术的发展,其在数据存储、文件传输、在线视频、社交平台及去中心化金融等多个领域的应用日益广泛。国际知名企业如Firefox、Google、Opera、Netflix、OpenBazaar等均已采用该技术,推动了技术创新和服务升级。 ... [详细]
  • 本周三大青年学术分享会即将开启
    由雷锋网旗下的AI研习社主办,旨在促进AI领域的知识共享和技术交流。通过邀请来自学术界和工业界的专家进行在线分享,活动致力于搭建一个连接理论与实践的平台。 ... [详细]
  • Python 领跑!2019年2月编程语言排名更新
    根据最新的编程语言流行指数(PYPL)排行榜,Python 在2019年2月的份额达到了26.42%,稳坐榜首位置。 ... [详细]
  • 流处理中的计数挑战与解决方案
    本文探讨了在流处理中进行计数的各种技术和挑战,并基于作者在2016年圣何塞举行的Hadoop World大会上的演讲进行了深入分析。文章不仅介绍了传统批处理和Lambda架构的局限性,还详细探讨了流处理架构的优势及其在现代大数据应用中的重要作用。 ... [详细]
author-avatar
wurtjq
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有