热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

MIT非视线成像“透视相机”:隔墙观物、影中窥人!

2012年,MIT计算机视觉科学家安东尼奥托拉尔巴(AntonioTorralba)在西班牙海岸度假时,发现他酒店房间墙壁上

2012年,MIT计算机视觉科学家安东尼奥·托拉尔巴(Antonio Torralba)在西班牙海岸度假时,发现他酒店房间墙壁上的杂散阴影似乎不是由任何东西投射出来的。

托拉尔巴意识到,墙壁上的变色斑块根本不是阴影,而是窗外庭院的一个微弱的倒立成像。窗户充当了一台最简单的针孔相机,光线穿过一个小开口,在另一侧形成倒立的成像。在光线充足的墙壁上,这些图像几乎是察觉不到的。但让Torralba感到吃惊的是,世界上充斥着大量我们的眼睛看不到的视觉信息。

“这些图像对我们来说是看不见的。”他说,“但它们一直都存在于我们的周围。”

受到这一现象的启发,托拉尔巴和他的同事,麻省理工学院教授比尔·弗里曼(Bill Freeman)将其称之为无意识的“意外相机”:窗户、角落、室内植物和其他常见物体,都可以生成周围环境的微妙图像。这些图像比其他任何图像都要暗1000倍,通常肉眼是看不见的。 “我们找到了提取这些图像并使其变得可见的方法,”弗里曼解释道。

在二人合作的第一篇论文中,弗里曼和托拉尔巴表明,用iPhone拍下房间墙壁上的灯光变化,在进行图像处理,就可以显示出窗外的场景。去年秋天,他们又和合作者研究发现,通过拍摄墙角附近的地面,能够发现人在墙角的另一边的移动。今年夏天,他们通过拍摄室内植物,然后用植物叶子投下的不同阴影,重现了房间其他部分的三维图像。

c840c29f39b424958159227152840c56b5a2b015

安东尼奥·托拉尔巴注意到他的酒店房间的窗户是一个意外的针孔相机(1)。通过用纸板覆盖大部分窗户以减小针孔的尺寸,可以使墙壁(2)上的庭院的微弱图像变清晰(3)。倒立的图像(4)显示出窗外的场景。

2012年,托拉尔巴和弗里曼关于“意外相机”的论文开始引导研究人员研究周围的角落和推断不直接可见的信息,称为“非视线成像”(non-line-of-sight imaging)。

2016年,基于上面的部分成果,美国国防部高级研究计划局(DARPA)推出了2700万美元的REVEAL计划,为全国各地许多新实验室提供资金。从此,一系列新的见解和数学工具,让非视线成像技术变得更加强大和实用。

除了军事和间谍方向上的应用外,研究人员表示,该技术在自动驾驶汽车、机器人视觉、医学成像、天文学、太空探索以及搜索救援任务上都具备潜在的应用前景。

托拉尔巴表示,他和弗里曼开始研究时并没有什么特别的应用目的。他们只是深入研究图像如何形成,以及相机构成上的一些基础知识,而这自然导致随后对光与环境中的物体和表面的相互作用进行更全面的研究。他们开始发现一些没有人想过要发现的东西。托拉尔巴说,心理学研究表明,人类对阴影的解释是非常糟糕的。也许一个原因就是,我们看到的许多阴影实际上并不是真正的阴影。

“反针孔”透视相机

携带着我们视野外的场景图像信息的光线,不断撞击墙壁和其他表面并反射到我们的眼睛中。但为什么我们看不见图像呢?答案是这些光线中有太多的光线在太多不同的方向上传播。图像被极大地冲淡了。

要想形成人眼可见的图像,对射在目标表面上的光线有着极大的限制,只允许人看到一组特定的光线。这便是针孔相机的成像。托拉尔巴和弗里曼在2012年的最初想法是,我们的环境中有许多物体和特征,会自然而然对光线形成限制,可以生成足以能够令计算机检测到的微弱图像。

针孔相机的孔径越小,得到的图像越清晰,因为成像物体上的每个点仅发射具有正确角度的单束光线穿过小孔。托拉尔巴2012年入住的酒店房间窗户太大,无法产生清晰的图像,他和弗里曼都知道,一般来说,这种偶然发现的天然针孔像机是很少见的。不过他们意识到,由任何小的遮光物组成的“反针孔”(或者说“针脚”)相机可以在整个区域内成像。

6c3bbad1f3ff208b34095714034bddf7cc648d60

计算机视觉科学家、麻省理工学院教授Bill Freeman(上图)和Antonio Torralba(下图)

除此之外,弗里曼和他的同事还设计了用于检测和放大细微颜色变化的算法,例如人体面部的血液流动,以及微型运动。他们现在可以轻松地将运动微分至百分之一像素级别,如此细微的运动一般都会被会噪音覆盖掉。

他们的解决方法是,在数学上将图像转换为正弦波。至关重要的是,在变换空间中,信号不会受噪声干扰,因为正弦波代表多个像素的平均值,噪声在这些波中传播。因此,研究人员可以检测从视频序列某一帧到下一帧之间的正弦波位置的变化,加以放大,然后将数据转换回来。

研究人员现在开始结合使用这些不同的技巧来获取隐藏的视觉信息。去年10月,在Freeman当时的研究生Katie Bouman(现供职于哈佛-史密森天体物理中心)等人的研究报告中表明,以建筑物的角落充当相机,可以呈现在拐角处的粗糙图像。

607895dfb27878b7006fab2c3c9de976b1ec2df1

通过在角落(1)附近拍摄阴影半影,可以获得有关角落周围物体的信息(2)。当隐藏图像区域中的物体移动时,它们向半影投射的光线相对于墙壁扫过不同的角度。这些细微的强度和颜色变化通常是肉眼看不到的(3),但可以通过算法来增强。图示为从半影的不同角度投射的光的原始视频显示一个人在移动(4)以及两个人在角落处移动(5)。 

就像针孔和针脚一样,边缘和角落也限制了光线的通过。使用传统的采集设备,比如iPhone,Bouman和公司拍摄了建筑物角落的“半影”:即阴影区域中被来自角落隐藏区域的一部分光线照亮的区域。比如,如果穿着一件红色衬衫的人走到那里,衬衫就会向半影中投射出少量的红光,当人走路时,这道红光会扫过半影,肉眼看不见。经过处理后就很清楚了。

在6月的一项开创性工作中,弗里曼及其同事重建了一个房间内的“光场”:一张整个房间内光线强度和方向的图片,这是由墙壁附近的绿叶植物投下的阴影中重建的。叶子充当了“针脚相机”,每片叶子阻挡了不同的光线。将每片叶子的阴影与其余部分进行对比,可以发现其缺失的一组光线,从而构建隐藏场景的一部分图像。研究人员可以将这些图像拼在一起。

这种“光场”方法比早期的“意外相机”生成的图像更加清晰,因为在算法中已经输入了关于外部世界的先验知识:包括室内植物的形状,自然图像趋于平滑的假设,以及让研究人员对噪声信号进行推断的其他先验知识,这有助于对所得到的图像进行锐化。光场技术“需要对环境周围了解得很充分才能进行图像重建,但可以提供大量信息,”托拉尔巴说。

利用散射光构建隐藏目标的三维几何结构

虽然弗里曼和托拉尔巴等人在麻省理工学院校园内的其他地方发现了一直存在的“不可见图像”,不过,一位旨在“改变世界”的TED计算机视觉科学家Ramesh Raskar采用了一种名为“主动成像”的方法:使用昂贵的专业相机激光系统来创建角落附近的高分辨率图像。

9554cd6e49ded4c55dc1508f671e23aefbe05a9d

麻省理工学院计算机视觉科学家拉梅什·拉斯卡尔(Ramesh Raskar)开创了一种主动非视距成像技术。

2012年,拉斯卡尔团队开创了一项技术,朝墙壁上发射激光脉冲,让一小部分散射光在屏障周围反射。在每次发射脉冲后的瞬间,使用“条纹相机”,以每秒数十亿帧的速度记录单个光子的传播路径,从而检测出从墙壁反弹回来的光子。通过测量返回光子的飞行时间,得出光子的行进距离,从而重建了隐藏目标的详细的三维几何结构。一个比较复杂的问题是,必须使用激光对墙壁进行光栅扫描以形成三维图像。比如,角落里有一个隐藏的人。

“那么,头部特定点的光线,肩膀上的特定点以及膝盖上的特定点都可能在相同的时间到达相机,”拉斯卡尔说。 “但如果我将激光发射到稍微不同的位置,那么来自上述三个点的光将不会在相同的时间返回。”你必须将所有信号组合起来,解决所谓的“逆问题”,以重建隐藏的三维几何结构。

Raskar解决逆问题的原始算法计算量很大,他的设备耗资50万美元。但在简化数学模型和削减成本方面取得了重大进展。

拉斯卡尔团队的实验设置

5ece37454e10422799455f603628b7d1ca97aa64

在主动的非视距成像中,激光从墙壁反射出去,从隐藏的物体上发生散射,然后返回原来的发射位置。反射光可用于对物体进行三维结构重建

过去的算法往往会因程序上的细节而陷入困境:研究人员通常选择检测返回墙上不同位置的光子,而不是激光发射的位置,这样相机就可以避开激光的反向散射光。但是,通过将激光和相机指向几乎相同的点,可以使出射和入射的光子映射出相同的“光锥”。

每当光从表面散射时,它就会形成一个扩展的光子球体,这个球体的痕迹随着时间的推移,显现出锥形。 斯坦福大学的O'Toole等人将阿尔伯特·爱因斯坦的老师赫尔曼·明科夫斯基(Hermann Minkowski)在20世纪初提出的光锥物理学理论转换成为关于光子飞行时间与散射表面位置的简明表达。他将这种转换称为“光锥变换”。

自动驾驶汽车已经开始使用直接成像的激光雷达系统,可以想象,它们有一天也可能配备“隐藏相机”来观察角落。Raskar在2012年那篇开创性论文的第一作者Andreas Velten预测: “在不久的将来,这些激光-SPAD传感器将能够出现手持设备上。”现在的任务是“在更复杂的场景下”和现实场景下实现这个功能,Velten说,“而不是必须非常小心地设置一个白色物体和周围黑色的背景,我们的目标是一台傻瓜相机。”

未来方向:可用于军事、天文和医疗行业的成像

有朝一日,非视距成像可以帮助救援队,消防员和自动机器人。 Velten正在与NASA的喷气推进实验室合作,开展一项旨在对月球洞穴内部进行远程成像的项目。与此同时,Raskar和公司已经使用他们的方法阅读了合上的书籍的前几页,并透过雾看到实现短距离透视。

除了音频文件的重建,弗里曼的放大算法还可能会在医疗业、安全设备、或检测微小运动的天文学研究中派上用场。该算法“是一个非常好的想法,”纽约大学和Flatiron研究所的天文学家和数据科学家大卫·霍格说。 “我认为有必要在天文学中利用这一技术。”

当被问及应用这一技术带来的隐私问题时,弗里曼表示: “这的确是个问题,在我的职业生涯中,我对此考虑了很多很多,”他说。弗里曼是一名摄影师,戴着眼镜,从小就开始拍摄照片,他说,自己刚开始做摄影师时,并不想从事任何和军事或间谍应用有关的事情。但随着时间的推移,他开始认为“技术是一种工具。可以以多种不同方式加以利用。如果你总是去极力避免任何可能具有军事用途的东西,那么你将永远不会做任何有用的成果。”他表示,即使用于军事用途,对这项技术的利用方式也是非常丰富的。

不过,让他感到兴奋的不是技术上可能性,而是能够发现隐藏在普通视野之外的现象。 “我认为,在世界上有很多东西还等着我们去发现。”他说。


原文发布时间为:2018-09-5

本文作者:Natalie Wolchover

本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”。

原文链接:MIT非视线成像“透视相机”:隔墙观物、影中窥人!



推荐阅读
  • 本文介绍了如何使用python从列表中删除所有的零,并将结果以列表形式输出,同时提供了示例格式。 ... [详细]
  • Java在运行已编译完成的类时,是通过java虚拟机来装载和执行的,java虚拟机通过操作系统命令JAVA_HOMEbinjava–option来启 ... [详细]
  • 本文讨论了Kotlin中扩展函数的一些惯用用法以及其合理性。作者认为在某些情况下,定义扩展函数没有意义,但官方的编码约定支持这种方式。文章还介绍了在类之外定义扩展函数的具体用法,并讨论了避免使用扩展函数的边缘情况。作者提出了对于扩展函数的合理性的质疑,并给出了自己的反驳。最后,文章强调了在编写Kotlin代码时可以自由地使用扩展函数的重要性。 ... [详细]
  • 如何提高PHP编程技能及推荐高级教程
    本文介绍了如何提高PHP编程技能的方法,推荐了一些高级教程。学习任何一种编程语言都需要长期的坚持和不懈的努力,本文提醒读者要有足够的耐心和时间投入。通过实践操作学习,可以更好地理解和掌握PHP语言的特异性,特别是单引号和双引号的用法。同时,本文也指出了只走马观花看整体而不深入学习的学习方式无法真正掌握这门语言,建议读者要从整体来考虑局部,培养大局观。最后,本文提醒读者完成一个像模像样的网站需要付出更多的努力和实践。 ... [详细]
  • 在2022年,随着信息化时代的发展,手机市场上出现了越来越多的机型选择。如何挑选一部适合自己的手机成为了许多人的困扰。本文提供了一些配置及性价比较高的手机推荐,并总结了选择手机时需要考虑的因素,如性能、屏幕素质、拍照水平、充电续航、颜值质感等。不同人的需求不同,因此在预算范围内找到适合自己的手机才是最重要的。通过本文的指南和技巧,希望能够帮助读者节省选购手机的时间。 ... [详细]
  • 统一知识图谱学习和建议:更好地理解用户偏好
    本文介绍了一种将知识图谱纳入推荐系统的方法,以提高推荐的准确性和可解释性。与现有方法不同的是,本方法考虑了知识图谱的不完整性,并在知识图谱中传输关系信息,以更好地理解用户的偏好。通过大量实验,验证了本方法在推荐任务和知识图谱完成任务上的优势。 ... [详细]
  • macOS Big Sur全新设计大版本更新,10+个值得关注的新功能
    本文介绍了Apple发布的新一代操作系统macOS Big Sur,该系统采用全新的界面设计,包括图标、应用界面、程序坞和菜单栏等方面的变化。新系统还增加了通知中心、桌面小组件、强化的Safari浏览器以及隐私保护等多项功能。文章指出,macOS Big Sur的设计与iPadOS越来越接近,结合了去年iPadOS对鼠标的完善等功能。 ... [详细]
  • 本文介绍了iOS开发中检测和解决内存泄漏的方法,包括静态分析、使用instruments检查内存泄漏以及代码测试等。同时还介绍了最能挣钱的行业,包括互联网行业、娱乐行业、教育行业、智能行业和老年服务行业,并提供了选行业的技巧。 ... [详细]
  • mui框架offcanvas侧滑超出部分隐藏无法滚动如何解决
    web前端|js教程off-canvas,部分,超出web前端-js教程mui框架中off-canvas侧滑的一个缺点就是无法出现滚动条,因为它主要用途是设置类似于qq界面的那种格 ... [详细]
  • 驭势科技签约禾赛科技,携手推进“全场景”自动驾驶商业化
    2021年12月8日,全球领先的激光雷达公司禾赛科技和自动驾驶商业化全球领跑的公司驭势科技共同宣布,双方达成战略合作协议。根据协议,禾赛将 ... [详细]
  • Xcode离线安装帮助文档1.在线查看帮助文件:Xcode下查看帮助文件,菜单Help-DeveloperDocumentation在右上角搜索框中即可检索,但速度很慢 ... [详细]
  • 前端不规则图像点击_如何在前端开发的潮流中快速学习学好学以致用?
    大家好,我是致力于前端开发,前端设计,前端入门的前端小姐姐,今天为大家带来的前端新知识是【雪碧图和滑动门】,不 ... [详细]
  • 聊聊 中国人工智能科技产业 区域竞争力分析及趋势
    原文链接:聊聊中国人工智能科技产业区域竞争力分析及趋势最近看了一个关于国内AI的报告《中国新一代人工智能科技产业区域竞争力评价指数(2021ÿ ... [详细]
  • 本文介绍了在Vue项目中如何结合Element UI解决连续上传多张图片及图片编辑的问题。作者强调了在编码前要明确需求和所需要的结果,并详细描述了自己的代码实现过程。 ... [详细]
  • 本文讨论了在手机移动端如何使用HTML5和JavaScript实现视频上传并压缩视频质量,或者降低手机摄像头拍摄质量的问题。作者指出HTML5和JavaScript无法直接压缩视频,只能通过将视频传送到服务器端由后端进行压缩。对于控制相机拍摄质量,只有使用JAVA编写Android客户端才能实现压缩。此外,作者还解释了在交作业时使用zip格式压缩包导致CSS文件和图片音乐丢失的原因,并提供了解决方法。最后,作者还介绍了一个用于处理图片的类,可以实现图片剪裁处理和生成缩略图的功能。 ... [详细]
author-avatar
jimscloudy
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有