热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

论文笔记_S2D.48_2017IEEERAL_单视图和多视图深度融合

基本情况题目:Single-viewandmulti-viewdepthfusion出处:FcilJM,ConchaA,MontesanoL,etal

基本情况


  • 题目:Single-view and multi-view depth fusion
  • 出处:Fácil J M, Concha A, Montesano L, et al. Single-view and multi-view depth fusion[J]. IEEE Robotics and Automation Letters, 2017, 2(4): 1994-2001.
  • video: https://www.youtube.com/watch?v=ipc5HukTb4k&feature=youtu.be

摘要

单目序列的密集和精确的三维映射是一项关键技术,在许多应用中仍然是一个开放的研究领域。这篇论文利用了基于单视图卷积网络(CNN)深度估计的最新结果,并将其与多视图深度估计相融合。这两种方法具有互补性。
多视点深度是高精度的,但仅在高纹理区域和高视差情况下。单视图深度捕捉中层区域的局部结构,包括无纹理区域,但估计深度缺乏全局一致性。我们提出的单视图和多视图融合在几个方面具有挑战性。


  • 首先,这两个深度都与变形有关,变形依赖于图像内容。
  • 其次,对于低视差的结构,高精度多视点的选择可能是困难的。

我们对这两个问题提出了自己的看法。我们在NYUv2和TUM的公共数据集中的结果表明,我们的算法优于单一和多视图方法。


介绍

从一般的单眼序列估计在线,准确和密集的3D场景重建是计算机视觉中的基本研究问题之一。如今,该问题具有高度的相关性,因为它是几个新兴应用市场(增强和虚拟现实,自动驾驶汽车和机器人技术)中的一项关键技术。现有技术是所谓的直接映射方法[1],其通过基于若干视图中的对应像素之间的光度误差,通过最小化正则化的成本函数来估计图像深度。多视点深度估计的准确性主要取决于三个因素:


  • 1)几何配置,低视差配置的精度较低;
  • 2)只能可靠地估计高梯度像素的视图之间的对应关系的质量;
  • 3)正则化函数,通常是总变化范数(Total Variation norm?),对于较大的无纹理区域而言是不准确的。

由于在低梯度区域上的这种较差的性能,有时仅在视觉直接SLAM的高梯度图像像素中估算半密集图(例如[2])。这样的半密集图在高视差配置中是准确的,但不是所查看多个视角的完整模型。低视差配置在视觉SLAM文献中通常被忽略。

另一种方法是单视图深度估计,由于使用了深度卷积网络[3],最近它的精度有了质的提高。对于高纹理和高视差点,其准确性仍低于多视图方法的准确性。但是,正如我们将在本文中争论的那样,深度卷积网络提高了多视图方法在低纹理区域的准确性,这是由于深度网络进行了高层次的特征提取,而不是多视图方法使用的低层次的高梯度像素。有趣的是,估计深度中的错误似乎是局部的,而不是全局相关的,因为它们来自深度学习功能。

本文的主要思想是


  • 利用单视图和多视图深度图的信息来获得改进的深度,即使在低视差序列和低梯度区域中也是如此。

我们的贡献是


  • 融合了这些互补深度估计的算法。

此任务有两个主要挑战。


  • 首先,单视图估计的误差分布具有几种局部模式,因为它取决于图像内容,而不取决于几何结构。因此,单视图深度和多视图深度与内容依赖的变形(deformation)有关。
  • 其次,在处理包括高和低视差配置在内的一般情况时,对多视图准确性进行建模并非易事。

我们提出了


  • 一种基于加权的插值方法,该方法基于多视图半密集深度的质量和影响区域,基于单视图局部结构的加权插值,

并在两个公共数据集(NYU和TUM)中评估其性能。结果表明,我们的融合算法相对于单个单视图和多视图方法均得到了改进。

本文的其余部分安排如下。第二节介绍了最相关的相关工作。第三节提出并详细介绍了用于单视图和多视图融合的算法。第四节介绍了我们的实验结果,最后,第五节包含了这项工作的结论。


推荐阅读
  • 由中科院自动化所、中科院大学及南昌大学联合研究提出了一种新颖的双路径生成对抗网络(TP-GAN),该技术能通过单一侧面照片生成逼真的正面人脸图像,显著提升了不同姿态下的人脸识别效果。 ... [详细]
  • 机器学习核心概念与技术
    本文系统梳理了机器学习的关键知识点,涵盖模型评估、正则化、线性模型、支持向量机、决策树及集成学习等内容,并深入探讨了各算法的原理和应用场景。 ... [详细]
  • 尽管深度学习带来了广泛的应用前景,其训练通常需要强大的计算资源。然而,并非所有开发者都能负担得起高性能服务器或专用硬件。本文探讨了如何在有限的硬件条件下(如ARM CPU)高效运行深度神经网络,特别是通过选择合适的工具和框架来加速模型推理。 ... [详细]
  • 本题探讨了在一个有向图中,如何根据特定规则将城市划分为若干个区域,使得每个区域内的城市之间能够相互到达,并且划分的区域数量最少。题目提供了时间限制和内存限制,要求在给定的城市和道路信息下,计算出最少需要划分的区域数量。 ... [详细]
  • 本文作者分享了在阿里巴巴获得实习offer的经历,包括五轮面试的详细内容和经验总结。其中四轮为技术面试,一轮为HR面试,涵盖了大量的Java技术和项目实践经验。 ... [详细]
  • 深入解析Java虚拟机(JVM)架构与原理
    本文旨在为读者提供对Java虚拟机(JVM)的全面理解,涵盖其主要组成部分、工作原理及其在不同平台上的实现。通过详细探讨JVM的结构和内部机制,帮助开发者更好地掌握Java编程的核心技术。 ... [详细]
  • PHP 过滤器详解
    本文深入探讨了 PHP 中的过滤器机制,包括常见的 $_SERVER 变量、filter_has_var() 函数、filter_id() 函数、filter_input() 函数及其数组形式、filter_list() 函数以及 filter_var() 和其数组形式。同时,详细介绍了各种过滤器的用途和用法。 ... [详细]
  • 在现代Web应用中,当用户滚动到页面底部时,自动加载更多内容的功能变得越来越普遍。这种无刷新加载技术不仅提升了用户体验,还优化了页面性能。本文将探讨如何实现这一功能,并介绍一些实际应用案例。 ... [详细]
  • 在网站制作中随时可用的10个 HTML5 代码片段
    HTML很容易写,但创建网页时,您经常需要重复做同样的任务,如创建表单。在这篇文章中,我收集了10个超有用的HTML代码片段,有HTML5启动模板、空白图片、打电话和发短信、自动完 ... [详细]
  • 深入解析Redis内存对象模型
    本文详细介绍了Redis内存对象模型的关键知识点,包括内存统计、内存分配、数据存储细节及优化策略。通过实际案例和专业分析,帮助读者全面理解Redis内存管理机制。 ... [详细]
  • 本文详细解析了Java中hashCode()和equals()方法的实现原理及其在哈希表结构中的应用,探讨了两者之间的关系及其实现时需要注意的问题。 ... [详细]
  • 雨林木风 GHOST XP SP3 经典珍藏版 V2017.11
    雨林木风 GHOST XP SP3 经典珍藏版 V2017.11 ... [详细]
  • 2018-2019学年第六周《Java数据结构与算法》学习总结
    本文总结了2018-2019学年第六周在《Java数据结构与算法》课程中的学习内容,重点介绍了非线性数据结构——树的相关知识及其应用。 ... [详细]
  • JavaScript中的数组是数据集合的核心结构之一,内置了多种实用的方法。掌握这些方法不仅能提高开发效率,还能显著提升代码的质量和可读性。本文将详细介绍数组的创建方式及常见操作方法。 ... [详细]
  • Mongoose 5.12.10 发布:MongoDB 异步对象模型工具的新特性与修复
    Mongoose 是一款专为异步环境设计的 MongoDB 对象模型工具,支持 Promise 和回调函数。最新版本 Mongoose 5.12.10 带来了多项修复和改进,包括查询选项中的默认值设置、嵌入式判别器填充、以及 TypeScript 定义文件的优化。 ... [详细]
author-avatar
lailai
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有