当前位置: 开发笔记 > 编程语言 > 正文

ICCV2019刷新主流数据集所有评价指标目标检测算法EGNet

作者：mobiledu2502879833 | 来源：互联网 | 2023-09-10 17:22

在人类视觉感知中，很容易将注意力集中在场景的显着目标上。在计算机视觉的许多问题中，需要类似的机制以允许计算机更好地理解场景。特别是具有明确人类目的的应用

在人类视觉感知中&＃xff0c;很容易将注意力集中在场景的显着目标上。在计算机视觉的许多问题中&＃xff0c;需要类似的机制以允许计算机更好地理解场景。特别是具有明确人类目的的应用场景。

用户的照片通常在背景中很复杂。该算法实际上需要关注用户在拍照时感兴趣的目标&＃xff08;这通常是场景中最重要的目标&＃xff09;&＃xff0c;然后转到数据库以检索相同和相似的对象。

最近&＃xff0c;南开大学媒体计算实验室提出的最新边缘检测和图像过分割&＃xff08;可用于生成超像素&＃xff09;被IEEE PAMI接受。

该研究的第一作者也在微博上说&＃xff1a;“这是第一个在最广泛使用的图像分割数据集BSD500上手动平均F-Measure评估值的实时算法。图像分割效果也得到了更新。准确度记录该算法也是开源的。“

下图显示了EGNet在本文中检测到的重要目标的示例&＃xff1a;

算法原理

从EGNet&＃xff1a;EGNet: Edge Guidance Network for Salient Object Detection&＃xff0c;我们可以看到本文的最大创新是使用边缘信息来指导网络进行重要的目标检测。

这很容易理解&＃xff0c;显着性目标和背景之间通常有明显的优势。

从由重要目标数据集标记的掩模中提取边缘并不困难。如何使用边缘信息&＃xff1f;

下图显示了作者的算法设计原则&＃xff1a;

其核心是更丰富的特征&＃xff1a;每个阶段的所有转换层都是有用的&＃xff0c;而不是传统的&＃xff0c;只要每个阶段的最后一个转换层。这是一种非常通用的技术&＃xff0c;基本上是使用什么任务&＃xff0c;并且可以实现几行代码。

使用VGG16网络&＃xff0c;我们的方法在几个常见数据集上具有最佳性能&＃xff08;最先进的&＃xff09;。在BSDS500基准数据集上进行测试和评估时&＃xff0c;F-Measure得分&＃xff08;F-measure&＃xff09;得分为0.811&＃xff0c;速度为8 FPS。此外&＃xff0c;RCF方法的快速版本实现了0.806和30 FPS的速度。为了证明所提方法的多功能性&＃xff0c;我们还将RCF检测的边缘应用于图像分割问题。

我们构建了一个基于VGG16的简单神经网络&＃xff0c;得到conv3_1&＃xff0c;conv3_2&＃xff0c;conv3_3&＃xff0c;conv4_1&＃xff0c;conv4_2和conv4_3各层的输出。从上图可以清楚地看出&＃xff0c;卷积特征逐渐变得粗糙&＃xff0c;并且中间层conv3_1&＃xff0c;conv3_2&＃xff0c;conv4_1和conv4_2包含许多有用的精确细节&＃xff0c;并且这些细节不出现在其他层中。

上图显示了RCF网络架构。网络的输入是任何大小的图像&＃xff0c;并且网络的输出是相同大小的边缘检测图。我们将每个卷积层的层次特征组合成一个整体框架&＃xff0c;并训练所有参数进行学习。由于VGG16的感受域在大小上彼此不同&＃xff0c;我们的网络可以学习多尺度&＃xff0c;包括低尺度和对象级信息&＃xff0c;这些信息将有助于边缘检测。

上图是多尺度算法的流水线图。调整原始图像的大小以构建图像金字塔。然后将这些多尺度图像输入RCF网络以进行前向传送。接下来&＃xff0c;我们使用双线性插值将生成的边缘检测图恢复为其原始大小。这些边缘图的简单平均计算产生高质量的边缘图。

BSDS500数据集的评估结果

上图是50年来边缘检测方法性能的总结。我们的方法是第一个获得比人类注释器更好的F-Measure分数的实时系统。

论文地址&＃xff1a;https://arxiv.org/pdf/1908.08297v1.pdf

论文源码关注微信公众号&＃xff1a;“图像算法”或者微信搜索账号imalg_cn关注公众号

推荐阅读

jsp
网站访问全流程解析

本文详细介绍了从用户在浏览器中输入一个域名（如www.yy.com）到页面完全展示的整个过程，包括DNS解析、TCP连接、请求响应等多个步骤。 ... [详细]

蜡笔小新 2024-11-12 18:13:16
jsp
TypeScript: 泛型的力量与价值

本文探讨了 TypeScript 中泛型的重要性和应用场景，通过多个实例详细解析了泛型如何提升代码的复用性和类型安全性。 ... [详细]

蜡笔小新 2024-11-15 12:12:42
web
从0到1搭建大数据平台

从0到1搭建大数据平台 ... [详细]

蜡笔小新 2024-11-12 15:26:03
object
深入解析 Lifecycle 的实现原理

本文将详细介绍 Android Jetpack 中 Lifecycle 组件的实现原理，帮助开发者更好地理解和使用 Lifecycle，避免常见的内存泄漏问题。 ... [详细]

蜡笔小新 2024-11-12 14:05:19
object
LeetCode 实战：寻找三数之和为零的组合

给定一个包含 n 个整数的数组，判断该数组中是否存在三个元素 a、b、c，使得 a + b + c = 0。找出所有满足条件且不重复的三元组。 ... [详细]

蜡笔小新 2024-11-15 18:39:48
web
嵌入式Linux工程师笔试题精选

本文整理了一份基础的嵌入式Linux工程师笔试题，涵盖填空题、编程题和简答题，旨在帮助考生更好地准备考试。 ... [详细]

蜡笔小新 2024-11-15 10:42:13
js
小程序的授权和登陆

小程序的授权和登陆 ... [详细]

蜡笔小新 2024-11-14 19:07:05
js
高端存储技术演进与趋势

本文探讨了高端存储技术的发展趋势，包括松耦合架构、虚拟化、高性能、高安全性和智能化等方面。同时，分析了全闪存阵列和中端存储集群对高端存储市场的冲击，以及高端存储在不同应用场景中的发展趋势。 ... [详细]

蜡笔小新 2024-11-14 11:58:22
object
Python基础：使用NLTK和Python构建机器学习应用

本文节选自《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书的第1章第1.2节，作者Nitin Hardeniya。本文将带领读者快速了解Python的基础知识，为后续的机器学习应用打下坚实的基础。 ... [详细]

蜡笔小新 2024-11-13 21:23:34
object
EST：西湖大学鞠峰组污水厂病原菌与土著反硝化细菌是多重抗生素耐药基因的活跃表达者...

点击蓝字关注我们编译：祝新宇校稿：鞠峰、袁凌论文ID原名：PathogenicandIndigenousDenitrifyingBacte ... [详细]

蜡笔小新 2024-11-13 21:09:41
jsp
Java DAO模式详解与代码示例

DAO（Data Access Object）模式是一种用于抽象和封装所有对数据库或其他持久化机制访问的方法，它通过提供一个统一的接口来隐藏底层数据访问的复杂性。 ... [详细]

蜡笔小新 2024-11-13 12:25:33
object
IOS Run loop详解

为什么80%的码农都做不了架构师？转自http:blog.csdn.netztp800201articledetails9240913感谢作者分享Objecti ... [详细]

蜡笔小新 2024-11-13 12:14:35
web
Python 数据可视化实战指南

本文详细介绍如何使用 Python 进行数据可视化，涵盖从环境搭建到具体实例的全过程。 ... [详细]

蜡笔小新 2024-11-13 06:03:30
jsp
第二十五天接口、多态

1.java是面向对象的语言。设计模式：接口接口类是从java里衍生出来的，不是python原生支持的主要用于继承里多继承抽象类是python原生支持的主要用于继承里的单继承但是接 ... [详细]

蜡笔小新 2024-11-12 06:43:20
web
秒建一个后台管理系统？用这5个开源免费的Java项目就够了

秒建一个后台管理系统？用这5个开源免费的Java项目就够了 ... [详细]

蜡笔小新 2024-11-12 03:21:33

mobiledu2502879833

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章