热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

检测概率和虚警概率_目标检测入门

1.目标检测-任务概述分类VS检测分类问题:所属类别检测问题:所属类别物体位置1.1从分类到检测算法设为图片中的某个像素点,为其他位置&#

1. 目标检测-任务概述

分类 VS 检测

  • 分类问题:所属类别
  • 检测问题:所属类别 + 物体位置

1.1 从分类到检测算法

为图片中的某个像素点,
为其他位置,由
可构成一个矩形框。

穷举图片中所有可能的矩形框

,每个子区域当成一张图片来做分类。
3b9c5f00310b563424a5989120d9dd7b.png

候选区域:每个

所代表的矩形框,也被称为感兴趣区域(Region of Interest,
ROI)。

1.2 目标检测的核心问题

  • 如何产生候选区域,并对它们进行标注;
  • 如何提取图像特征,并将提取到的特征与候选区域的类别和位置进行关联。

1.3 目标检测算法

bc2f5d85b85850467df1a5cb8720666d.png
  • 两阶段目标检测算法:特征提取 -> 生成 Region Proposal -> 分类 + 位置调整(bounding box regression)

典型算法: Faster-RCNN, Pyramid Network

  • 单阶段目标检测算法:特征提取 -> 分类 + 位置调整(bounding box regression)

典型算法:SSD, YOLOv3,RetinaNet

2. 目标检测基础知识

边界框:正好能包含物体的矩形框,bounding box, bbox。

真实框:数据集标注中给出的目标物体对应的边界框, ground truth box, 简称 gt_box。

预测框:由模型预测出的可能包含目标物体的边界框,prediction box, 简称 pred_box。

检测任务输出:[L, P, x1, y1, x2, y2],L 是类别标签,P 是所属类别的概率。一张图片会有多个预测框。

锚框:以某种规则生成边界框,经过位置调整后成为预测框, anchors。

878b930abf71ae9424eecb2b0bccee70.png

锚框的生成可参考程序:

书亮:generate_anchors.py​zhuanlan.zhihu.com

锚框和真实框的重合程度可以用指标 IOU(Intersection of Union)来衡量。

3. 目标检测的指标

  • TP (True Positive): 正确的正样本。即检测器找出了样本区域,正确的判断。
  • FN (False Negative): 错误的负样本,即检测器把样本区域判定为背景,相当于『遗漏』。
  • TN (True Negative): 正确的负样本。即检测器把背景判定为背景,正确的判断。
  • FP (False Positive): 错误的正样本。即检测器把背景判定为样本区域,也叫『虚警』。

3.1 两个指标:

  • Precision

Precision - 正确率,也即检测结果的正确率:

  • Recall

Recall - 召回率,也即样本被检测出来的概率:

3.2 如何判断检测器的好坏?

对于检测算法,每个框的输出如下:

或者

confidence 代表当前框是目标的置信度,

PR 曲线

调整

,计算不同
下检测器的 Precison 和 Recall 值,然后连接成曲线,就是 PR 曲线。

从积分的角度来看,PR 曲线下的面积就是检测器在各个

下的 AP(Average Precision)。当然,AP 越高的检测器就越好。

3.3 mAP

关于多类别检测器,考虑 mAP (mean Average Precision):

3.4 NMS

NMS(None Maximum Suppression),又名为非极大值抑制,是目标检测框架种的后处理模块,主要用于删除高度冗余的 bbox。

4. Faster-RCNN

5. YOLOv3

5.1 实现方案

7ae9a3891f08e4a54e4f42f56a443a73.png
6d302a8ba3df3e909cd72204f1c5111b.png

参考

  1. Paddle 深度学习应用公开课: https://www.bilibili.com/video/av83663267
  2. NMS: https://zhuanlan.zhihu.com/p/50126479



推荐阅读
  • 2019年斯坦福大学CS224n课程笔记:深度学习在自然语言处理中的应用——Word2Vec与GloVe模型解析
    本文详细解析了2019年斯坦福大学CS224n课程中关于深度学习在自然语言处理(NLP)领域的应用,重点探讨了Word2Vec和GloVe两种词嵌入模型的原理与实现方法。通过具体案例分析,深入阐述了这两种模型在提升NLP任务性能方面的优势与应用场景。 ... [详细]
  • 表面缺陷检测数据集综述及GitHub开源项目推荐
    本文综述了表面缺陷检测领域的数据集,并推荐了多个GitHub上的开源项目。通过对现有文献和数据集的系统整理,为研究人员提供了全面的资源参考,有助于推动该领域的发展和技术进步。 ... [详细]
  • 利用PaddleSharp模块在C#中实现图像文字识别功能测试
    PaddleSharp 是 PaddleInferenceCAPI 的 C# 封装库,适用于 Windows (x64)、NVIDIA GPU 和 Linux (Ubuntu 20.04) 等平台。本文详细介绍了如何使用 PaddleSharp 在 C# 环境中实现图像文字识别功能,并进行了全面的功能测试,验证了其在多种硬件配置下的稳定性和准确性。 ... [详细]
  • Node.js 事宜轮回事情流程 & 生命周期
    本文,将会细致的解说node.js事宜轮回事变流程和生命周期一些罕见的误会在js引擎内部的事宜轮回最罕见的误会之一,事宜轮回是Javascript引擎(V8,spiderMonke ... [详细]
  • Python与R语言在功能和应用场景上各有优势。尽管R语言在统计分析和数据可视化方面具有更强的专业性,但Python作为一种通用编程语言,适用于更广泛的领域,包括Web开发、自动化脚本和机器学习等。对于初学者而言,Python的学习曲线更为平缓,上手更加容易。此外,Python拥有庞大的社区支持和丰富的第三方库,使其在实际应用中更具灵活性和扩展性。 ... [详细]
  • 本文深入探讨了 MXOTDLL.dll 在 C# 环境中的应用与优化策略。针对近期公司从某生物技术供应商采购的指纹识别设备,该设备提供的 DLL 文件是用 C 语言编写的。为了更好地集成到现有的 C# 系统中,我们对原生的 C 语言 DLL 进行了封装,并利用 C# 的互操作性功能实现了高效调用。此外,文章还详细分析了在实际应用中可能遇到的性能瓶颈,并提出了一系列优化措施,以确保系统的稳定性和高效运行。 ... [详细]
  • 在当前各种算法实现和开源软件包层出不穷的背景下,算法对程序员的重要性是否有所减弱?回顾历史,早期程序员必须熟练掌握算法并频繁自行编写。然而,随着技术的发展,算法逐渐成为一种“商品”,现代开发者更多依赖现成的库和商业算法解决方案。有观点认为,机器学习领域中,许多算法已经被高度封装,不再需要深入理解其背后的数学原理。然而,这种趋势也引发了关于技术深度与广度平衡的讨论,强调了基础理论知识在应对复杂问题时的不可替代性。 ... [详细]
  • 本文详细介绍了 Sublime Text 3 在 2021 年的激活密钥及其在线激活方法。用户可以通过提供的链接访问云海天教程,获取更多详细的激活码信息和操作步骤。此外,文章还提供了安全可靠的激活方案,帮助用户顺利激活软件,提升编程效率。 ... [详细]
  • Sublime Text 3 注册密钥及激活方法详解
    本文详细介绍了Sublime Text 3的注册密钥获取与激活方法,旨在帮助用户合法且高效地使用这款强大的文本编辑器。文章不仅提供了最新的注册密钥信息,还涵盖了详细的激活步骤,确保用户能够顺利激活软件,享受其带来的便捷与高效。此外,文中还简要对比了Sublime Text 3与其他主流文本编辑器的功能差异,为用户提供更多选择参考。 ... [详细]
  • 亚马逊老板杰夫·贝佐斯
    本文主要介绍关于的知识点,对【亚马逊创始人或成地球首位万亿富豪,起底贝佐斯创业之路】和【亚马逊老板杰夫·贝佐斯】有兴趣的朋友可以看下由【CSDN资讯】投稿的技术文章,希望该技术和经验能帮到你解决你所遇 ... [详细]
  • 【高德地图Android开发套件】详尽视频教程
    前两天参加了高德在北航举办的公开课,感觉非常不错。完成老师布置的作业之后,还顺利地拿到了高德开发者认证证书!!现在来跟大家分享一下,如何快速学习【高德地图AndroidSDK】的开发。一天包会!连 ... [详细]
  • tabnine 破解_最新在线免费激活2022.07.18
    (tabnine破解)本文适用于JetBrains家族所有ide,包括IntelliJidea,phpstorm,webstorm,pycharm,datagrip等。Intell ... [详细]
  • 【毕设】六足机器人的设计
    苍天下的蓝耀__【毕设】六足机器人的设计序这个项目是我本科毕业设计作品,可实现功能有常规控制(前后左右移动、左右自旋)、保持自平衡、三档变速及自主避障功能,历时三个月在家独立完成。 ... [详细]
  • 老电影和图片变清晰的秘密!分辨率提升400%的AI算法
    老电影和图片变清晰的秘密!分辨率提升400%的AI算法-如上图,从100x133pix→400x532pix,除了肉眼可见的清晰,拥有可以将分辨率提升400%的技术到底意味着什么 ... [详细]
  • 聊聊 中国人工智能科技产业 区域竞争力分析及趋势
    原文链接:聊聊中国人工智能科技产业区域竞争力分析及趋势最近看了一个关于国内AI的报告《中国新一代人工智能科技产业区域竞争力评价指数(2021ÿ ... [详细]
author-avatar
大鱼小鱼比目鱼
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有