YOLOv3训练自己的数据集实现目标检测

作者：栗子丶子兮_481 | 来源：互联网 | 2023-08-13 12:23

YOLO的全称是YouOnlyLookOnce，是最早出现的单阶段目标检测方法，也是第一个实现了实时目标检测的方法。计算机视觉领域主要包括两大方面：图像分类、目标检测。图像分类是指

YOLO的全称是You Only Look Once，是最早出现的单阶段目标检测方法，也是第一个实现了实时目标检测的方法。计算机视觉领域主要包括两大方面：图像分类、目标检测。图像分类是指根据图像的语义信息将不同类别的图像区分开来，比如人脸识别，即模型输入一张图片，判断该图片属于某个类别。

YOLO是一个国外开源的目标检测算法，目前流行的YOLO算法分为三个版本，即YOLOv1、YOLOv2、YOLOv3，YOLO的核心思想就是利用整张图作为网络的输入，直接在输出层回归bounding box(边界)的位置及所属类别。

YOLO的整体结构如下：

YOLOv3训练自己的数据集实现目标检测

该网络是根据GoogLeNet改进的，输入图片为448*448大小，输出为7×7×(2×5+20)。将原始图片分为S×S个单元格，之后的输出是以单元格为单位进行的。如果一个object的中心落在某个单元格上，那么这个单元格负责预测这个物体。每个单元格需要预测B个box值(box值包括坐标和宽高)，同时为每个box值预测一个置信度(confidence scores)。也就是每个单元格需要预测B×(4+1)个值。每个单元格需要预测C(物体种类个数)个条件概率值。所以，最后网络的输出维度为S×S×(B×5+C)，这里虽然每个单元格负责预测一种物体，但是每个单元格可以预测多个box值。

那么如何利用YOLOv3训练自己的模型呢？

首先需要一批图片数据，比如以下数据：

YOLOv3训练自己的数据集实现目标检测

图片包括100张猫狗两种类型的图片。其次需要对这批图片进行label的制作，即某张图片的猫在哪里、狗在哪里、利用Labellmg等工具进行label的制作。

YOLOv3训练自己的数据集实现目标检测

点击save后会生成以xml结尾的label文件，内容如下：

YOLOv3训练自己的数据集实现目标检测

由于该图片中只包含两个关键目标，即只有两个object，并存储相对应的object的坐标，到此已经初步生成了图片的label。

其次，将数据划分为训练集、测试集、验证集，执行以下脚本：

YOLOv3训练自己的数据集实现目标检测

最后，将.xml数据转化为YOLO需要的VOC数据，执行以下脚本：

YOLOv3训练自己的数据集实现目标检测

在数据准备完成后，即可进行模型训练。

操作系统：MacOS 10.15.6

Python：3.7.6

Tensorflow：1.13

Keras：2.15

OpenCV：4.3.0

部分训练代码如下：

YOLOv3训练自己的数据集实现目标检测

YOLOv3训练自己的数据集实现目标检测在训练完成后，会在logs文件下生产模型的权重文件及神经网络模型结构可视化文件等，部分模型结构如下：

YOLOv3训练自己的数据集实现目标检测

YOLOv3训练自己的数据集实现目标检测模型测试效果如下：

YOLOv3训练自己的数据集实现目标检测

推荐阅读

process
解决Only fullscreen opaque activities can request orientation错误的方法

本文介绍了在使用PictureSelectorLight第三方框架时遇到的Only fullscreen opaque activities can request orientation错误，并提供了一种有效的解决方案。 ... [详细]

蜡笔小新 2024-11-13 09:46:25
const
Java 15 发布，带来多项重要更新！

2020年9月15日，Oracle正式发布了最新的JDK 15版本。本次更新带来了许多新特性，包括隐藏类、EdDSA签名算法、模式匹配、记录类、封闭类和文本块等。 ... [详细]

蜡笔小新 2024-11-14 12:11:09
audio
使用HTML和JavaScript实现视频截图功能

本文介绍了如何利用HTML和JavaScript实现从远程MP4、本地摄像头及本地上传的MP4文件中截取视频帧，并展示了具体的实现步骤和示例代码。 ... [详细]

蜡笔小新 2024-11-15 00:19:42
web
Cookie学习小结

Cookie学习小结 ... [详细]

蜡笔小新 2024-11-14 16:26:25
join
Python基础：使用NLTK和Python构建机器学习应用

本文节选自《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书的第1章第1.2节，作者Nitin Hardeniya。本文将带领读者快速了解Python的基础知识，为后续的机器学习应用打下坚实的基础。 ... [详细]

蜡笔小新 2024-11-13 21:23:34
web
Spring – Bean Life Cycle

Spring – Bean Life Cycle ... [详细]

蜡笔小新 2024-11-13 13:24:40
utf-8
Android 自定义加载对话框 CustomProgressDialog

本文介绍如何在 Android 中自定义加载对话框 CustomProgressDialog，包括自定义 View 类和 XML 布局文件的详细步骤。 ... [详细]

蜡笔小新 2024-11-12 21:51:00
utf-8
Java 并发编程：深入解析 AtomicInteger 和 CAS 无锁算法

在多线程并发环境中，普通变量的操作往往是线程不安全的。本文通过一个简单的例子，展示了如何使用 AtomicInteger 类及其核心的 CAS 无锁算法来保证线程安全。 ... [详细]

蜡笔小新 2024-11-12 16:40:04
utf-8
javascript分页类支持页码格式

前端时间因为项目需要，要对一个产品下所有的附属图片进行分页显示，没考虑ajax一张张请求，所以干脆一次性全部把图片out，然 ... [详细]

蜡笔小新 2024-11-12 14:58:57
const
Android 自定义 RecycleView 左滑上下分层示例代码

为了满足项目需求，需要在多个场景中实现左滑删除功能，并且后续可能在列表项中增加其他功能。虽然网络上有很多左滑删除的示例，但大多数封装不够完善。因此，我们尝试自己封装一个更加灵活和通用的解决方案。 ... [详细]

蜡笔小新 2024-11-13 17:43:59
process
利用OpenCV和线性SVM实现人脸识别

本文介绍如何使用OpenCV和线性支持向量机（SVM）模型来开发一个简单的人脸识别系统，特别关注在只有一个用户数据集时的处理方法。 ... [详细]

蜡笔小新 2024-11-13 14:50:37
process
在范围[0..n-1]中产生m个不同的随机数 - Generating m distinct random numbers in the range [0..n-1]

Ihavetwomethodsofgeneratingmdistinctrandomnumbersintherange[0..n-1]我有两种方法在范围[0.n-1]中生 ... [详细]

蜡笔小新 2024-11-13 09:49:14
process
Android 开发教程：SQLite 数据库使用详解

本视频教程将带你快速了解 Android 开发的基础知识，并详细讲解如何在 Android 应用中使用 SQLite 数据库进行数据存储和管理。 ... [详细]

蜡笔小新 2024-11-12 18:59:48
utf-8
网站访问全流程解析

本文详细介绍了从用户在浏览器中输入一个域名（如www.yy.com）到页面完全展示的整个过程，包括DNS解析、TCP连接、请求响应等多个步骤。 ... [详细]

蜡笔小新 2024-11-12 18:13:16
controller
Spring Boot 入门指南：Hello World 示例

本教程详细介绍了如何使用 Spring Boot 创建一个简单的 Hello World 应用程序。适合初学者快速上手。 ... [详细]

蜡笔小新 2024-11-12 15:18:38

栗子丶子兮_481

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章