当前位置: 开发笔记 > 编程语言 > 正文

使用paddleX进行目标检测详解

作者：gengjiang3_946 | 来源：互联网 | 2023-07-05 15:15

前言使用百度开源的paddleX工具，我们可以很容易快速训练出

前言

使用百度开源的paddleX工具，我们可以很容易快速训练出使用我们自己标注的数据的目标检测，图像分类，实例分割，语义分割的深度网络模型，本文，主要记录如何全流程使用pddleX来训练一个简单用于检测猫狗ppyolo_tiny模型。

（一）数据准备

这里的图片，我们直接在百度图片上搜索“猫狗”，随机下载10张图片，存到“JPEGImages文件夹”里。
在这里插入图片描述

（二）使用labelme标注工具进行标注

（1）labelme安装&启动

#前提时安装了anaconda #安装 conda activate my_paddlex conda install pyqt pip install labelme #启动 conda activate my_paddlex labelme

(2)目标框标注

打开矩形框标注工具(右键菜单->Create Rectangle)，具体如下图所示
使用拖拉的方式对目标物体进行标识，并在弹出的对话框中写明对应label（当label已存在时点击即可, 此处请注意label勿使用中文），具体如下图所示，当框标注错误时，可点击左侧的“Edit Polygons”再点击标注框，通过拖拉进行修改，也可再点击“Delete Polygon”进行删除。
点击右侧”Save“，将标注结果保存到中创建的文件夹Annotations目录中

(3)更多类型的标注

这部分直接复制了paddleX里的文档 数据标注。

详见文档图像分类数据标注

详见文档目标检测数据标注

详见文档实例分割数据标注

详见文档语义分割数据标注

（三）使用paddlex提供的工具将labelme标注的数据转转换成VOC格式的数据

LabelMe标注后的数据还需要进行转换为PascalVOC或MSCOCO格式，才可以用于目标检测任务的训练，创建D:\dataset_voc目录，在python环境中安装paddlex后，使用如下命令即可

paddlex --data_conversion --source labelme --to PascalVOC \ --pics D:\MyDataset\JPEGImages \ --annotations D:\MyDataset\Annotations \ --save_dir D:\dataset_voc

详细用法，参考官方文档

（四）数据切分

目标检测
使用paddlex命令即可将数据集随机划分成70%训练集，20%验证集和10%测试集:

paddlex --split_dataset --format VOC --dataset_dir D:\MyDataset --val_value 0.2 --test_value 0.1

执行上面命令行，会在D:\MyDataset下生成labels.txt, train_list.txt, val_list.txt和test_list.txt，分别存储类别信息，训练样本列表，验证样本列表，测试样本列表
详细用法，参考官方文档

（五）数据加载

这里介绍的是PascalVOC格式的检测数据集的读取,参考代码在后面的完整代码中，MSCOCO格式的检测数据集与语义分割任务数据集的读取，参考官方文档

（六）数据增强

参考官方文档

（七）模型导入

paddlex.det中的模型

# detection YOLOv3 = cv.models.YOLOv3 FasterRCNN = cv.models.FasterRCNN PPYOLO = cv.models.PPYOLO PPYOLOTiny = cv.models.PPYOLOTiny PPYOLOv2 = cv.models.PPYOLOv2 # instance segmentation MaskRCNN = cv.models.MaskRCNN

paddlex.det中的模型

UNet = cv.models.UNet DeepLabV3P = cv.models.DeepLabV3P FastSCNN = cv.models.FastSCNN HRNet = cv.models.HRNet BiSeNetV2 = cv.models.BiSeNetV2

paddlex.cls中的模型

ResNet18 = cv.models.ResNet18 ResNet34 = cv.models.ResNet34 ResNet50 = cv.models.ResNet50 ResNet101 = cv.models.ResNet101 ResNet152 = cv.models.ResNet152 ResNet18_vd = cv.models.ResNet18_vd ResNet34_vd = cv.models.ResNet34_vd ResNet50_vd = cv.models.ResNet50_vd ResNet50_vd_ssld = cv.models.ResNet50_vd_ssld ResNet101_vd = cv.models.ResNet101_vd ResNet101_vd_ssld = cv.models.ResNet101_vd_ssld ResNet152_vd = cv.models.ResNet152_vd ResNet200_vd = cv.models.ResNet200_vd MobileNetV1 = cv.models.MobileNetV1 MobileNetV2 = cv.models.MobileNetV2 MobileNetV3_small = cv.models.MobileNetV3_small MobileNetV3_small_ssld = cv.models.MobileNetV3_small_ssld MobileNetV3_large = cv.models.MobileNetV3_large MobileNetV3_large_ssld = cv.models.MobileNetV3_large_ssld AlexNet = cv.models.AlexNet DarkNet53 = cv.models.DarkNet53 DenseNet121 = cv.models.DenseNet121 DenseNet161 = cv.models.DenseNet161 DenseNet169 = cv.models.DenseNet169 DenseNet201 = cv.models.DenseNet201 DenseNet264 = cv.models.DenseNet264 HRNet_W18_C = cv.models.HRNet_W18_C HRNet_W30_C = cv.models.HRNet_W30_C HRNet_W32_C = cv.models.HRNet_W32_C HRNet_W40_C = cv.models.HRNet_W40_C HRNet_W44_C = cv.models.HRNet_W44_C HRNet_W48_C = cv.models.HRNet_W48_C HRNet_W64_C = cv.models.HRNet_W64_C Xception41 = cv.models.Xception41 Xception65 = cv.models.Xception65 Xception71 = cv.models.Xception71 ShuffleNetV2 = cv.models.ShuffleNetV2 ShuffleNetV2_swish = cv.models.ShuffleNetV2_swish

下面是各类模型的官方文档，后面完整代码中，实例代码
图像分类模型API
目标检测模型API
实例分割模型API
图像分割模型API
模型加载API

（八）模型训练与参数调整

模型训练
训练参数调整

（九）完整代码

import paddlex as pdx from paddlex import transforms as T #数据增强 train_transforms = T.Compose([ T.MixupImage(mixup_epoch=-1), T.RandomDistort(), T.RandomExpand(im_padding_value=[123.675, 116.28, 103.53]), T.RandomCrop(), T.RandomHorizontalFlip(), T.BatchRandomResize( target_sizes=[192, 224, 256, 288, 320, 352, 384, 416, 448, 480, 512], interp='RANDOM'), T.Normalize( mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]) ]) eval_transforms = T.Compose([ T.Resize( target_size=320, interp='CUBIC'), T.Normalize( mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]) ]) #数据导入 train_dataset = pdx.datasets.VOCDetection( data_dir='/home/libufan/桌面/catDog/voc', file_list='/home/libufan/桌面/catDog/voc/train_list.txt', label_list='/home/libufan/桌面/catDog/voc/labels.txt', transforms=train_transforms, shuffle=True) eval_dataset = pdx.datasets.VOCDetection( data_dir='/home/libufan/桌面/catDog/voc', file_list='/home/libufan/桌面/catDog/voc/val_list.txt', label_list='/home/libufan/桌面/catDog/voc/labels.txt', transforms=eval_transforms) #开始训练 num_classes = len(train_dataset.labels) model = pdx.det.PPYOLOTiny(num_classes=num_classes) model.train( num_epochs=100, train_dataset=train_dataset, train_batch_size=1, eval_dataset=eval_dataset, pretrain_weights='COCO', learning_rate=0.005, warmup_steps=1000, warmup_start_lr=0.0, lr_decay_epochs=[130, 540], lr_decay_gamma=.5, save_interval_epochs=20, save_dir='output/ppyolotiny', use_vdl=True) #使用模型 model = pdx.load_model('output/ppyolotiny/best_model') image_name = 'insect_det/JPEGImages/0217.jpg' result = model.predict(image_name) pdx.det.visualize(image_name, result, threshold=0.5, save_dir='./output/ppyolotiny') '''

推荐阅读

utf-8
Python 爬虫基础教程及代码实例

根据最新发布的《互联网人才趋势报告》，尽管大量IT从业者已转向Python开发，但随着人工智能和大数据领域的迅猛发展，仍存在巨大的人才缺口。本文将详细介绍如何使用Python编写一个简单的爬虫程序，并提供完整的代码示例。 ... [详细]

蜡笔小新 2024-12-26 10:42:40
request
Python爬虫实战：豆瓣电影Top250数据抓取

本文详细介绍了如何使用Python编写爬虫程序，从豆瓣电影Top250页面抓取电影信息。文章涵盖了从基础的网页请求到处理反爬虫机制，再到多页数据抓取的全过程，并提供了完整的代码示例。 ... [详细]

蜡笔小新 2024-12-27 16:55:07
shell
360SRC安全应急响应：从漏洞提交到修复的全过程

本文详细介绍了360SRC平台处理一起关键安全事件的过程，涵盖从漏洞提交、验证、排查到最终修复的各个环节。通过这一案例，展示了360在安全应急响应方面的专业能力和严谨态度。 ... [详细]

蜡笔小新 2024-12-27 11:10:05
io
编写有趣的VBScript恶作剧脚本

本文将介绍如何编写一些有趣的VBScript脚本，这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例，帮助您了解VBScript的基本语法和功能。 ... [详细]

蜡笔小新 2024-12-28 09:46:23
io
Installing the MongoDB PHP Driver on XAMPP for macOS

This guide provides a comprehensive step-by-step approach to successfully installing the MongoDB PHP driver on XAMPP for macOS, ensuring a smooth and efficient setup process. ... [详细]

蜡笔小新 2024-12-27 19:58:25
io
Dockerfile 编写与 Docker 网络配置详解

本文详细介绍了 Dockerfile 的编写方法及其在网络配置中的应用，涵盖基础指令、镜像构建与发布流程，并深入探讨了 Docker 的默认网络、容器互联及自定义网络的实现。 ... [详细]

蜡笔小新 2024-12-27 17:31:41
go
如何在PHPcms网站中添加广告

本文详细介绍了在PHPcms网站后台添加广告的方法，涵盖多种常见的广告形式，如百度广告和Google广告，并提供了相关设置的步骤。同时，文章还探讨了优化网站流量的SEO策略。 ... [详细]

蜡笔小新 2024-12-27 17:13:07
go
解决Linux系统中pygraphviz安装问题

本文探讨了在Linux环境下安装pygraphviz时遇到的常见问题，并提供了详细的解决方案和最佳实践。 ... [详细]

蜡笔小新 2024-12-27 16:44:26
io
DNN Community 和 Professional 版本的主要差异

本文详细解析了 DotNetNuke (DNN) 的两种主要版本：Community 和 Professional。通过对比两者的功能和附加组件，帮助用户选择最适合其需求的版本。 ... [详细]

蜡笔小新 2024-12-27 13:14:08
io
Python自动化处理：从Word文档提取内容并生成带水印的PDF

本文介绍如何利用Python实现从特定网站下载Word文档，去除水印并添加自定义水印，最终将文档转换为PDF格式。该方法适用于批量处理和自动化需求。 ... [详细]

蜡笔小新 2024-12-27 13:10:20
io
Linux 网卡绑定的七种工作模式详解

本文深入探讨了Linux系统中网卡绑定（bonding）的七种工作模式。网卡绑定技术通过将多个物理网卡组合成一个逻辑网卡，实现网络冗余、带宽聚合和负载均衡，在生产环境中广泛应用。文章详细介绍了每种模式的特点、适用场景及配置方法。 ... [详细]

蜡笔小新 2024-12-27 10:18:13
go
离线环境下的Python及其第三方库安装指南

在项目开发中，有时会遇到电脑只能连接内网或完全无法联网的情况。本文将详细介绍如何在这种环境下安装Python及其所需的第三方库，确保开发工作的顺利进行。 ... [详细]

蜡笔小新 2024-12-26 19:51:48
io
CUGB图论专题：排水系统中的最大流问题 - EK与Dinic算法解析

本题探讨如何通过最大流算法解决农场排水系统的设计问题。题目要求计算从水源点到汇合点的最大水流速率，使用经典的EK（Edmonds-Karp）和Dinic算法进行求解。 ... [详细]

蜡笔小新 2024-12-25 17:47:23
io
PHP 编程疑难解析与知识点汇总

本文详细解答了 PHP 编程中的常见问题，并提供了丰富的代码示例和解决方案，帮助开发者更好地理解和应用 PHP 知识。 ... [详细]

蜡笔小新 2024-12-28 12:22:34
audio
脑机接口：连接未来的桥梁

脑机接口（BCI）技术正逐步将科幻变为现实，从帮助听障人士恢复听力到使瘫痪者重新站立，甚至可能将多年的学习过程压缩至瞬间。本文探讨了这一前沿技术的现状、挑战及其未来前景。 ... [详细]

蜡笔小新 2024-12-24 23:49:49

gengjiang3_946

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章