Labelme与FastDeploy相结合，辅助分割标注

作者：高桥惜员_136 | 来源：互联网 | 2023-07-07 08:40

1.项目背景大家可能遇到这样的情况(可能只有我遇到)。已经有100个已经标注好的分割数据，也训练好一个模型。但是突然觉得样本数量不够，想增加到500个

1.项目背景

大家可能遇到这样的情况(可能只有我遇到)。已经有100个已经标注好的分割数据&＃xff0c;也训练好一个模型。但是突然觉得样本数量不够&＃xff0c;想增加到500个。但是如果完全手动标注500个&＃xff0c;估计会很累。然后现在你已经训练好了一个模型&＃xff0c;能不能利用这个训练好的模型对500个数据进行推理&＃xff0c;然后对结果进行精调。但是一般推理结果mask都是一个数组或者图片&＃xff0c;不好对其进行标注微调。

现在想到一个方法就是&＃xff1a;使用FastDeploy高效推理工具(在cup下推理都好快),加载训练好的模型&＃xff0c;得到预测的mask结果&＃xff0c;然后转换成json图片&＃xff0c;再用labelme进行读取&＃xff0c;进行手动微调。把推理这部分代码写入labelme中&＃xff0c;增加一些按钮&＃xff0c;就有如下的工具。

魔改的Labelme的Github地址:https://github.com/richarddddd198/Labelme-auto-seg

方法使用如下

2.FastDeploy

FastDeploy是一款全场景、易用灵活、极致高效的AI推理部署工具。提供开箱即用的云边端部署体验, 支持超过150&＃43; Text, Vision, Speech和跨模态模型&＃xff0c;并实现端到端的推理性能优化。包括图像分类、物体检测、图像分割、人脸检测、人脸识别、关键点检测、抠图、OCR、NLP、TTS等任务&＃xff0c;满足开发者多场景、多硬件、多平台的产业部署需求。

Github仓库地址&＃xff1a;https://github.com/PaddlePaddle/FastDeploy

#clone paddleseg套件&＃xff0c;训练一个语义分割模型 !git clone https://gitee.com/paddlepaddle/PaddleSeg.git

#安装paddleseg 和fastdeploy !pip install paddleseg fastdeploy-python -f https://www.paddlepaddle.org.cn/whl/fastdeploy.html

3.数据

任务类型&＃xff1a;语义分割

数据格式&＃xff1a;2D jpg

分割目标&＃xff1a;头部磁共振的胼胝体&＃xff0c;

分割类别&＃xff1a;1

样本数量&＃xff1a;120张

#解压数据 !unzip -o /home/aistudio/data/data91411/callosum.zip -d /home/aistudio/work

# 生成文件列表文件import os import numpy as np DATA_ROOT_DIR &＃61; &＃39;/home/aistudio/work/callosum&＃39;def make_list():img_list &＃61; [img for img in os.listdir(os.path.join(DATA_ROOT_DIR, &＃39;origin&＃39;))]data_path_list &＃61; []for image_id in img_list:image_path &＃61; os.path.join(DATA_ROOT_DIR, &＃39;origin&＃39;,image_id)label_path &＃61; os.path.join(DATA_ROOT_DIR, &＃39;mask&＃39;,image_id.split(&＃39;.&＃39;)[0]&＃43;&＃39;.png&＃39;)data_path_list.append((image_path, label_path))np.random.seed(5)np.random.shuffle(data_path_list)total_len &＃61; len(data_path_list)train_data_len &＃61; int(total_len*0.8)train_data &＃61; data_path_list[0 : train_data_len]val_data &＃61; data_path_list[train_data_len : ]with open(os.path.join(DATA_ROOT_DIR, &＃39;train_list.txt&＃39;), "w") as f:for image, label in train_data:f.write(f"{image} {label}\n")with open(os.path.join(DATA_ROOT_DIR, &＃39;val_list.txt&＃39;), "w") as f:for image, label in val_data:f.write(f"{image} {label}\n")if __name__ &＃61;&＃61; &＃39;__main__&＃39;:make_list()

4.配置训练文件并开始训练

batch_size: 6 iters: 5000train_dataset:type: Datasetdataset_root: /home/aistudio/train_path: /home/aistudio/work/callosum/train_list.txtnum_classes: 2transforms: - type: RandomHorizontalFlip- type: RandomRotationmax_rotation: 15- type: RandomDistortbrightness_range: 0.2contrast_range: 0.2saturation_range: 0.2- type: Normalize- type: Resizetarget_size: [256, 256]mode: trainval_dataset:type: Datasetdataset_root: /home/aistudio/val_path: /home/aistudio/work/callosum/val_list.txtnum_classes: 2transforms:- type: Resizetarget_size: [256, 256]- type: Normalizemode: valoptimizer:type: sgdmomentum: 0.9weight_decay: 4.0e-5lr_scheduler:type: PolynomialDecaylearning_rate: 0.02end_lr: 0power: 0.9loss:types:- type: CrossEntropyLosscoef: [1]model:type: UNetnum_classes: 2use_deconv: Falsepretrained: Null

#训练 %cd ~/PaddleSeg/ !python train.py --config /home/aistudio/configcallosum.yml --do_eval --use_vdl --save_interval 48 --save_dir output_callosum

/home/aistudio/PaddleSeg

#验证 !python tools/val.py \--config /home/aistudio/configcallosum.yml \--model_path output_callosum/best_model/model.pdparams#5000轮后分割精度如下 """ 2022-12-03 09:44:01 [INFO] [EVAL] #Images: 24 mIoU: 0.9327 Acc: 0.9983 Kappa: 0.9280 Dice: 0.9640 2022-12-03 09:44:01 [INFO] [EVAL] Class IoU: [0.9983 0.8671] 2022-12-03 09:44:01 [INFO] [EVAL] Class Precision: [0.9989 0.9462] 2022-12-03 09:44:01 [INFO] [EVAL] Class Recall: [0.9994 0.9121] """

#导出模型&＃xff0c;好让FastDeploy加载推理 #--input_shape 的 256 256 就是训练是图片出入模型的尺寸。 !python tools/export.py --config /home/aistudio/configcallosum.yml \--model_path output_callosum/best_model/model.pdparams \--save_dir output_callosum/inference_model_callosum \--input_shape 1 3 256 256

W1203 09:45:02.714906 6309 gpu_resources.cc:61] Please NOTE: device: 0, GPU Compute Capability: 7.0, Driver API Version: 11.2, Runtime API Version: 11.2 W1203 09:45:02.719321 6309 gpu_resources.cc:91] device: 0, cuDNN Version: 8.2. 2022-12-03 09:45:04 [INFO] Loaded trained params of model successfully. 2022-12-03 09:45:06 [INFO] The inference model is saved in output_callosum/inference_model_callosum

5.使用fastdeploy加载模型推理

1.先用vision.segmentation.PaddleSegModel加载刚才Paddleseg导出训练好的模型

2.使用model.predict进行推理。

3.result.label_map得到对应的预测值&＃xff0c;reshape与输入图片尺寸一致即可得到预测的mask

import numpy as np import cv2 import fastdeploy.vision as vision import matplotlib.pyplot as plt model &＃61; vision.segmentation.PaddleSegModel(&＃39;/home/aistudio/PaddleSeg/output_callosum/inference_model_callosum/model.pdmodel&＃39;,&＃39;/home/aistudio/PaddleSeg/output_callosum/inference_model_callosum/model.pdiparams&＃39;,&＃39;/home/aistudio/PaddleSeg/output_callosum/inference_model_callosum/deploy.yaml&＃39;)im &＃61; cv2.imread("/home/aistudio/work/callosum/origin/176.jpg") result &＃61; model.predict(im.copy()) mask &＃61; np.array(result.label_map).reshape(256,256).astype(np.uint8) plt.imshow(mask,&＃39;gray&＃39;) plt.show()

[INFO] fastdeploy/vision/common/processors/transform.cc(93)::FuseNormalizeHWC2CHW Normalize and HWC2CHW are fused to NormalizeAndPermute in preprocessing pipeline. [INFO] fastdeploy/vision/common/processors/transform.cc(159)::FuseNormalizeColorConvert BGR2RGB and NormalizeAndPermute are fused to NormalizeAndPermute with swap_rb&＃61;1 [INFO] fastdeploy/backends/openvino/ov_backend.cc(199)::InitFromPaddle Compile OpenVINO model on device_name:CPU. [INFO] fastdeploy/runtime.cc(532)::Init Runtime initialized with Backend::OPENVINO in Device::CPU.

ce::CPU.

在这里插入图片描述

6.把mask图转换成json文件

对预测的mask 转换成labelme格式的json文件&＃xff0c;让labelme可以识别。

下图是labelme读取重新生成的json文件。

import base64 import os import json# 图片转换成base64 def image_to_base64(path):with open(path, &＃39;rb&＃39;) as img:b64encode &＃61; base64.b64encode(img.read())s &＃61; b64encode.decode()b64_encode &＃61; &＃39;data:image/jpeg;base64,%s&＃39; % sreturn b64_encodedef get_points(contour,isRemoveSamlleTarget&＃61;True):"""对轮廓点做适当的处理&＃xff0c;例如点太小的目标去掉&＃xff0c;或者点太多的&＃xff0c;间隔取点"""num &＃61; len(contour[:, 0, 0]) if isRemoveSamlleTarget:if num < 10: #可以适当去除小目标return contour[:, 0], 0if num > 200: #点太多&＃xff0c;可以适当减少点hundred &＃61; num // 30 # 步长tem &＃61; contour[:, 0][::hundred]return tem, 1else:return contour[:, 0], 1def generate_json(name, h, w, shapes,imageData):#按格式要求生成字典&＃xff0c;再换成jsondict &＃61; {}dict["version"] &＃61; "5.1.0"dict["flags"] &＃61; {}dict["shapes"] &＃61; shapesdict["imagePath"] &＃61; namedict["imageData"] &＃61; imageDatadict["imageHeight"] &＃61; hdict["imageWidth"] &＃61; wreturn json.dumps(dict, ensure_ascii&＃61;False,indent&＃61;4)def generateJosn(img_path,mask,label_name):"""对mask找到轮廓&＃xff0c;生成坐标点"""img_base &＃61; os.path.basename(img_path)shapeslist &＃61; list()h, w &＃61; mask.shapefor label in label_name.keys():temp &＃61; mask.copy()temp[temp &＃61;&＃61; label] &＃61; 255temp[temp!&＃61; 255] &＃61; 0ret, binary &＃61; cv2.threshold(temp, 0, 255, cv2.THRESH_BINARY ) binary &＃61; np.uint8(binary)contours, heriachy &＃61; cv2.findContours(binary, cv2.RETR_LIST, cv2.CHAIN_APPROX_SIMPLE)for contour in contours:shapesdict &＃61; {"label":&＃39;&＃39;, "points":&＃39;&＃39;, "group_id":"null", "shape_type":"polygon", "flags":{}}points, flag &＃61; get_points(contour)points &＃61; points.tolist()if flag &＃61;&＃61;1:shapesdict[&＃39;label&＃39;] &＃61; label_name[label]shapesdict[&＃39;points&＃39;] &＃61; pointsshapeslist.append(shapesdict)imageData &＃61; image_to_base64(img_path).split(&＃39;,&＃39;)[1]json_content &＃61; generate_json(img_base,h,w,shapeslist,imageData)return json_contentim_path&＃61;"/home/aistudio/work/callosum/origin/176.jpg" label_name &＃61; {1:"callosum"}#这里需要手动新建标签&＃xff0c;让labelme知道对应的类别的标签名 save_jons_path &＃61; os.path.join(&＃39;/home/aistudio/&＃39;,os.path.basename(im_path).split(&＃39;.&＃39;)[0]&＃43;&＃39;.json&＃39;) with open(save_jons_path,&＃39;w&＃39;,encoding&＃61;&＃39;utf8&＃39;) as f:json_content &＃61; generateJosn(im_path,mask,label_name)f.write(json_content)

此文章为搬运
原项目链接

推荐阅读

future
在Win10上利用VS2015构建Caffe2环境

本文详细介绍如何在Windows 10操作系统上通过Visual Studio 2015编译Caffe2深度学习框架的过程。包括必要的软件安装、环境配置以及常见问题的解决方法。 ... [详细]

蜡笔小新 2024-12-15 18:03:52
import
解决 Python 项目中 setuptools_rust 模块缺失问题

本文介绍了在安装或运行 Python 项目时遇到的 'ModuleNotFoundError: No module named setuptools_rust' 错误，并提供了解决方案。 ... [详细]

蜡笔小新 2024-12-27 18:06:18
shell
在Android模拟器上部署TaintDroid的详细步骤

本文详细介绍如何在Android模拟器上安装TaintDroid的过程，包括解决源代码链接失效及服务器文件变动等问题，旨在帮助后续用户避免不必要的麻烦。 ... [详细]

蜡笔小新 2024-12-01 10:41:11
import
PyCharm下载与安装指南

本文详细介绍如何从官方渠道下载并安装PyCharm集成开发环境（IDE），涵盖Windows、macOS和Linux系统，同时提供详细的安装步骤及配置建议。 ... [详细]

蜡笔小新 2024-12-28 09:42:41
import
Python配置文件读写指南

本文详细介绍如何使用Python进行配置文件的读写操作，涵盖常见的配置文件格式（如INI、JSON、TOML和YAML），并提供具体的代码示例。 ... [详细]

蜡笔小新 2024-12-28 08:39:55
install
CentOS7源码编译安装MySQL5.6

2019独角兽企业重金招聘Python工程师标准一、先在cmake官网下个最新的cmake源码包cmake官网：https:www.cmake.org如此时最新 ... [详细]

蜡笔小新 2024-12-27 17:49:56
rsa
Linux环境下Git安装及常见问题解析

本文详细介绍了在Ubuntu系统中安装Git的过程，包括环境检查、软件安装、用户配置以及SSH密钥生成等步骤，并针对安装过程中可能出现的问题提供了有效的解决方案。 ... [详细]

蜡笔小新 2024-12-16 16:50:38
install
EOS开发环境搭建指南

随着EOS主网的成功启动，众多开发者和投资者对其给予了高度关注。本文旨在介绍如何构建EOS开发环境，包括所需的基本硬件配置、软件安装步骤以及常见问题的解决方案。 ... [详细]

蜡笔小新 2024-12-15 17:32:23
post
轻松搭建个性化博客指南

了解如何快速搭建属于自己的个人博客，无需编程基础，适合Mac和Windows用户。通过本文，您将学会使用GitHub Pages和Hexo构建一个完全自主的在线空间。 ... [详细]

蜡笔小新 2024-12-14 03:24:08
post
Python初学者指南：利用requests模块进行高效网络请求

本文将详细介绍Python中一个非常实用的HTTP客户端库——requests模块，它不仅易于使用，而且功能强大，非常适合用于开发网络应用或进行Web数据抓取。 ... [详细]

蜡笔小新 2024-12-07 13:14:51
cmd
C++ STL容器功能概览与异常安全保证

本文详细介绍了C++标准模板库（STL）中各容器的功能特性，并深入探讨了不同容器操作函数的异常安全性。 ... [详细]

蜡笔小新 2024-12-03 15:10:39
post
构建个人技术博客指南

每位开发者都应该拥有一个展示自我技能与分享知识的空间——个人技术博客。本文将指导你如何使用静态网站生成器Hexo结合GitHub Pages搭建这样一个平台。 ... [详细]

蜡笔小新 2024-12-02 16:20:49
shell
深入解析：OpenShift Origin环境下的Kubernetes Spark Operator

本文探讨了如何在OpenShift Origin平台上利用Kubernetes Spark Operator来管理和部署Apache Spark集群与应用。作为Radanalytics.io项目的一部分，这一开源工具为大数据处理提供了强大的支持。 ... [详细]

蜡笔小新 2024-12-19 14:07:35
shell
任务栈？返回栈？启动模式？

任务,栈, ... [详细]

蜡笔小新 2024-12-16 16:58:56
shell
Windows 多进程通信API总结

在一个大型的应用系统中，往往需要多个进程相互协作，进程间通信(IPC,InterProcessCommunication)就显得比较重要了。在Linux系统中，有很多种IPC机制， ... [详细]

蜡笔小新 2024-11-30 13:13:03

高桥惜员_136

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章