热门标签 | HotTags
当前位置:  开发笔记 > 前端 > 正文

实例分割和语义分割使用labelme制作的数据集如何转换为voc和coco格式的数据

1.首选使用labelme进行数据集制作,制作完成后,会获取到图片和.json的文件,如下:2.转换数据集为coco或者voc数据集其实

1.首选使用labelme进行数据集制作,制作完成后,会获取到图片和.json的文件,如下:


2.转换数据集为coco或者voc数据集

其实官方已经提供了,转换一个实例的代码,但是没有批量的转换代码,于是网上很多批量转换代码,其实呢,官方作者已经完成了转换代码,大家可以去官网看看:labelme官网,从官网获取两个文件:labelme2coco.py和labelme2voc.py,使用方法,作者有教程,大家研究一下,我这里以转换为voc数据集为例实现一下:

./labelme2voc.py data_annotated data_dataset_voc --labels labels.txt

这里简单介绍一下,data_annotated就是你标注的数据集的目标,就是第一步的包含图片和.json的路径, data_dataset_voc是转换后的路径,这里说明转换结果在本路径下的data_dataset_voc文件下, --labels labels.txt 就是你的标签信息了,

这里提醒一下,制作标签时应该首先把类别确定下来为labels.txt,然后标注时读入这个信息就可以了,如下:

labelme data_annotated --labels labels.txt

转换完成后会在对应的目录出现如下的文件:

这里就说明转换完成了。

 


3.这时你会发现标签图片居然是彩色的,是不是需要转换呢?如果想要黑色的那种如何转换呢?

其实这个问题,网上的人说需要转换,说明他根本不懂,这个彩色的只是伪彩色,显示用的,其实他的信息还是8位,对应的像素值就是类别值,如果我们通过代码就可以观察,大家可以看我的另一篇博客,使用labelme进行图片语义分割数据的标注(如何转换为训练的灰度图,即像素值为类别值), 这里我只是简单的说明了一下,并没有细说,但是发现还是有很多人不懂,我这里仔细的说明一下,其实很简单,但是看一下转换代码就好了,就是对应得labelme2voc.py,这里代码很清晰,可以修改代码生成你们习惯的黑色的那种,下面我们来看看代码:

从图中可以看到保存我们标签的代码是labelme.utils.lblsave(out_png_file, lbl), 那我们进入看看 :

通过上面大家不难看出,其实在伪彩色的情况下,直接使用PIL.Image进行读取数据即可,但是使用opencv无法读取,只能转换为灰度即L模式,这里给大家链接一个他们模式的讲解:model的讲解。


4.总结

其实有时候一件事如果你觉得很麻烦,多数可能是方法错了,这是你需要深入源码全看他是怎么生成的,而不是其他乱七八糟的转换,所以知其然更要知其所以然。

 

 

 

 

 

 

 

 

 

 


推荐阅读
  • [论文笔记] Crowdsourcing Translation: Professional Quality from Non-Professionals (ACL, 2011)
    Time:4hoursTimespan:Apr15–May3,2012OmarZaidan,ChrisCallison-Burch:CrowdsourcingTra ... [详细]
  • 本文详细介绍了如何使用 Yii2 的 GridView 组件在列表页面实现数据的直接编辑功能。通过具体的代码示例和步骤,帮助开发者快速掌握这一实用技巧。 ... [详细]
  • 1.如何在运行状态查看源代码?查看函数的源代码,我们通常会使用IDE来完成。比如在PyCharm中,你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢?当我们想使用一个函 ... [详细]
  • 本文详细介绍了 Dockerfile 的编写方法及其在网络配置中的应用,涵盖基础指令、镜像构建与发布流程,并深入探讨了 Docker 的默认网络、容器互联及自定义网络的实现。 ... [详细]
  • 本文介绍了如何使用JQuery实现省市二级联动和表单验证。首先,通过change事件监听用户选择的省份,并动态加载对应的城市列表。其次,详细讲解了使用Validation插件进行表单验证的方法,包括内置规则、自定义规则及实时验证功能。 ... [详细]
  • Python自动化处理:从Word文档提取内容并生成带水印的PDF
    本文介绍如何利用Python实现从特定网站下载Word文档,去除水印并添加自定义水印,最终将文档转换为PDF格式。该方法适用于批量处理和自动化需求。 ... [详细]
  • 本文介绍如何通过注册表编辑器自定义和优化Windows文件右键菜单,包括删除不需要的菜单项、添加绿色版或非安装版软件以及将特定应用程序(如Sublime Text)添加到右键菜单中。 ... [详细]
  • 如何高效创建和使用字体图标
    在Web和移动开发中,为什么选择字体图标?主要原因是其卓越的性能,可以显著减少HTTP请求并优化页面加载速度。本文详细介绍了从设计到应用的字体图标制作流程,并提供了专业建议。 ... [详细]
  • 本文介绍如何使用 Python 提取和替换 .docx 文件中的图片。.docx 文件本质上是压缩文件,通过解压可以访问其中的图片资源。此外,我们还将探讨使用第三方库 docx 的方法来简化这一过程。 ... [详细]
  • 2023年京东Android面试真题解析与经验分享
    本文由一位拥有6年Android开发经验的工程师撰写,详细解析了京东面试中常见的技术问题。涵盖引用传递、Handler机制、ListView优化、多线程控制及ANR处理等核心知识点。 ... [详细]
  • 网络运维工程师负责确保企业IT基础设施的稳定运行,保障业务连续性和数据安全。他们需要具备多种技能,包括搭建和维护网络环境、监控系统性能、处理突发事件等。本文将探讨网络运维工程师的职业前景及其平均薪酬水平。 ... [详细]
  • 帝国CMS多图上传插件详解及使用指南
    本文介绍了一款用于帝国CMS的多图上传插件,该插件通过Flash技术实现批量图片上传功能,显著提升了多图上传效率。文章详细说明了插件的安装、配置和使用方法。 ... [详细]
  • PHP 5.5.0rc1 发布:深入解析 Zend OPcache
    2013年5月9日,PHP官方发布了PHP 5.5.0rc1和PHP 5.4.15正式版,这两个版本均支持64位环境。本文将详细介绍Zend OPcache的功能及其在Windows环境下的配置与测试。 ... [详细]
  • 本文介绍如何使用Python进行文本处理,包括分词和生成词云图。通过整合多个文本文件、去除停用词并生成词云图,展示文本数据的可视化分析方法。 ... [详细]
  • Composer Registry Manager:PHP的源切换管理工具
    本文介绍了一个用于Composer的源切换管理工具——Composer Registry Manager。该项目旨在简化Composer包源的管理和切换,避免与常见的CRM系统混淆,并提供了详细的安装和使用指南。 ... [详细]
author-avatar
Joql
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有