热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

学习Linux下使用caffe进行模型训练(三)

前言不管是训练过程中,查看网络学习的状态,还是训练结束后,使用模型去执行特定任务,都需要一个可被观察的输出呈现在研究者面前,最好是可视化的图形而非冰冷的数字。因此,本次讲的是通过c

前言

不管是训练过程中,查看网络学习的状态,还是训练结束后,使用模型去执行特定任务,都需要一个可被观察的输出呈现在研究者面前,最好是可视化的图形而非冰冷的数字。因此,本次讲的是通过 caffe 自带的工具(scripts)进行日志的可视化分析与目标检测结果的输出。

前期准备

一、日志可视化

首先要保证之前训练时,在最后增加了 tee logDir/logName.log ,这样才能得到可供分析的日志 (.log)文件(我的日志文件名为 molo-train-2019-03-11-09-50.log)。
然后要保证 caffe_rootdir/tools/extra/ 下存在 parse_log.shextract_seconds.pyplot_training_log.py.example

二、目标检测可视化

本次使用的模型检测脚本也来自 MobileNet-YOLO,通过对其中的 ./examples/ssd/ 中 ssd_detec.py 进行修改,达到调用模型进行目标检测的目的。

操作流程

一、日志可视化

  1. 将 parse_log.sh、extract_seconds.py 和 plot_training_log.py.example 三个文件和 .log 文件放置在同一文件夹下,运行 parse_log.sh 脚本:
    . parse_log.sh molo-train-2019-03-11-09-50.log
    
    即可在当前目录下生成 molo-train-2019-03-11-09-50.log.train 和 molo-train-2019-03-11-09-50.log.test 两个文件,内容如下图所示
    学习 Linux 下使用 caffe 进行模型训练(三)
  2. 将 plot_training_log.py.example 改为 plot_training_log.py,其他的不需要多做修改(因为我在无UI界面的系统进行操作,所以仅仅注释了 plt.show())。然后运行:
    python plot_training_log.py 6 out.png molo-train-2019-03-11-09-50.log
    
    即可得到 out.png 如下。
    学习 Linux 下使用 caffe 进行模型训练(三)
  3. 其中,命令中间的 6 代表要输出的曲线类型,比如 “0” 代表 “验证集正确率-迭代次数”,具体的参数如下:

    0: Test accuracy vs. Iters
    1: Test accuracy vs. Seconds
    2: Test loss vs. Iters
    3: Test loss vs. Seconds
    4: Train learning rate vs. Iters
    5: Train learning rate vs. Seconds
    6: Train loss vs. Iters
    7: Train loss vs. Seconds

二、模型调用可视化流程

对于 Mobile-yolo 的 ssd_detect.py 脚本,设定好 caffe 相关的参数后,输入要测试的图片,即可输出在该图片上绘制出 bounding box 的图片。下面简单介绍一下该脚本。

首先列出使用情况:

python ssd_detect.py \							# 执行检测脚本 
--gpu_id 0 \										# 选择要使用的 GPU 的编号
--labelmap_file labelmap_dir/labelmap.prototxt \	# 选择 labelmap,标注好要检测的类别
--model_def model_dir/deploy.prototxt \				# 用于检测的网络结构下面详细说
--model_weights weight_dir/iter_XXX.caffemodel \	# 训练得到的模型权重文件
--image_resize 608 \								# 和 deploy.prototxt 对应
--image_file test_img_dir/img.JPG					# 用于测试的图片

为了方便起见,比起这种方法,更推荐在脚本中增加一个待测图片文件的循环,将除了待测文件之外的参数确定后,可以执行一次脚本得到多张输出,效率更高一些。

该脚本的运行逻辑是:

  1. 利用所给的前 5 个参数对 caffe 进行初始化;
  2. 将 labelmap 转为 caffe 所使用的数据结构,其他的 caffe 会直接加载;
  3. 读入测试图片,根据输入的权重跑完整个网络,得到多组输出(和网络结构有关,包含阈值判断、NMS等操作);
  4. 把所有数据(4个坐标点、一个置信度、多个类别)中置信度高于阈值的部分取出,按照其坐标点在原图上绘制 bounding box,然后标注上得分最高的类别的分数,完成对所有网络检测出的目标的标注;
  5. 保存标注后的图片以便研发人员观察。

该脚本本身的使用相对简单,最难的部分已经被 caffe 承包了,可以说得上友好了~
由于训练的模型和最终的输出涉及到一点公司机密,这里不方便奉上,于是找了
Jesse_Mx 的博客 中的图片用于展示:
学习 Linux 下使用 caffe 进行模型训练(三)
Ps:实在不喜欢用 PIL 库,我自己使用的时候改成 openCV 了,目的单纯是为了画框更漂亮……

deploy.prototxt 简介

在所有的和网络有关的 prototxt 文件中,除了 train、test 和 solver,还有一个 deploy,这个网络是在 test 文件的基础上进一步精简的,data 层不再需要设定 lmdb 等,只需改成如下部分:

layer {
  name: "data"
  type: "Input"
  top: "data"
  input_param {
    shape {
      dim: 1
      dim: 3
      dim: 608
      dim: 608
    }
  }
}

代表输入图维度为 608×608×3(这也是为什么 ssd_detect.py 需要 resize 参数),其他的都和 test 网络相同。
事实上,deploy.prototxt 更应该看作 train.prototxt 删除训练所需要的部分后,余下的部分,这里展开又可以讲整整一篇,这里引用 不破楼兰终不还的博客,其讲解分析十分细致,十分推荐大家读一下,如果有时间我也自己进行一下整理,就不再这个实践相关更多一点的博客中过多陈述了。

后记

第一次使用 caffe 训练目标检测网络,不论是从损失的下降还是最终的检测效果,都有些不(mo)尽(ming)人(qi)意(miao)。但是俗话说的好,万事开头难,流程跑通之后,通过优化网络结构、筛选数据、调整训练参数等方法进行优化,一定能得到相当不错的检测效果的~


推荐阅读
  • 本文详细介绍了 Dockerfile 的编写方法及其在网络配置中的应用,涵盖基础指令、镜像构建与发布流程,并深入探讨了 Docker 的默认网络、容器互联及自定义网络的实现。 ... [详细]
  • 1.如何在运行状态查看源代码?查看函数的源代码,我们通常会使用IDE来完成。比如在PyCharm中,你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢?当我们想使用一个函 ... [详细]
  • 本文介绍了如何使用JQuery实现省市二级联动和表单验证。首先,通过change事件监听用户选择的省份,并动态加载对应的城市列表。其次,详细讲解了使用Validation插件进行表单验证的方法,包括内置规则、自定义规则及实时验证功能。 ... [详细]
  • Hadoop入门与核心组件详解
    本文详细介绍了Hadoop的基础知识及其核心组件,包括HDFS、MapReduce和YARN。通过本文,读者可以全面了解Hadoop的生态系统及应用场景。 ... [详细]
  • 优化联通光猫DNS服务器设置
    本文详细介绍了如何为联通光猫配置DNS服务器地址,以提高网络解析效率和访问体验。通过智能线路解析功能,域名解析可以根据访问者的IP来源和类型进行差异化处理,从而实现更优的网络性能。 ... [详细]
  • CentOS 7 磁盘与文件系统管理指南
    本文详细介绍了磁盘的基本结构、接口类型、分区管理以及文件系统格式化等内容,并提供了实际操作步骤,帮助读者更好地理解和掌握 CentOS 7 中的磁盘与文件系统管理。 ... [详细]
  • 优化ListView性能
    本文深入探讨了如何通过多种技术手段优化ListView的性能,包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]
  • 本文将介绍如何编写一些有趣的VBScript脚本,这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例,帮助您了解VBScript的基本语法和功能。 ... [详细]
  • 三星W799在2011年的表现堪称经典,以其独特的双屏设计和强大的功能引领了双模手机的潮流。本文详细介绍其配置、功能及锁屏设置。 ... [详细]
  • 本文详细分析了Hive在启动过程中遇到的权限拒绝错误,并提供了多种解决方案,包括调整文件权限、用户组设置以及环境变量配置等。 ... [详细]
  • 从 .NET 转 Java 的自学之路:IO 流基础篇
    本文详细介绍了 Java 中的 IO 流,包括字节流和字符流的基本概念及其操作方式。探讨了如何处理不同类型的文件数据,并结合编码机制确保字符数据的正确读写。同时,文中还涵盖了装饰设计模式的应用,以及多种常见的 IO 操作实例。 ... [详细]
  • 使用Vultr云服务器和Namesilo域名搭建个人网站
    本文详细介绍了如何通过Vultr云服务器和Namesilo域名搭建一个功能齐全的个人网站,包括购买、配置服务器以及绑定域名的具体步骤。文章还提供了详细的命令行操作指南,帮助读者顺利完成建站过程。 ... [详细]
  • 在现代网络环境中,两台计算机之间的文件传输需求日益增长。传统的FTP和SSH方式虽然有效,但其配置复杂、步骤繁琐,难以满足快速且安全的传输需求。本文将介绍一种基于Go语言开发的新一代文件传输工具——Croc,它不仅简化了操作流程,还提供了强大的加密和跨平台支持。 ... [详细]
  • 本文详细介绍了MicroATX(也称Mini ATX)和MATX主板规格,探讨了它们的结构特点、应用场景及对电脑系统成本和性能的影响。同时,文章还涵盖了相关操作系统的实用技巧,如蓝牙设备图标删除、磁盘管理等。 ... [详细]
  • 本文探讨了领域驱动设计(DDD)的核心概念、应用场景及其实现方式,详细介绍了其在企业级软件开发中的优势和挑战。通过对比事务脚本与领域模型,展示了DDD如何提升系统的可维护性和扩展性。 ... [详细]
author-avatar
手机用户2702937647
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有