热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

开源KerasFasterRCNN模型介绍及代码结构解析

本文介绍了开源KerasFasterRCNN模型的环境需求和代码结构,包括FasterRCNN源码解析、RPN与classifier定义、data_generators.py文件的功能以及损失计算。同时提供了该模型的开源地址和安装所需的库。

开源Keras Faster RCNN 模型介绍

  • 1. 环境需求
  • 2. keras Faster RCNN代码结构
  • 3. FaterRCNN源码解析
  • 4. RPN 与 classifier定义
  • 5. data_generators.py:传递图像参数,增广配置参数,是否进行图像增广
  • 6. 损失计算 losses.py

开源Keras Faster RCNN 模型地址:https://github.com/jinfagang/keras_frcnn

1. 环境需求
  • 1、由于该源代码由keras单独库编写所以需要下载keras,必须是2.0.3版本

pip install keras==2.0.3

  • 2、该源码读取图片以及处理图片标记图片工具使用opecv需要安装

pip install opencv-python

2. keras Faster RCNN代码结构

源码组成结构:

在这里插入图片描述

3. FaterRCNN源码解析
  • detector:FasterRCNNDetector目标检测器代码

img_input = Input(shape=input_shape_img)roi_input = Input(shape=(None, 4))# define the base network (resnet here, can be VGG, Inception, etc)shared_layers = nn.nn_base(img_input, trainable=True)# define the RPN, built on the base layersnum_anchors = len(cfg.anchor_box_scales) * len(cfg.anchor_box_ratios)rpn = nn.rpn(shared_layers, num_anchors)classifier = nn.classifier(shared_layers, roi_input, cfg.num_rois, nb_classes=len(classes_count), trainable=True)model_rpn = Model(img_input, rpn[:2])model_classifier = Model([img_input, roi_input], classifier)# this is a model that holds both the RPN and the classifier, used to load/save weights for the modelsmodel_all = Model([img_input, roi_input], rpn[:2] + classifier)try:print('loading weights from {}'.format(cfg.base_net_weights))model_rpn.load_weights(cfg.model_path, by_name=True)model_classifier.load_weights(cfg.model_path, by_name=True)except Exception as e:print(e)print('Could not load pretrained model weights. Weights can be found in the keras application folder ''https://github.com/fchollet/keras/tree/master/keras/applications')optimizer = Adam(lr=1e-5)optimizer_classifier = Adam(lr=1e-5)model_rpn.compile(optimizer=optimizer,loss=[losses_fn.rpn_loss_cls(num_anchors), losses_fn.rpn_loss_regr(num_anchors)])model_classifier.compile(optimizer=optimizer_classifier,loss=[losses_fn.class_loss_cls, losses_fn.class_loss_regr(len(classes_count) - 1)],metrics={'dense_class_{}'.format(len(classes_count)): 'accuracy'})model_all.compile(optimizer='sgd', loss='mae')

4. RPN 与 classifier定义

  • RPN结构

def rpn(base_layers, num_anchors):x = Convolution2D(512, (3, 3), padding='same', activation='relu', kernel_initializer='normal', name='rpn_conv1')(base_layers)x_class = Convolution2D(num_anchors, (1, 1), activation='sigmoid', kernel_initializer='uniform',name='rpn_out_class')(x)x_regr = Convolution2D(num_anchors * 4, (1, 1), activation='linear', kernel_initializer='zero',name='rpn_out_regress')(x)return [x_class, x_regr, base_layers]

  • classifier结构

def classifier(base_layers, input_rois, num_rois, nb_classes=21, trainable=False):# compile times on theano tend to be very high, so we use smaller ROI pooling regions to workaroundif K.backend() == 'tensorflow':pooling_regions = 14input_shape = (num_rois, 14, 14, 1024)elif K.backend() == 'theano':pooling_regions = 7input_shape = (num_rois, 1024, 7, 7)# ROI pooling计算定义out_roi_pool = RoiPoolingConv(pooling_regions, num_rois)([base_layers, input_rois])out = classifier_layers(out_roi_pool, input_shape=input_shape, trainable=True)out = TimeDistributed(Flatten())(out)# 分类out_class = TimeDistributed(Dense(nb_classes, activation='softmax', kernel_initializer='zero'),name='dense_class_{}'.format(nb_classes))(out)# note: no regression target for bg class# 回归out_regr = TimeDistributed(Dense(4 * (nb_classes - 1), activation='linear', kernel_initializer='zero'),name='dense_regress_{}'.format(nb_classes))(out)return [out_class, out_regr]

5. data_generators.py:传递图像参数,增广配置参数,是否进行图像增广

  • IoU计算:

from __future__ import absolute_import
import numpy as np
import cv2
import random
import copy
from . import data_augment
import threading
import itertools#并集
def union(au, bu, area_intersection):area_a = (au[2] - au[0]) * (au[3] - au[1])area_b = (bu[2] - bu[0]) * (bu[3] - bu[1])area_union = area_a + area_b - area_intersectionreturn area_union#交集
def intersection(ai, bi):x &#61; max(ai[0], bi[0])y &#61; max(ai[1], bi[1])w &#61; min(ai[2], bi[2]) - xh &#61; min(ai[3], bi[3]) - yif w < 0 or h < 0:return 0return w*h#交并比
def iou(a, b):# a and b should be (x1,y1,x2,y2)if a[0] >&#61; a[2] or a[1] >&#61; a[3] or b[0] >&#61; b[2] or b[1] >&#61; b[3]:return 0.0area_i &#61; intersection(a, b)area_u &#61; union(a, b, area_i)return float(area_i) / float(area_u &#43; 1e-6)

6. 损失计算 losses.py

  • rpn的损失回归和分类

def rpn_loss_regr(num_anchors):def rpn_loss_regr_fixed_num(y_true, y_pred):if K.image_dim_ordering() &#61;&#61; &#39;th&#39;:x &#61; y_true[:, 4 * num_anchors:, :, :] - y_predx_abs &#61; K.abs(x)x_bool &#61; K.less_equal(x_abs, 1.0)return lambda_rpn_regr * K.sum(y_true[:, :4 * num_anchors, :, :] * (x_bool * (0.5 * x * x) &#43; (1 - x_bool) * (x_abs - 0.5))) / K.sum(epsilon &#43; y_true[:, :4 * num_anchors, :, :])else:x &#61; y_true[:, :, :, 4 * num_anchors:] - y_predx_abs &#61; K.abs(x)x_bool &#61; K.cast(K.less_equal(x_abs, 1.0), tf.float32)return lambda_rpn_regr * K.sum(y_true[:, :, :, :4 * num_anchors] * (x_bool * (0.5 * x * x) &#43; (1 - x_bool) * (x_abs - 0.5))) / K.sum(epsilon &#43; y_true[:, :, :, :4 * num_anchors])return rpn_loss_regr_fixed_numdef rpn_loss_cls(num_anchors):def rpn_loss_cls_fixed_num(y_true, y_pred):if K.image_dim_ordering() &#61;&#61; &#39;tf&#39;:return lambda_rpn_class * K.sum(y_true[:, :, :, :num_anchors] * K.binary_crossentropy(y_pred[:, :, :, :], y_true[:, :, :, num_anchors:])) / K.sum(epsilon &#43; y_true[:, :, :, :num_anchors])else:return lambda_rpn_class * K.sum(y_true[:, :num_anchors, :, :] * K.binary_crossentropy(y_pred[:, :, :, :], y_true[:, num_anchors:, :, :])) / K.sum(epsilon &#43; y_true[:, :num_anchors, :, :])return rpn_loss_cls_fixed_num

  • fastrcnn的分类和回归

def class_loss_regr(num_classes):def class_loss_regr_fixed_num(y_true, y_pred):x &#61; y_true[:, :, 4*num_classes:] - y_predx_abs &#61; K.abs(x)x_bool &#61; K.cast(K.less_equal(x_abs, 1.0), &#39;float32&#39;)return lambda_cls_regr * K.sum(y_true[:, :, :4*num_classes] * (x_bool * (0.5 * x * x) &#43; (1 - x_bool) * (x_abs - 0.5))) / K.sum(epsilon &#43; y_true[:, :, :4*num_classes])return class_loss_regr_fixed_numdef class_loss_cls(y_true, y_pred):return lambda_cls_class * K.mean(categorical_crossentropy(y_true[0, :, :], y_pred[0, :, :]))

加油!

感谢!

努力!


推荐阅读
  • 根据最新发布的《互联网人才趋势报告》,尽管大量IT从业者已转向Python开发,但随着人工智能和大数据领域的迅猛发展,仍存在巨大的人才缺口。本文将详细介绍如何使用Python编写一个简单的爬虫程序,并提供完整的代码示例。 ... [详细]
  • 本文详细介绍如何使用Python进行配置文件的读写操作,涵盖常见的配置文件格式(如INI、JSON、TOML和YAML),并提供具体的代码示例。 ... [详细]
  • 本文介绍了在安装或运行 Python 项目时遇到的 'ModuleNotFoundError: No module named setuptools_rust' 错误,并提供了解决方案。 ... [详细]
  • 本文详细介绍了如何使用Python编写爬虫程序,从豆瓣电影Top250页面抓取电影信息。文章涵盖了从基础的网页请求到处理反爬虫机制,再到多页数据抓取的全过程,并提供了完整的代码示例。 ... [详细]
  • DNN Community 和 Professional 版本的主要差异
    本文详细解析了 DotNetNuke (DNN) 的两种主要版本:Community 和 Professional。通过对比两者的功能和附加组件,帮助用户选择最适合其需求的版本。 ... [详细]
  • 离线环境下的Python及其第三方库安装指南
    在项目开发中,有时会遇到电脑只能连接内网或完全无法联网的情况。本文将详细介绍如何在这种环境下安装Python及其所需的第三方库,确保开发工作的顺利进行。 ... [详细]
  • 本文介绍了在Windows环境下使用pydoc工具的方法,并详细解释了如何通过命令行和浏览器查看Python内置函数的文档。此外,还提供了关于raw_input和open函数的具体用法和功能说明。 ... [详细]
  • 使用Vultr云服务器和Namesilo域名搭建个人网站
    本文详细介绍了如何通过Vultr云服务器和Namesilo域名搭建一个功能齐全的个人网站,包括购买、配置服务器以及绑定域名的具体步骤。文章还提供了详细的命令行操作指南,帮助读者顺利完成建站过程。 ... [详细]
  • 本文介绍如何在现有网络中部署基于Linux系统的透明防火墙(网桥模式),以实现灵活的时间段控制、流量限制等功能。通过详细的步骤和配置说明,确保内部网络的安全性和稳定性。 ... [详细]
  • 在Python开发过程中,随着项目数量的增加,不同项目依赖于不同版本的库,容易引发依赖冲突。为了避免这些问题,并保持开发环境的整洁,可以使用Virtualenv和Virtualenvwrapper来创建和管理多个隔离的Python虚拟环境。 ... [详细]
  • Python第三方库安装的多种途径及注意事项
    本文详细介绍了Python第三方库的几种常见安装方法,包括使用pip命令、集成开发环境(如Anaconda)以及手动文件安装,并提供了每种方法的具体操作步骤和适用场景。 ... [详细]
  • 本文详细记录了在银河麒麟操作系统和龙芯架构上使用 Qt 5.15.2 进行项目打包时遇到的问题及解决方案,特别关注于 linuxdeployqt 工具的应用。 ... [详细]
  • 本文详细介绍了Python编程语言的学习路径,涵盖基础语法、常用组件、开发工具、数据库管理、Web服务开发、大数据分析、人工智能、爬虫开发及办公自动化等多个方向。通过系统化的学习计划,帮助初学者快速掌握Python的核心技能。 ... [详细]
  • 在学习网页爬虫时,使用Selenium进行自动化操作。初次安装selenium模块后,第二天运行代码时遇到了ImportError:无法从'selenium'导入名称'webdriver'。本文将详细解释该问题的原因及解决方案。 ... [详细]
  • Python 异步编程:ASGI 服务器与框架详解
    自 Python 3.5 引入 async/await 语法以来,异步编程迅速崛起,吸引了大量开发者的关注。本文将深入探讨 ASGI(异步服务器网关接口)及其在现代 Python Web 开发中的应用,介绍主流的 ASGI 服务器和框架。 ... [详细]
author-avatar
手机用户2502853923
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有