resnet50代码_机器学习深度残差网络(ResNet)论文学习(附代码实现)

作者：要做转播达人 | 来源：互联网 | 2023-06-16 12:57

本文结合50层深度残差网络的实现学习何博士的大作-DeepResidualLearningforImageRecognition。理论上，深层网络结构包含了浅层网络结

本文结合50层深度残差网络的实现学习何博士的大作-Deep Residual Learning for Image Recognition。理论上&＃xff0c;深层网络结构包含了浅层网络结构所有可能的解空间&＃xff0c;但是实际网络训练中&＃xff0c;随着网络深度的增加&＃xff0c;网络的准确度出现饱和&＃xff0c;甚至下降的现象&＃xff0c;这个现象可以在下图直观看出来&＃xff1a;56层的网络比20层网络效果还要差。但是这种退化并不是因为过拟合导致的&＃xff0c;因为56层的神经网络的训练误差同样高。

这就是神经网络的退化现象。何博士提出的残差学习的方法解决了解决了神经网络的退化问题&＃xff0c;在深度学习领域取得了巨大的成功。

1.Residual Networks

各个深度的神经网络的结构如下:

50层网络的结构实际上是把34层网络的2个3x3的卷积层替换成3个卷积层&＃xff1a;1x1、3x3、1x1,可以看到50层的网络相对于34层的网络&＃xff0c;效果上有不小的提升。

代码实现

ResNet 50代码实现的网络结构与上图50层的网络架构完全一致。对于深度较深的神经网络&＃xff0c;BN必不可少&＃xff0c;关于BN的介绍和实现可以参考以前的文章。

class ResNet50(object):

def __init__(self, inputs, num_classes&＃61;1000, is_training&＃61;True,

scope&＃61;"resnet50"):

self.inputs &＃61;inputs

self.is_training &＃61; is_training

self.num_classes &＃61; num_classes

with tf.variable_scope(scope):

# construct the model

net &＃61; conv2d(inputs, 64, 7, 2, scope&＃61;"conv1") # -> [batch, 112, 112, 64]

net &＃61; tf.nn.relu(batch_norm(net, is_training&＃61;self.is_training, scope&＃61;"bn1"))

net &＃61; max_pool(net, 3, 2, scope&＃61;"maxpool1") # -> [batch, 56, 56, 64]

net &＃61; self._block(net, 256, 3, init_stride&＃61;1, is_training&＃61;self.is_training,

scope&＃61;"block2") # -> [batch, 56, 56, 256]

net &＃61; self._block(net, 512, 4, is_training&＃61;self.is_training, scope&＃61;"block3")

# -> [batch, 28, 28, 512]

net &＃61; self._block(net, 1024, 6, is_training&＃61;self.is_training, scope&＃61;"block4")

# -> [batch, 14, 14, 1024]

net &＃61; self._block(net, 2048, 3, is_training&＃61;self.is_training, scope&＃61;"block5")

# -> [batch, 7, 7, 2048]

net &＃61; avg_pool(net, 7, scope&＃61;"avgpool5") # -> [batch, 1, 1, 2048]

net &＃61; tf.squeeze(net, [1, 2], name&＃61;"SpatialSqueeze") # -> [batch, 2048]

self.logits &＃61; fc(net, self.num_classes, "fc6") # -> [batch, num_classes]

self.predictions &＃61; tf.nn.softmax(self.logits)

2.Building Block

每个Block中往往包含多个子Block&＃xff0c;每个子Block又有多个卷积层组成。每个Block的第一个子Block的第一个卷积层的stride&＃61;2&＃xff0c;完成Feature Map的下采样的工作。

代码实现

def _block(self, x, n_out, n, init_stride&＃61;2, is_training&＃61;True, scope&＃61;"block"):

with tf.variable_scope(scope):

h_out &＃61; n_out // 4

out &＃61; self._bottleneck(x, h_out, n_out, stride&＃61;init_stride,

is_training&＃61;is_training, scope&＃61;"bottlencek1")

for i in range(1, n):

out &＃61; self._bottleneck(out, h_out, n_out, is_training&＃61;is_training,

scope&＃61;("bottlencek%s" % (i &＃43; 1)))

return out

3. Bottleneck Architectures

在更深层(esNet-50/101/152)的神经网络中为了节省计算耗时&＃xff0c; 作者对神经网络的架构进行了改造&＃xff0c;将原有的两层3x3卷积层改造为三层卷积层&＃xff1a;1x1&＃xff0c;3x3&＃xff0c;1x1。

The three layers are 1×1, 3×3, and 1×1 convolutions, where the 1×1 layers are responsible for reducing and then increasing (restoring)dimensions, leaving the 3×3 layer a bottleneck with smaller input/output dimensions。

代码实现:

x: 是输入数据&＃xff0c;格式为[BatchSize, ImageHeight&＃xff0c;ImageWidth, ChannelNum]&＃xff1b;

h_out: 卷积核个数&＃xff1b;

n_out: Block的输出的卷积核个数&＃xff1b;

stride: 卷积步长&＃xff1b;

is_training: 用于Batch Normalization&＃xff1b;

def _bottleneck(self, x, h_out, n_out, stride&＃61;None, is_training&＃61;True, scope&＃61;"bottleneck"):

""" A residual bottleneck unit"""

n_in &＃61; x.get_shape()[-1]

if stride is None:

stride &＃61; 1 if n_in &＃61;&＃61; n_out else 2

with tf.variable_scope(scope):

h &＃61; conv2d(x, h_out, 1, stride&＃61;stride, scope&＃61;"conv_1")

h &＃61; batch_norm(h, is_training&＃61;is_training, scope&＃61;"bn_1")

h &＃61; tf.nn.relu(h)

h &＃61; conv2d(h, h_out, 3, stride&＃61;1, scope&＃61;"conv_2")

h &＃61; batch_norm(h, is_training&＃61;is_training, scope&＃61;"bn_2")

h &＃61; tf.nn.relu(h)

h &＃61; conv2d(h, n_out, 1, stride&＃61;1, scope&＃61;"conv_3")

h &＃61; batch_norm(h, is_training&＃61;is_training, scope&＃61;"bn_3")

if n_in !&＃61; n_out:

shortcut &＃61; conv2d(x, n_out, 1, stride&＃61;stride, scope&＃61;"conv_4")

shortcut &＃61; batch_norm(shortcut, is_training&＃61;is_training, scope&＃61;"bn_4")

else:

shortcut &＃61; x

return tf.nn.relu(shortcut &＃43; h)

4. Shortcuts

Identity Mapping是深度残差网络的一个核心思想&＃xff0c;深度残差网络中Building Block表达公式如下:

x是Layer Input&＃xff0c; y是未经过Relu激活函数的Layer Output&＃xff0c; 是待学习的残差映射。

上式仅仅能处理F(x, wi)和x维度相同的情况&＃xff0c;当二者维度不同的情况下应该怎么处理呢&＃xff1f;

作者提出了两种处理方式: zero padding shortcut和 projection shortcut。并在实验中构造三种shortcut的方式&＃xff1a;

A) 当数据维度增加时&＃xff0c;采用zero padding进行数据填充&＃xff1b;

B) 当数据维度增加时&＃xff0c;采用projection的方式&＃xff1b;数据维度不变化时&＃xff0c;直接使用恒等映射&＃xff1b;

C) 数据维度增加与否都采用projection的方式&＃xff1b;

三种方式的对比效果如下:

可以看到效果排序如下&＃xff1a; A

5.其它辅助函数的实现

5.1 变量初始化

fc_initializer &＃61; tf.contrib.layers.xavier_initializer

conv2d_initializer &＃61; tf.contrib.layers.xavier_initializer_conv2d

5.2 创建变量的辅助函数

# create weight variable

def create_var(name, shape, initializer, trainable&＃61;True):

return tf.get_variable(name, shape&＃61;shape, dtype&＃61;tf.float32,

initializer&＃61;initializer, trainable&＃61;trainable)

5.3 卷积辅助函数

# conv2d layer

def conv2d(x, num_outputs, kernel_size, stride&＃61;1, scope&＃61;"conv2d"):

num_inputs &＃61; x.get_shape()[-1]

with tf.variable_scope(scope):

kernel &＃61; create_var("kernel

机器学习

深度

io

神经网络

深度学习

4层

架构

object

input

写下你的评论吧 !

吐个槽吧,看都看了

会员登录 | 用户注册

推荐阅读

range
毕业设计：基于机器学习与深度学习的垃圾邮件（短信）分类算法实现

本文详细介绍了如何使用机器学习和深度学习技术对垃圾邮件和短信进行分类。内容涵盖从数据集介绍、预处理、特征提取到模型训练与评估的完整流程，并提供了具体的代码示例和实验结果。 ... [详细]

蜡笔小新   2024-12-25 17:38:50

range
从零构建递归神经网络：仅用NumPy实现

尽管使用TensorFlow和PyTorch等成熟框架可以显著降低实现递归神经网络（RNN）的门槛，但对于初学者来说，理解其底层原理至关重要。本文将引导您使用NumPy从头构建一个用于自然语言处理（NLP）的RNN模型。 ... [详细]

蜡笔小新   2024-12-26 11:29:15

install
如何用GPU服务器运行Python

如何用GPU服务器运行Python-目录前言一、服务器登录1.1下载安装putty1.2putty远程登录 1.3查看GPU、显卡常用命令1.4Linux常用命令二、 ... [详细]

蜡笔小新   2024-12-06 11:54:09

post
PHP 编程疑难解析与知识点汇总

本文详细解答了 PHP 编程中的常见问题，并提供了丰富的代码示例和解决方案，帮助开发者更好地理解和应用 PHP 知识。 ... [详细]

蜡笔小新   2024-12-28 12:22:34

post
卷积神经网络（CNN）基础理论与架构解析

本文介绍了卷积神经网络（CNN）的基本概念、常见结构及其各层的功能。重点讨论了LeNet-5、AlexNet、ZFNet、VGGNet和ResNet等经典模型，并详细解释了输入层、卷积层、激活层、池化层和全连接层的工作原理及优化方法。 ... [详细]

蜡笔小新   2024-12-24 18:58:11

go
优化深度神经网络在低性能硬件上的运行

尽管深度学习带来了广泛的应用前景，其训练通常需要强大的计算资源。然而，并非所有开发者都能负担得起高性能服务器或专用硬件。本文探讨了如何在有限的硬件条件下（如ARM CPU）高效运行深度神经网络，特别是通过选择合适的工具和框架来加速模型推理。 ... [详细]

蜡笔小新   2024-12-24 08:48:32

go
双路径GAN实现侧脸到正面人脸图像的高保真合成

由中科院自动化所、中科院大学及南昌大学联合研究提出了一种新颖的双路径生成对抗网络（TP-GAN），该技术能通过单一侧面照片生成逼真的正面人脸图像，显著提升了不同姿态下的人脸识别效果。 ... [详细]

蜡笔小新   2024-12-20 17:34:05

range
深入浅出TensorFlow数据读写机制

本文详细介绍TensorFlow中的数据读写操作，包括TFRecord文件的创建与读取，以及数据集（dataset）的相关概念和使用方法。 ... [详细]

蜡笔小新   2024-12-19 16:23:17

go
图像标签与以图搜图技术的应用与实践

本文探讨了图像标签的多种分类场景及其在以图搜图技术中的应用，涵盖了从基础理论到实际项目实施的全面解析。 ... [详细]

蜡笔小新   2024-12-07 14:28:06

go
多智能体深度强化学习中的分布式奖励估计

本文探讨了在多智能体系统中应用分布式奖励估计技术，以解决由于环境和代理互动引起的奖励不确定性问题。通过设计多动作分支奖励估计和策略加权奖励聚合方法，本研究旨在提高多智能体强化学习（MARL）的有效性和稳定性。 ... [详细]

蜡笔小新   2024-12-15 17:04:36

go
亚马逊Go：无人零售的创新与挑战

本文探讨了亚马逊Go如何通过技术创新推动零售业的发展，以及面临的市场和隐私挑战。同时，介绍了亚马逊最新的‘刷手支付’技术及其潜在影响。 ... [详细]

蜡笔小新   2024-12-13 11:39:37

import
【度量学习】Siamese Network

基于2-channelnetwork的图片相似度判别一、相关理论本篇博文主要讲解2015年CVPR的一篇关于图像相似度计算的文章：《LearningtoCompar ... [详细]

蜡笔小新   2024-12-12 19:11:33

function
利用Java与Tesseract-OCR实现数字识别

本文深入探讨了如何利用Java语言结合Tesseract-OCR技术来实现图像中的数字识别功能，旨在为开发者提供详细的指导和实践案例。 ... [详细]

蜡笔小新   2024-12-12 10:47:15

function
吴恩达推出TensorFlow实践课程，Python基础即可入门，四个月掌握核心技能

量子位报道，deeplearning.ai最新发布了TensorFlow实践课程，适合希望使用TensorFlow开发AI应用的学习者。该课程涵盖机器学习模型构建、图像识别、自然语言处理及时间序列预测等多个方面。 ... [详细]

蜡笔小新   2024-12-08 17:26:10

c语言
嵌入式工程师秋招实战总结

本文详细记录了作者从7月份的提前批到9、10月份正式批的秋招经历，包括各公司的面试流程、技术问题及HR面的常见问题。通过这次秋招，作者深刻体会到了技术积累和面试准备的重要性。 ... [详细]

蜡笔小新   2024-12-06 12:48:28

要做转播达人

这个家伙很懒，什么也没留下！

Tags | 热门标签

grid

datetime

httpclient

instance

flutter

install

php5

scala

fetch

solr

cSharp

text

javascript

import

php8

eval

post

go

function

bytecode

email

subset

c语言

hashcode

chat

bash

range

tags

iostream

web

RankList | 热门文章

1系统调用存在的意义

2DeepFake疑遭审查，网友：此乃它“干爹”所为

3类样式未应用于<img>

4怎么在CSS中使用伪元素清除浮动

5css的属性使字体上下排列

6HTML转换属性的方法是什么

7图床引用

8LabVIEW动态调用就是个坑！

9蛰伏多年的 HTML5 创业者，终于被送上了风口

10hbuider 集成自己的插件后不能用chrome调试的解决方案

11如何引进外部字体文件。

122019.8.9考试反思

13博客园期刊负责人招聘完满结束 [Allen Lee]

14pv/vv是啥,pv vv区别

15html换行的转义字符是什么?