机器学习算法篇卷积神经网络基础（ConvolutionalNeuralNetwork）

作者：潘PanPanPq | 来源：互联网 | 2023-10-12 19:50

定义：

首先来了解一下深度学习的定义：深度学习是以数据的原始形态作为算法输入，经过算法层层抽象将原始数据逐层抽象为自身任务所需的最终特征表示，最后以特征到任务目标的映射作为结束，从原始数据到最终任务目标，“一条龙服务” 并无夹杂任何人为操作。普通话说就是“省去了人为的特征工程，实现完全封闭。是一种‘端到端’的学习方式”，而传统机器学习的天花板是由特征工程决定的。

卷积神经网路：是一类特殊的人工神经网络，其最主要的特点是卷积运算操作。可以理解为是一种层次模型，其输入是原始数据，如图像、原始音频数据等。其中，不同类型操作在卷积神经网络中一般称作“层”:卷积操作对应“卷积层”，池化操作对应“池化层”。

准备知识：

卷积核：是一个函数，可以看作对某个局部的加权求和；它是对应局部感知，它的原理是在观察某个物体时我们既不能观察每个像素也不能一次观察整体，而是先从局部开始认识，这就对应了卷积。卷积核的大小一般有1x1,3x3和5x5的尺寸。

机器学习算法篇--卷积神经网络基础（Convolutional Neural Network）

卷积步长：每做一个卷积所移动的距离
前馈运算：概括的说就是“预测和推理”，卷积神经网络通过卷积操作、池化操作和**函数映射等一系列操作的层层堆叠，将高层语义信息逐层由原始数据输入层中抽取出来，逐层抽象，这一过程便是“前馈运算”。
反馈运算：“训练和学习”，卷积神经网络的最后一层将其目标任务形式化为目标函数。通过计算预测值与真实值之间的误差或损失（之前的文章讲过的最小二乘法），凭借反向传播算法(BP)将误差或损失由最后一层逐层向前反馈，更新每层参数。
池化：其实也就是把特征图像区域的一部分求个均值或者最大值，用来代表这部分区域。如果是求均值就是mean pooling，求最大值就是max pooling。
**函数：是增加整个网络的表达能力(即非线性)。否则，若干线性操作层的堆叠仍然只能起到线性映射的作用，无法形成复杂的函数。最常用的是sigmoid**函数和ReLU**函数 (目前主流是ReLU，因为ReLU避免了梯度饱和效应的发生)

卷积神经网络工作流程：

这次的准备知识点比较多，因为作者，也就是在下，熟悉的领域就是计算机视觉，图像处理，之前做ios的时候，滤镜，红眼，磨皮等等图片处理的功能都是自己写的，研究过GPUIImage的源码，还做过名片识别的app。虽然迫于生计，工作中遇到图像处理的场景少，但是从2011年到现在从来没有停止对图像处理技术的研究，从去年开始做机器学习的时候就选定计算机视觉为主要方向，让自己的长板更长。

好，收，废话一说就停不下来了，下面来介绍一下卷机神经网络的工作流程：

首先介绍一下卷积神经网络的基本部件:

卷积操作
池化操作
**函数
全连接层
目标函数

整个卷积神经网络通过这些基本部件的 “有机组合”即可实现将原始数据映射到高层语义、进而得到样本预测标记的功能。用一张图片来展示一下通用的深度模型：

对深度模型而言，其输入数据是未经任何人为加工的原始样本形式，后续则是堆叠在输入层上的众多操作层。这些操作层整体可看作一个复杂的函数 fcnn，最终损失函数由数据损失和模型参数的正则化损失共同组成，深度模型的训练过程可以简单抽象为从原始数据向最终目标的直接‘拟合’，而中间的这些部件正起到了将原始数据映射为特征随后在映射为样本标记的作用。

卷积操作：

卷积是一种局部操作，通过一定大小的卷积核作用于局部图像区域获得图像的局部信息。卷积操作中有两个重要的超参数:卷积核大小和卷积步长。

假设输入图像为如图中右侧的 5 × 5 矩阵，其对应的卷积核为一个 3 × 3 的矩阵。同时，假定卷积操作时每做一次卷积，卷积核移动一个像素位置，即卷积步长为1。第一次卷积操作从图像 (0, 0) 像素开始，由卷积核中参数与对应位置图像像素逐位相乘后累加作为一次卷积操作结果，即 1×1+2×0+3×1+6×0+ 7 × 1 + 8 × 0 + 9 × 1 + 8 × 0 + 7 × 1 = 1 + 3 + 7 + 9 + 7 = 27，如图所示：

类似地，在步长为1时，如上图所示，卷积核按照步长大小在输入图像上从左至右自上而下依次将卷积操作进行下去，最终输出 3 × 3 大小的卷积特征，同时该结果将作为下一层操作的输入。之后再进行上文讲的‘有机组合’中去，进行反复的前后反馈计算，直到出最后结果。

总结：

本篇介绍了深度学习的关键思想‘端到端’的关键思想，了解了深度学习的工作流程以及卷积操作，基本知识：卷积核，卷积步长，前馈运算，反馈运算，池化，**函数。下篇文章会讲：池化操作和**函数。

鸣谢：本文中的图片来源于南京大学计算机系机器学习在读博士魏秀参的开源贡献：http://lamda.nju.edu.cn/weixs 。

推荐阅读

gpu
2017年人工智能领域的十大里程碑事件回顾

随着2018年的临近，我们一同回顾过去一年中人工智能领域的重要进展。这一年，无论是政策层面的支持，还是技术上的突破，都显示了人工智能发展的迅猛势头。以下是精选的2017年人工智能领域最具影响力的事件。 ... [详细]

蜡笔小新 2024-12-16 17:59:16
gpu
资源推荐 | TensorFlow官方中文教程助力英语非母语者学习

来源：机器之心。本文详细介绍了TensorFlow官方提供的中文版教程和指南，帮助开发者更好地理解和应用这一强大的开源机器学习平台。 ... [详细]

蜡笔小新 2024-12-28 09:00:51
post
机器学习中的相似度度量与模型优化

本文探讨了机器学习中常见的相似度度量方法，包括余弦相似度、欧氏距离和马氏距离，并详细介绍了如何通过选择合适的模型复杂度和正则化来提高模型的泛化能力。此外，文章还涵盖了模型评估的各种方法和指标，以及不同分类器的工作原理和应用场景。 ... [详细]

蜡笔小新 2024-12-26 18:10:02
random
毕业设计：基于机器学习与深度学习的垃圾邮件（短信）分类算法实现

本文详细介绍了如何使用机器学习和深度学习技术对垃圾邮件和短信进行分类。内容涵盖从数据集介绍、预处理、特征提取到模型训练与评估的完整流程，并提供了具体的代码示例和实验结果。 ... [详细]

蜡笔小新 2024-12-25 17:38:50
lua
优化深度神经网络在低性能硬件上的运行

尽管深度学习带来了广泛的应用前景，其训练通常需要强大的计算资源。然而，并非所有开发者都能负担得起高性能服务器或专用硬件。本文探讨了如何在有限的硬件条件下（如ARM CPU）高效运行深度神经网络，特别是通过选择合适的工具和框架来加速模型推理。 ... [详细]

蜡笔小新 2024-12-24 08:48:32
install
Coursera ML 机器学习

2019独角兽企业重金招聘Python工程师标准线性回归算法计算过程CostFunction梯度下降算法多变量回归![选择特征](https:static.oschina.n ... [详细]

蜡笔小新 2024-12-22 16:09:09
install
机器学习核心概念与技术

本文系统梳理了机器学习的关键知识点，涵盖模型评估、正则化、线性模型、支持向量机、决策树及集成学习等内容，并深入探讨了各算法的原理和应用场景。 ... [详细]

蜡笔小新 2024-12-22 09:15:30
install
理解感受野与锚框在目标检测中的应用

本文探讨了卷积神经网络（CNN）中感受野的概念及其与锚框（anchor box）的关系。感受野定义了特征图上每个像素点对应的输入图像区域大小，而锚框则是在每个像素中心生成的多个不同尺寸和宽高比的边界框。两者在目标检测任务中起到关键作用。 ... [详细]

蜡笔小新 2024-12-27 12:03:44
install
卷积神经网络（CNN）基础理论与架构解析

本文介绍了卷积神经网络（CNN）的基本概念、常见结构及其各层的功能。重点讨论了LeNet-5、AlexNet、ZFNet、VGGNet和ResNet等经典模型，并详细解释了输入层、卷积层、激活层、池化层和全连接层的工作原理及优化方法。 ... [详细]

蜡笔小新 2024-12-24 18:58:11
java
亚马逊Go：无人零售的创新与挑战

本文探讨了亚马逊Go如何通过技术创新推动零售业的发展，以及面临的市场和隐私挑战。同时，介绍了亚马逊最新的‘刷手支付’技术及其潜在影响。 ... [详细]

蜡笔小新 2024-12-13 11:39:37
import
【度量学习】Siamese Network

基于2-channelnetwork的图片相似度判别一、相关理论本篇博文主要讲解2015年CVPR的一篇关于图像相似度计算的文章：《LearningtoCompar ... [详细]

蜡笔小新 2024-12-12 19:11:33
const
李宏毅机器学习笔记：无监督学习之线性方法

无监督学习主要涵盖两大类别：一是聚类与降维，旨在简化数据结构；二是生成模型，用于从编码生成新的数据样本。本文深入探讨了这些技术的具体应用和理论基础。 ... [详细]

蜡笔小新 2024-12-08 18:11:04
post
深入解析Android自定义View面试题

本文探讨了Android Launcher开发中自定义View的重要性，并通过一道经典的面试题，帮助开发者更好地理解自定义View的实现细节。文章不仅涵盖了基础知识，还提供了实际操作建议。 ... [详细]

蜡笔小新 2024-12-28 11:15:04
byte
优化ListView性能

本文深入探讨了如何通过多种技术手段优化ListView的性能，包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]

蜡笔小新 2024-12-28 10:36:30
java
2023年京东Android面试真题解析与经验分享

本文由一位拥有6年Android开发经验的工程师撰写，详细解析了京东面试中常见的技术问题。涵盖引用传递、Handler机制、ListView优化、多线程控制及ANR处理等核心知识点。 ... [详细]

蜡笔小新 2024-12-26 17:45:48

潘PanPanPq

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章