当前位置: 开发笔记 > 编程语言 > 正文

一文看懂神经网络工作原理(卷积神经网络算法原理)

作者：翟峰 | 来源：互联网 | 2023-09-06 16:55

本文主要介绍关于神经网络,池化层,卷积层的知识点，对【一文看懂神经网络工作原理】和【卷积神经网络算法原理】有兴趣的朋友可以看下由【喜欢打酱油的老鸟】投稿的技术文章，希望该技术和经验能帮到你解决你所遇的

本文主要介绍关于神经网络,池化层,卷积层的知识点，对【一文看懂神经网络工作原理】和【卷积神经网络算法原理】有兴趣的朋友可以看下由【喜欢打酱油的老鸟】投稿的技术文章，希望该技术和经验能帮到你解决你所遇的【人工智能】相关技术问题。

卷积神经网络算法原理

一文看懂神经网络工作原理

https://www.toutiao.com/a6634049434629980680/

现在谈人工智能已经绕不开“神经网络”这个词了。人造神经网络粗线条地模拟人脑，使得计算机能够从数据中学习。

机器学习这一强大的分支结束了 AI 的寒冬，迎来了人工智能的新时代。简而言之，神经网络可能是今天最具有根本颠覆性的技术。

看完这篇神经网络的指南，你也可以和别人聊聊深度学习了。为此，我们将尽量不用数学公式，而是尽可能用打比方的方法，再加一些动画来说明。

强力思考

AI 的早期流派之一认为，如果您将尽可能多的信息加载到功能强大的计算机中，并尽可能多地提供方法来了解这些数据，那么计算机就应该能够“思考”。比如 IBM 着名的国际象棋 AI Deep Blue 背后就是这么一个思路：通过对棋子可能走出的每一步进行编程，再加上足够的算力，IBM 程序员创建了一台机器，理论上可以计算出每一个可能的动作和结果，以此来击败对手。

通过这种计算，机器依赖于工程师精心预编程的固定规则——如果发生了 A，那么就会发生 B ; 如果发生了 C，就做 D——这并不是如人类一样的灵活学习。当然，它是强大的超级计算，但不是“思考”本身。

教机器学习

在过去十年中，科学家已经复活了一个旧概念，不再依赖大型百科全书式记忆库，而是框架性地进行模拟人类思维，以简单而系统的方式分析输入数据。这种技术被称为深度学习或神经网络，自20世纪40年代以来一直存在，但是由于今天数据的大量增长—— 图像、视频、语音搜索、浏览行为等等——以及运算能力提升而成本下降的处理器，终于开始显示其真正的威力。

机器——它们和我们很像

人工神经网络（ANN）是一种算法结构，使得机器能够学习一切，从语音命令、播放列表到音乐创作和图像识别。典型的 ANN 由数千个互连的人造神经元组成，它们按顺序堆叠在一起，以称为层的形式形成数百万个连接。在许多情况下，层仅通过输入和输出与它们之前和之后的神经元层互连。（这与人类大脑中的神经元有很大的不同，它们的互连是全方位的。）

这种分层的 ANN 是今天机器学习的主要方式之一，通过馈送其大量的标签数据，可以帮助它学习如何解读数据（有时甚至比人类做得更好）。

以图像识别为例，它依赖于称为卷积神经网络（CNN）的特定类型的神经网络，因为它使用称为卷积的数学过程来以非文字的方式分析图像，例如识别部分模糊的对象或仅从某些角度可见的对象。（还有其他类型的神经网络，包括循环神经网络和前馈神经网络，但是这些神经网络对于识别诸如图像的东西不太有用，下面我们会用示例来说明）

神经网络的训练过程

那么神经网络到底是如何学习的？让我们看一个非常简单但有效的流程，它叫作监督学习。我们为神经网络提供了大量的人类标记的训练数据，以便神经网络可以进行基本的自我检查。

假设这个标签数据分别由苹果和橘子的图片组成。照片是数据;“苹果”和“橘子”是标签。当输入图像数据时，网络将它们分解为最基本的组件，即边缘、纹理和形状。当图像数据在网络中传递时，这些基本组件被组合以形成更抽象的概念，即曲线和不同的颜色，这些元素在进一步组合时，就开始看起来像茎、整个的橘子，或是绿色和红色的苹果。

在这个过程的最后，网络试图对图片中的内容进行预测。首先，这些预测将显示为随机猜测，因为真正的学习还未发生。如果输入图像是苹果，但预测为“橘子”，则网络的内部层需要被调整。

调整的过程称为反向传播，以增加下一次将同一图像预测成“苹果”的可能性。这一过程持续进行，直到预测的准确度不再提升。正如父母教孩子们在现实生活中认苹果和橘子一样，对于计算机来说，训练造就完美。如果你现在已经觉得“这不就是学习吗？”，那你可能很适合搞人工智能。

很多很多层……

通常，卷积神经网络除了输入和输出层之外还有四个基本的神经元层：

卷积层（Convolution）

激活层（Activation）

池化层（Pooling）

完全连接层（Fully connected）

了解更详细{http://bbs.ropal.com.cn}

卷积层

在最初的卷积层中，成千上万的神经元充当第一组过滤器，搜寻图像中的每个部分和像素，找出模式（pattern）。随着越来越多的图像被处理，每个神经元逐渐学习过滤特定的特征，这提高了准确性。

比如图像是苹果，一个过滤器可能专注于发现“红色”这一颜色，而另一个过滤器可能会寻找圆形边缘，另一个过滤器则会识别细细的茎。如果你要清理混乱的地下室，准备在车库搞个大销售，你就能理解把一切按不同的主题分类是什么意思了（玩具、电子产品、艺术品、衣服等等）。卷积层就是通过将图像分解成不同的特征来做这件事的。

特别强大的是，神经网络赖以成名的绝招与早期的 AI 方法（比如 Deep Blue 中用到的）不同，这些过滤器不是人工设计的。他们纯粹是通过查看数据来学习和自我完善。

卷积层创建了不同的、细分的图像版本，每个专用于不同的过滤特征——显示其神经元在哪里看到了红色、茎、曲线和各种其他元素的实例（但都是部分的）。但因为卷积层在识别特征方面相当自由，所以需要额外的一双眼睛，以确保当图片信息在网络中传递时，没有任何有价值的部分被遗漏。

神经网络的一个优点是它们能够以非线性的方式学习。如果不用数学术语解释，它们的意思是能够发现不太明显的图像中的特征——树上的苹果，阳光下的，阴影下的，或厨房柜台的碗里的。这一切都要归功于于激活层，它或多或少地突出了有价值的东西——一些既明了又难以发现的属性。

在我们的车库大甩卖中，想像一下，从每一类东西里我们都挑选了几件珍贵的宝物：书籍，大学时代的经典 T 恤。要命的是，我们可能还不想扔它们。我们把这些“可能”会留下的物品放在它们各自的类别之上，以备再考虑。

池化层

整个图像中的这种“卷积”会产生大量的信息，这可能会很快成为一个计算噩梦。进入池化层，可将其全部缩小成更通用和可消化的形式。有很多方法可以解决这个问题，但最受欢迎的是“最大池”（Max Pooling），它将每个特征图编辑成自己的“读者文摘”版本，因此只有红色、茎或曲线的最好样本被表征出来。

在车库春季清理的例子中，如果我们使用着名的日本清理大师 Marie Kondo 的原则，将不得不从每个类别堆中较小的收藏夹里选择“激发喜悦”的东西，然后卖掉或处理掉其他东西。所以现在我们仍然按照物品类型来分类，但只包括实际想要保留的物品。其他一切都卖了。

这时，神经网络的设计师可以堆叠这一分类的后续分层配置——卷积、激活、池化——并且继续过滤图像以获得更高级别的信息。在识别图片中的苹果时，图像被一遍又一遍地过滤，初始层仅显示边缘的几乎不可辨别的部分，比如红色的一部分或仅仅是茎的尖端，而随后的更多的过滤层将显示整个苹果。无论哪种方式，当开始获取结果时，完全连接层就会起作用。

完全连接层

现在是时候得出结果了。在完全连接层中，每个削减的或“池化的”特征图“完全连接”到表征了神经网络正在学习识别的事物的输出节点（神经元）上。如果网络的任务是学习如何发现猫、狗、豚鼠和沙鼠，那么它将有四个输出节点。在我们描述的神经网络中，它将只有两个输出节点：一个用于“苹果”，一个用于“橘子”。

如果通过网络馈送的图像是苹果，并且网络已经进行了一些训练，且随着其预测而变得越来越好，那么很可能一个很好的特征图块就是包含了苹果特征的高质量实例。这是最终输出节点实现使命的地方，反之亦然。

“苹果”和“橘子”节点的工作（他们在工作中学到的）基本上是为包含其各自水果的特征图“投票”。因此，“苹果”节点认为某图包含“苹果”特征越多，它给该特征图的投票就越多。两个节点都必须对每个特征图进行投票，无论它包含什么。所以在这种情况下，“橘子”节点不会向任何特征图投很多票，因为它们并不真正包含任何“橘子”的特征。最后，投出最多票数的节点（在本例中为“苹果”节点）可以被认为是网络的“答案”，尽管事实上可能不那么简单。

因为同一个网络正在寻找两个不同的东西——苹果和橘子——网络的最终输出以百分比表示。在这种情况下，我们假设网络在训练中表现已经有所下降了，所以这里的预测可能就是75％的“苹果”，25％的“橘子”。或者如果是在训练早期，可能会更加不正确，它可能是20％的“苹果”和80％的“橘子”。这可不妙。

如果一开始没成功，再试，再试…

所以，在早期阶段，神经网络可能会以百分比的形式给出一堆错误的答案。 20％的“苹果”和80％的“橘子”，预测显然是错误的，但由于这是使用标记的训练数据进行监督学习，所以网络能够通过称为“反向传播”的过程来进行系统调整。

避免用数学术语来说，反向传播将反馈发送到上一层的节点，告诉它答案差了多少。然后，该层再将反馈发送到上一层，再传到上一层，直到它回到卷积层，来进行调整，以帮助每个神经元在随后的图像在网络中传递时更好地识别数据。

这个过程一直反复进行，直到神经网络以更准确的方式识别图像中的苹果和橘子，最终以100％的正确率预测结果——尽管许多工程师认为85％是可以接受的。这时，神经网络已经准备好了，可以开始真正识别图片中的苹果了。

原文链接：https://techcrunch.com/2017/04/13/neural-networks-made-easy/

本文《一文看懂神经网络工作原理》版权归喜欢打酱油的老鸟所有，引用一文看懂神经网络工作原理需遵循CC 4.0 BY-SA版权协议。

推荐阅读

int
2017年人工智能领域的十大里程碑事件回顾

随着2018年的临近，我们一同回顾过去一年中人工智能领域的重要进展。这一年，无论是政策层面的支持，还是技术上的突破，都显示了人工智能发展的迅猛势头。以下是精选的2017年人工智能领域最具影响力的事件。 ... [详细]

蜡笔小新 2024-12-16 17:59:16
int
机器学习中的相似度度量与模型优化

本文探讨了机器学习中常见的相似度度量方法，包括余弦相似度、欧氏距离和马氏距离，并详细介绍了如何通过选择合适的模型复杂度和正则化来提高模型的泛化能力。此外，文章还涵盖了模型评估的各种方法和指标，以及不同分类器的工作原理和应用场景。 ... [详细]

蜡笔小新 2024-12-26 18:10:02
int
Coursera ML 机器学习

2019独角兽企业重金招聘Python工程师标准线性回归算法计算过程CostFunction梯度下降算法多变量回归![选择特征](https:static.oschina.n ... [详细]

蜡笔小新 2024-12-22 16:09:09
io
吴恩达推出TensorFlow实践课程，Python基础即可入门，四个月掌握核心技能

量子位报道，deeplearning.ai最新发布了TensorFlow实践课程，适合希望使用TensorFlow开发AI应用的学习者。该课程涵盖机器学习模型构建、图像识别、自然语言处理及时间序列预测等多个方面。 ... [详细]

蜡笔小新 2024-12-08 17:26:10
int
强人工智能时代，区块链的角色与前景

随着强人工智能的崛起，区块链技术在新的技术生态中扮演着怎样的角色？本文探讨了区块链与强人工智能之间的互补关系及其在未来技术发展中的重要性。 ... [详细]

蜡笔小新 2024-12-07 14:46:21
int
毕业设计：基于机器学习与深度学习的垃圾邮件（短信）分类算法实现

本文详细介绍了如何使用机器学习和深度学习技术对垃圾邮件和短信进行分类。内容涵盖从数据集介绍、预处理、特征提取到模型训练与评估的完整流程，并提供了具体的代码示例和实验结果。 ... [详细]

蜡笔小新 2024-12-25 17:38:50
int
探索电路与系统的起源与发展

本文回顾了电路与系统的发展历程，从电的早期发现到现代电子器件的应用。文章不仅涵盖了基础理论和关键发明，还探讨了这一学科对计算机、人工智能及物联网等领域的深远影响。 ... [详细]

蜡笔小新 2024-12-24 13:57:05
int
机器学习核心概念与技术

本文系统梳理了机器学习的关键知识点，涵盖模型评估、正则化、线性模型、支持向量机、决策树及集成学习等内容，并深入探讨了各算法的原理和应用场景。 ... [详细]

蜡笔小新 2024-12-22 09:15:30
int
智能投顾机器人：创业者如何应对新挑战？

随着智能投顾技术在二级市场的兴起，针对一级市场的智能投顾也逐渐崭露头角。近日，一款名为阿尔妮塔的人工智能创投机器人正式发布，它将如何改变投资人的工作方式和创业者的融资策略？ ... [详细]

蜡笔小新 2024-12-20 16:46:18
int
游戏开发中的人工智能复习指南

本文档旨在帮助开发者回顾游戏开发中的人工智能技术，涵盖移动算法、群聚行为、路径规划、脚本AI、有限状态机、模糊逻辑、规则式AI、概率论与贝叶斯技术、神经网络及遗传算法等内容。 ... [详细]

蜡笔小新 2024-12-16 10:01:32
int
十大算法书籍助力编程之路

算法作为编程学习的核心技能，其重要性不容忽视。虽然算法的学习难度较高，但其对提升编程能力、通过技术面试以及应对当前热门的技术领域如人工智能和区块链等都有着不可替代的作用。本文精选十本算法书籍，旨在帮助程序员更好地掌握这一关键技术。 ... [详细]

蜡笔小新 2024-12-16 13:53:12
match
【度量学习】Siamese Network

基于2-channelnetwork的图片相似度判别一、相关理论本篇博文主要讲解2015年CVPR的一篇关于图像相似度计算的文章：《LearningtoCompar ... [详细]

蜡笔小新 2024-12-12 19:11:33
int
利用Java与Tesseract-OCR实现数字识别

本文深入探讨了如何利用Java语言结合Tesseract-OCR技术来实现图像中的数字识别功能，旨在为开发者提供详细的指导和实践案例。 ... [详细]

蜡笔小新 2024-12-12 10:47:15
int
深入理解卷积神经网络(CNNs)及其应用

回顾与学习是进步的阶梯。再次审视卷积神经网络(CNNs)，我对之前不甚明了的概念有了更深的理解。本文旨在分享这些新的见解，并探讨CNNs在图像识别和自然语言处理等领域中的实际应用。 ... [详细]

蜡笔小新 2024-12-11 13:41:49
io
李宏毅机器学习笔记：无监督学习之线性方法

无监督学习主要涵盖两大类别：一是聚类与降维，旨在简化数据结构；二是生成模型，用于从编码生成新的数据样本。本文深入探讨了这些技术的具体应用和理论基础。 ... [详细]

蜡笔小新 2024-12-08 18:11:04

翟峰

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章