热门标签 | HotTags
当前位置:  开发笔记 > 人工智能 > 正文

全连接神经网络分类器(上)

全连接神经网络分类器(上)图像表示1.多层感知器2.激活函数小结3.SOFTMAX与交叉熵4.对比交叉熵损失与支撑向量机损失5.计算图与反向传播图像表示


全连接神经网络分类器(上)

  • 图像表示
  • 1. 多层感知器
  • 2. 激活函数
    • 小结
  • 3. SOFTMAX与交叉熵
  • 4. 对比交叉熵损失与支撑向量机损失
  • 5. 计算图与反向传播




在这里插入图片描述


图像表示

直接使用原始像素作为特征,展开为列向量
一般分类器均使用此类表示


1. 多层感知器

线性分类器

在这里插入图片描述

全连接神经网络:全连接神经网络级联多个变化来实现输入到输出的映射。

在这里插入图片描述

全连接神经网络的权值
在这里插入图片描述

全连接神经网络与线性不可分:
线性可分:
在这里插入图片描述
线性不可分:
在这里插入图片描述
全连接神经网络绘制与命名

在这里插入图片描述
N层全连接神经网络–除输入层之外的其他层的数量为N的网络。
N个隐层的全连接神经网络—网络隐层的数量为N的网络。
在这里插入图片描述


2. 激活函数

为什么需要非线性操作?
如果网络中缺少了激活函数,全连接神经网络将变成一个线性分类器。
在这里插入图片描述
常用的激活函数:
在这里插入图片描述

网络结构设计


  1. 用不用隐层,用一个还是多个隐层?(深度设计)
  2. 每一个而隐层设计几个神经元比较合适?(宽度设计)
    没有统一答案。

神经元个数越多,分界面就越复杂,在这个集合上的分类能力就越强。
在这里插入图片描述
跟据分类任务的难易程度来调整神经网络模型的复杂程度。分类任务越难,我们设计的神经网络结构就应该越深,越宽。但是,需要注意的是对训练集的分类精度最高的全连接神经网络连接模型。在真实场景下识别性能未必是最好的。(过拟合)


小结


  • 全连接神经网络组成:一个输入层,一个输出层及多个隐层。
  • 输入层与输出层的神经元个数由任务决定,而隐层数量及每个隐层中神经元的数量则需要人为指定。
  • 激活函数是全连接神经网络中的一个重要部分,缺少了激活函数,全连接神经网络将退化为线性分类器。

3. SOFTMAX与交叉熵

在这里插入图片描述

相对熵也叫KL散度;用来度量两个分布之间的不相似性。

交叉熵特殊形式
在这里插入图片描述

交叉熵损失,在这里插入图片描述


4. 对比交叉熵损失与支撑向量机损失

在这里插入图片描述
相同分数下两类分类器的损失有什么区别?
21777777在这里插入图片描述


5. 计算图与反向传播

什么是计算图?
计算图是一种有向图,他用来表达输入,输出以及中间变量之间的计算关系,图中的每个节点对应着一种数学运算。
在这里插入图片描述

在这里插入图片描述

计算图总结:


  1. 任意复杂的函数,都可以用计算图的形式表示
  2. 在整个计算图中,每个门单元都会得到一些输入,然后进行下面两个计算:
    a. 这个门的输出值
    b. 其输出值关于输入值的局部梯度。
  3. 利用链式法则,门单元应该将回传的梯度乘以它对其的输入的局部梯度,从而得到整个网络的输出对该门单元的每个输入值的梯度。

在这里插入图片描述

计算图的颗粒度:将几个单元操作合并为一个计算模块。
在这里插入图片描述

计算图中常见的门单元:
在这里插入图片描述


推荐阅读
  • 卷积神经网络(CNN)基础理论与架构解析
    本文介绍了卷积神经网络(CNN)的基本概念、常见结构及其各层的功能。重点讨论了LeNet-5、AlexNet、ZFNet、VGGNet和ResNet等经典模型,并详细解释了输入层、卷积层、激活层、池化层和全连接层的工作原理及优化方法。 ... [详细]
  • 探索电路与系统的起源与发展
    本文回顾了电路与系统的发展历程,从电的早期发现到现代电子器件的应用。文章不仅涵盖了基础理论和关键发明,还探讨了这一学科对计算机、人工智能及物联网等领域的深远影响。 ... [详细]
  • 尽管深度学习带来了广泛的应用前景,其训练通常需要强大的计算资源。然而,并非所有开发者都能负担得起高性能服务器或专用硬件。本文探讨了如何在有限的硬件条件下(如ARM CPU)高效运行深度神经网络,特别是通过选择合适的工具和框架来加速模型推理。 ... [详细]
  • 智能车间调度研究进展
    本文综述了基于强化学习的智能车间调度策略,探讨了车间调度问题在资源有限条件下的优化方法。通过数学规划、智能算法和强化学习等手段,解决了作业车间、流水车间和加工车间中的静态与动态调度挑战。重点讨论了不同场景下的求解方法及其应用前景。 ... [详细]
  • 尽管使用TensorFlow和PyTorch等成熟框架可以显著降低实现递归神经网络(RNN)的门槛,但对于初学者来说,理解其底层原理至关重要。本文将引导您使用NumPy从头构建一个用于自然语言处理(NLP)的RNN模型。 ... [详细]
  • 深入解析:阿里实战 SpringCloud 微服务架构与应用
    本文将详细介绍 SpringCloud 在微服务架构中的应用,涵盖入门、实战和案例分析。通过丰富的代码示例和实际项目经验,帮助读者全面掌握 SpringCloud 的核心技术和最佳实践。 ... [详细]
  • 本文深入探讨了C++对象模型中的一些细节问题,特别是虚拟继承和析构函数的处理。通过具体代码示例和详细分析,揭示了书中某些观点的不足之处,并提供了更合理的解释。 ... [详细]
  • 【行业专题报告】 人力资源专题资料
    每项专题报告都是从2019开始更新到至今,后续将持续更新如需查看完整报告和报告下载或了解更多,公众号:参一江湖今天为大家分享专题 ... [详细]
  • Codeforces Round #566 (Div. 2) A~F个人题解
    Dashboard-CodeforcesRound#566(Div.2)-CodeforcesA.FillingShapes题意:给你一个的表格,你 ... [详细]
  • 堆是一种常见的数据结构,广泛应用于计算机科学领域。它通常表示为一棵完全二叉树,并可通过数组实现。堆的主要特性是每个节点的值与其父节点的值之间存在特定的关系,这使得堆在优先队列和排序算法中非常有用。 ... [详细]
  • FinOps 与 Serverless 的结合:破解云成本难题
    本文探讨了如何通过 FinOps 实践优化 Serverless 应用的成本管理,提出了首个 Serverless 函数总成本估计模型,并分享了多种有效的成本优化策略。 ... [详细]
  • 2018年3月31日,CSDN、火星财经联合中关村区块链产业联盟等机构举办的2018区块链技术及应用峰会(BTA)核心分会场圆满举行。多位业内顶尖专家深入探讨了区块链的核心技术原理及其在实际业务中的应用。 ... [详细]
  • 本文作者分享了在阿里巴巴获得实习offer的经历,包括五轮面试的详细内容和经验总结。其中四轮为技术面试,一轮为HR面试,涵盖了大量的Java技术和项目实践经验。 ... [详细]
  • Netflix利用Druid实现高效实时数据分析
    本文探讨了全球领先的在线娱乐公司Netflix如何通过采用Apache Druid,实现了高效的数据采集、处理和实时分析,从而显著提升了用户体验和业务决策的准确性。文章详细介绍了Netflix在系统架构、数据摄取、管理和查询方面的实践,并展示了Druid在大规模数据处理中的卓越性能。 ... [详细]
  • 本题探讨了在大数据结构背景下,如何通过整体二分和CDQ分治等高级算法优化处理复杂的时间序列问题。题目设定包括节点数量、查询次数和权重限制,并详细分析了解决方案中的关键步骤。 ... [详细]
author-avatar
sawrf12454_191
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有