热门标签 | HotTags
当前位置:  开发笔记 > 运维 > 正文

part1神经网络结构

识别数字为了识别数字使用了神经源网络,神经元神经元网络:装有一个数字的容器。下图28*28的像素图中有784个神经元,其中0代表纯黑
识别数字

为了识别数字使用了神经源网络,

神经元

神经元网络:装有一个数字的容器 。下图28*28的像素图中有784个神经元,其中0代表纯黑1代表白的数值叫做激活值。这783个神经元组成了网络的第一层。
在这里插入图片描述
最后一层神经元为0-9这10个数字。它们的激活值也在0-1之间吗,代表各个数的可能性。
在这里插入图片描述
神经网络处理信息的核心机制正是一层的激活值算出下一层。某些程度上讲,他想模仿生物中神经元组成的网络。

神经元为什么要分层

在识别数字过程中如下图,9可以拆分成0和1,8为两个0.诸如此类
在这里插入图片描述
在理想情况下,我们希望倒数第二层的各个神经元能分别对应上一个笔画。这样一来当我们输入一个9或8这种带圈的数字时。某个神经元的激活值就接近1。
在这里插入图片描述
这样引发的问题是如何识别这些部件,那些部件才算是正确的, 识别圆圈可以分解为更小的问题,如识别图形中更小的边。
在这里插入图片描述
世界上各种人工职能任务,都可以转化为抽象元素,一层层抽死剥茧。比如语音识别 是从原音频中识别出特殊的声音,组成特定的音节,组成特定的短语以及更抽象的概念。

神经元分析过程

我们需要给第一层所有数字加一个权重值,我们拿第一层的权重值和激活值乘后相加。
在这里插入图片描述
将权重值作为表格,正的标记为绿色负的标位红色,颜色月暗就表示他的权重约接近于0
在这里插入图片描述
如果把关注区域的权重值赋为正值,而其他区域的权重值都赋值为0,这样一来对所有像素值取加权和,就会累加关注区域的像素值了,此时如果想识别是否有一条边,只需要给周围一圈的像素赋负的权重。这样当中间像素量周围像素暗时,加权和就能达到最大值。
在这里插入图片描述
这样计算出来的加权和可以是任意大小,但这个wan刚落,我们需要激活值都在0-1之间,那么我们可以顺其自然把加权和输进某个函数,把实数轴挤压进0-1之间
在这里插入图片描述
在这里插入图片描述
其中有个叫sigmoid的函数非常常用,又叫logistic/逻辑斯蒂曲线,简而言之,能把非常大的负值变成接近0.非常大的正值接近1.
在这里插入图片描述
所以神经元下一层的激活值,实际上就是一个对加权和到底有多正的打分。
但有时即使加权和大于0,你也不想把神经元点亮,可能加权和大于10你才让他激发,此时你要加上一个偏置值,保证不能随便激发。
在这里插入图片描述
此时只要在加权和后=10在送入sigmoid压缩、映射函数,这个附加的数就是pian’zhi偏置值。
在这里插入图片描述
但这个一层的每个神经元都会和第一层的全部784个神经元相连接。每一个连接线都带一个权重,而且每个神经元计算自己加权和都会带自己的偏置。
在这里插入图片描述
加入第二层有16个神经元,就要计算784*16个权重值和16个偏置值。而且这还是单单第一层和第二层之间的连接。一套下来总共会用将近13000个权重加偏置。相当于13000多个旋钮开关来让你调试。所以在讲深度学习,其实是电脑该如何设置这些数字参数。
我们把一层所有激活值统一成一列向量。
在这里插入图片描述
再把它和下一层间所有权重放到一个矩阵中,矩阵第n行就是这一层所有的神经元。
在这里插入图片描述
这样就可以计算出下一层的加权和。在这里插入图片描述
加权和加上偏置,再导入sigmoid函数,就可以得到下一层的 激活值。 在这里插入图片描述
在这里插入图片描述
一开始将神经元看做数字的容器,实际上神经元装着的值取决与你输入图形,所以我们将神经元看做一个函数才更准确 。他输入上一层神经元的输出,输出一个0-1的值,其实整个神经元就是一个函数输入784个值输出10个值的函数。

扩展

过去常用sigmod训练现在改用ReLU,ReLu全称是线性整流函数,relu就是返回0和a的最大值,其中a是函数的输入,神经元之所以会用这种方法一部分也是为了模仿生物学上的神经元。
在这里插入图片描述
在这里插入图片描述


推荐阅读
  • 精选10款Python框架助力并行与分布式机器学习
    随着神经网络模型的不断深化和复杂化,训练这些模型变得愈发具有挑战性,不仅需要处理大量的权重,还必须克服内存限制等问题。本文将介绍10款优秀的Python框架,帮助开发者高效地实现分布式和并行化的深度学习模型训练。 ... [详细]
  • 探索CNN的可视化技术
    神经网络的可视化在理论学习与实践应用中扮演着至关重要的角色。本文深入探讨了三种有效的CNN(卷积神经网络)可视化方法,旨在帮助读者更好地理解和优化模型。 ... [详细]
  • 本文详细记录了一位Java程序员在Lazada的面试经历,涵盖同步机制、JVM调优、Redis应用、线程池配置、Spring框架特性等多个技术点,以及高级面试中的设计问题和解决方案。 ... [详细]
  • 视觉Transformer综述
    本文综述了视觉Transformer在计算机视觉领域的应用,从原始Transformer出发,详细介绍了其在图像分类、目标检测和图像分割等任务中的最新进展。文章不仅涵盖了基础的Transformer架构,还深入探讨了各类增强版Transformer模型的设计思路和技术细节。 ... [详细]
  • 本文探讨了如何在Docker构建过程中使用动态环境变量,特别是针对Docker v1.9及以上版本的用户。我们将介绍如何声明和使用构建参数,以及这些参数对构建缓存的影响。 ... [详细]
  • 七大策略降低云上MySQL成本
    在全球经济放缓和通胀压力下,降低云环境中MySQL数据库的运行成本成为企业关注的重点。本文提供了一系列实用技巧,旨在帮助企业有效控制成本,同时保持高效运作。 ... [详细]
  • 知识图谱与图神经网络在金融科技中的应用探讨
    本文详细介绍了融慧金科AI Lab负责人张凯博士在2020爱分析·中国人工智能高峰论坛上的演讲,探讨了知识图谱与图神经网络模型如何在金融科技领域发挥重要作用。 ... [详细]
  • 计算机学报精选论文概览(2020-2022)
    本文汇总了2020年至2022年间《计算机学报》上发表的若干重要论文,旨在为即将投稿的研究者提供参考。 ... [详细]
  • 深入解析:存储技术的演变与发展
    本文探讨了从单机文件系统到分布式文件系统的存储技术发展过程,详细解释了各种存储模型及其特点。 ... [详细]
  • RTThread线程间通信
    线程中通信在裸机编程中,经常会使用全局变量进行功能间的通信,如某些功能可能由于一些操作而改变全局变量的值,另一个功能对此全局变量进行读取& ... [详细]
  • 英特尔推出第三代至强可扩展处理器及傲腾持久内存,AI性能显著提升
    英特尔在数据创新峰会上发布了第三代至强可扩展处理器和第二代傲腾持久内存,全面增强AI能力和系统性能。 ... [详细]
  • ABP框架是ASP.NET Boilerplate的简称,它不仅是一个开源且文档丰富的应用程序框架,还提供了一套基于领域驱动设计(DDD)的最佳实践架构模型。本文将详细介绍ABP框架的特点、项目结构及其在Web API优先架构中的应用。 ... [详细]
  • 自动驾驶中的9种传感器融合算法
    来源丨AI修炼之路在自动驾驶汽车中,传感器融合是融合来自多个传感器数据的过程。该步骤在机器人技术中是强制性的,因为它提供了更高的可靠性、冗余性以及最终的 ... [详细]
  • Java EE 平台集成了多种服务、API 和协议,旨在支持基于 Web 的多层应用程序开发。本文将详细介绍 Java EE 中的 13 种关键技术规范,帮助开发者更好地理解和应用这些技术。 ... [详细]
  • 在Windows系统中安装TensorFlow GPU版的详细指南与常见问题解决
    在Windows系统中安装TensorFlow GPU版是许多深度学习初学者面临的挑战。本文详细介绍了安装过程中的每一个步骤,并针对常见的问题提供了有效的解决方案。通过本文的指导,读者可以顺利地完成安装并避免常见的陷阱。 ... [详细]
author-avatar
210213银成弘19952_Q8S
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有