当前位置: 开发笔记 > 编程语言 > 正文

深度学习tensorflow学习笔记(1)MNIST手写字体识别预备知识

作者：销魂成浩龙_346 | 来源：互联网 | 2023-09-02 19:21

深度学习-tensorflow学习笔记(1)-MNIST手写字体识别预备知识在tf第一个例子的时候需要很多预备知识。tf基本知识香农熵交叉熵代价函数cross-entropy卷积神

　　　　　　深度学习-tensorflow学习笔记(1)-MNIST手写字体识别预备知识

　　在tf第一个例子的时候需要很多预备知识。

tf基本知识
香农熵
交叉熵代价函数cross-entropy
卷积神经网络
softmax

　这里用到的tf基本知识

tf.tensor-张量,其实就是矩阵。官方说法是原料
tf.Varible-变量,用来记录数据，参数。其实也是个矩阵。不过要初始化后才有具体的值
tf.Session()-会话，就是个模型，我们可以在里面添加数据流动方向，运算节点

　　香农熵

　　香农熵是计算信息复杂度的公式。

　　公式如下

　　要理解这个公式不难。举例是最好的方法。首先是硬币，正面概率1/2反面1/2

　　那么H(x)=-(1/2log(1/2)+1/2log(1/2))=1

　　假如有在某种情况下有4种可能就是

　　H(x)=-(1/4log(1/4)+1/4log(1/4)+1/4log(1/4)+1/4log(1/4))=2

　　可以明显看出，问题的分类越多，结果越多，那么复杂度越高。不确定性越高，比如我们在决策树中要做的就是每次都把信息熵最高的选出来然后递归决策

　　交叉熵代价函数cross-entropy

　　这是个更优化的损失函数比起常规的cost function.

　　机器学习中第一个遇见的是sigmod函数，这个函数在开始时梯度小，学习速率慢。我们看下图就知道

　　CROSS-ENTROPY解决了初时时学习速率过小的问题

　　cross-entropy和香农熵的公式有点像，但是千万不要搞混。

　　这里的p是样本的真实分布

　　q是带估计的模型，也就是我们的预测。

　　同样举例是最好理解公式的方法。

　　(1)我们假设硬币抛100次正面1/3反面2/3.我们预测是1/2 1/2

　　然后h(x)=-(1/3*-1+2/3*-1)=1

　　我们再假设硬币抛100次是正面1/3反2/3 我们预测是正0.001 反0.999

　　h(x)=-(1/3*负无穷+2/3*0)=正无穷

　　(2)再假设某种概率都是1/4我们预测也都是1/4

　　h(x)=-(1/4*-2*4)=2

　　如果我们预测为1/8 1/4 1/8 1/2

　　h(x)=-(1/4*-3+1/4*-2+1/4*-3+1/4*-1)=2.25

　　对比两个例子可以发现，当预测越准时候，交叉熵越小，反之交叉熵越大，(1)中可以看到对于离谱的预测，交叉熵也会变得非常之大

　　卷积神经网络-以下内容全部来自https://my.oschina.net/u/876354/blog/1620906 一篇超级好的blog

　　如图卷积层就是图中的filter-它的作用是提取特征值-参考卷积公式

可以知道就是对图像的遍历操作

　　这里的卷积层是5*5*3(3是深度这里也就是rgb)所以-一次卷积后得到28*28*3 两次后是24*24*3

　　发现一遍超级好文：放下地址

　　https://my.oschina.net/u/876354/blog/1620906 超级详细的cnn解释

　池化层

　　作用：将图片缩小，减少像素保留特征值，以便后来加快计算。我这里COPY了上面BLOG的部分内容。万一那个BLOG炸了我还有备份

　　(5)池化(Pooling)

为了有效地减少计算量，CNN使用的另一个有效的工具被称为“池化(Pooling)”。池化就是将输入图像进行缩小，减少像素信息，只保留重要信息。池化的操作也很简单，通常情况下，池化区域是2*2大小，然后按一定规则转换成相应的值，例如取这个池化区域内的最大值(max-pooling)、平均值(mean-pooling)等，以这个值作为结果的像素值。下图显示了左上角2*2池化区域的max-pooling结果，取该区域的最大值max(0.77,-0.11,-0.11,1.00)，作为池化后的结果，如下图：

池化区域往左，第二小块取大值max(0.11,0.33,-0.11,0.33)，作为池化后的结果，如下图：

其它区域也是类似，取区域内的最大值作为池化后的结果，最后经过池化后，结果如下：

对所有的feature map执行同样的操作，结果如下：

　　最大池化(max-pooling)保留了每一小块内的最大值，也就是相当于保留了这一块最佳的匹配结果(因为值越接近1表示匹配越好)。也就是说，它不会具体关注窗口内到底是哪一个地方匹配了，而只关注是不是有某个地方匹配上了。通过加入池化层，图像缩小了，能很大程度上减少计算量，降低机器负载。

　　softmax

　　这是个回归函数，不同于logistic回归解决的二分问题，sotfmax用于多类别问题。

　　算是激励函数

　　首先和sigmod一样

　　然后

　　分母是把所有神经元的值加起来

　　分子是第L层第j个神经元的输出

　　就是某个神经元输出占所有神经元输出的比值

　　意义：当它占的比值越大，这个样本的损失越小

推荐阅读

sum
利用CIFAR10数据集快速掌握Mixup数据增强技术，显著提高图像分类精度

通过使用CIFAR-10数据集，本文详细介绍了如何快速掌握Mixup数据增强技术，并展示了该方法在图像分类任务中的显著效果。实验结果表明，Mixup能够有效提高模型的泛化能力和分类精度，为图像识别领域的研究提供了有价值的参考。 ... [详细]

蜡笔小新 2024-11-05 14:24:36
bit
使用 Jupyter Notebook 实现 Markdown 编写与代码运行

Jupyter Notebook 是一个开源的基于网页的应用程序，允许用户在同一文档中编写 Markdown 文本和运行多种编程语言的代码，并实时查看运行结果。 ... [详细]

蜡笔小新 2024-11-15 14:50:50
rsa
能够感知你情绪状态的智能机器人即将问世 | 科技前沿观察

本周科技前沿报道了多项重要进展，包括美国多所高校在机器人技术和自动驾驶领域的最新研究成果，以及硅谷大型企业在智能硬件和深度学习技术上的突破性进展。特别值得一提的是，一款能够感知用户情绪状态的智能机器人即将问世，为未来的人机交互带来了全新的可能性。 ... [详细]

蜡笔小新 2024-11-05 20:45:31
bit
中国学者实现 CNN 全程可视化，详尽展示每次卷积、ReLU 和池化过程

中国学者实现 CNN 全程可视化，详尽展示每次卷积、ReLU 和池化过程 ... [详细]

蜡笔小新 2024-11-03 13:52:28
bit
2019年斯坦福大学CS224n课程笔记：深度学习在自然语言处理中的应用——Word2Vec与GloVe模型解析

本文详细解析了2019年斯坦福大学CS224n课程中关于深度学习在自然语言处理（NLP）领域的应用，重点探讨了Word2Vec和GloVe两种词嵌入模型的原理与实现方法。通过具体案例分析，深入阐述了这两种模型在提升NLP任务性能方面的优势与应用场景。 ... [详细]

蜡笔小新 2024-10-29 10:37:07
match
利用TensorFlow.js在网页浏览器中实现高效的人脸识别JavaScript接口

作者|VincentMühle编译|姗姗出品|人工智能头条（公众号ID：AI_Thinker）【导读】随着深度学习方法的应用，浏览器调用人脸识别技术已经得到了更广泛的应用与提升。在 ... [详细]

蜡笔小新 2024-10-23 10:50:38
sum
基于TensorFlow的鸢尾花数据集神经网络模型深度解析

基于TensorFlow的鸢尾花数据集神经网络模型深度解析 ... [详细]

蜡笔小新 2024-10-22 11:56:51
sum
Google Colab 免费 GPU 使用指南（第一部分）

本文介绍了如何使用 Google Colab 的免费 GPU 资源进行深度学习应用开发。Google Colab 是一个无需配置即可使用的云端 Jupyter 笔记本环境，支持多种深度学习框架，并且提供免费的 GPU 计算资源。 ... [详细]

蜡笔小新 2024-11-14 13:42:03
sum
Python 数据可视化实战指南

本文详细介绍如何使用 Python 进行数据可视化，涵盖从环境搭建到具体实例的全过程。 ... [详细]

蜡笔小新 2024-11-13 06:03:30
sum
机器学习的持续探索与进展

在机器学习领域，深入探讨了概率论与数理统计的基础知识，特别是这些理论在数据挖掘中的应用。文章重点分析了偏差（Bias）与方差（Variance）之间的平衡问题，强调了方差反映了不同训练模型之间的差异，例如在K折交叉验证中，不同模型之间的性能差异显著。此外，还讨论了如何通过优化模型选择和参数调整来有效控制这一平衡，以提高模型的泛化能力。 ... [详细]

蜡笔小新 2024-11-11 10:27:39
sum
神经网络在二分类任务中输出层应配置多少神经元及选择何种激活函数？处理MNIST数据集时输出层神经元数量与激活函数如何确定？神经网络预测房价时输出层神经元数量和激活函数的选择策略？

在神经网络进行二分类任务时，输出层应配置多少个神经元以及选择哪种激活函数是一个关键问题。对于MNIST数据集的处理，输出层的神经元数量和激活函数的选择策略是什么？而在预测房价的任务中，输出层的神经元数量和激活函数又该如何确定？本文将详细探讨这些选择背后的原理和实践建议，以帮助读者更好地理解和应用神经网络模型。 ... [详细]

蜡笔小新 2024-11-03 19:21:50
sum
视觉图像的生成机制与英文术语解析

近期，Google Brain、牛津大学和清华大学等多家研究机构相继发布了关于多层感知机（MLP）在视觉图像分类中的应用成果。这些研究深入探讨了MLP在视觉任务中的工作机制，并解析了相关技术术语，为理解视觉图像生成提供了新的视角和方法。 ... [详细]

蜡笔小新 2024-10-30 09:47:50
sum
特征工程入门指南：开启数据科学之旅

本文首次发布于“计算机视觉CV”微信公众号，旨在介绍特征工程的基础知识，引领读者步入数据科学领域。特征工程是机器学习流程中的关键步骤，它涉及将原始数据转换为能够更好地反映潜在问题结构的特征，从而提升模型的预测性能。通过精心设计的特征，机器学习算法能够更有效地从数据中提取有价值的信息，进而生成准确的预测或结论。 ... [详细]

蜡笔小新 2024-10-28 11:36:44
sum
如何在Linux系统中部署TensorFlow的详细指南

本文详细介绍了在Linux系统中部署TensorFlow的过程。作者基于北京大学曹建教授的MOOC课程进行学习，但由于课程内容较旧，环境配置方面遇到了不少挑战。经过多次尝试，最终成功解决了这些问题，并总结了一套详细的安装指南，帮助初学者快速上手TensorFlow。 ... [详细]

蜡笔小新 2024-10-24 13:06:19
bit
谷歌工程师：TensorFlow已重获新生；网友：我还是用PyTorch

乾明发自凹非寺量子位报道|公众号QbitAI道友留步！TensorFlow已重获新生。在“PyTorch真香”的潮流中，有人站出来为TensorFlow说话了。这次来自谷歌的工程师 ... [详细]

蜡笔小新 2024-10-23 20:28:50

销魂成浩龙_346

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章