当前位置: 开发笔记 > 编程语言 > 正文

keras实现mnist手写数字识别

作者：UP向日葵氵于磊Z | 来源：互联网 | 2023-07-10 17:04

卷积神经网络实现这个代码的话是跟着B站博主敲得里面也解析了代码想深入了解的可以看看链接地址一.实验目的利用keras的深度学习框架，分类mnist手写数字识别数

卷积神经网络实现

这个代码的话是跟着B站博主敲得里面也解析了代码想深入了解的可以看看
链接地址

一. 实验目的

利用keras的深度学习框架&＃xff0c;分类mnist手写数字识别数据集

二. 实验内容

1.获得mnist数据&＃xff0c;并将mnist数据处理成合适的格式;
2.构建神经网络模型:
3.配置训练参数&＃xff1b;
4.训练网络&＃xff1b;
5.测试训练好的网络模型

三.概要设计

1.实验原理
①获得mnist数据&＃xff0c;并将数据处理成合适的格式:
首先查看数据集是怎样的&＃xff0c;让图片由二维铺开成一维&＃xff0c;相当于将图片从二维矩阵&＃xff08;28*28&＃xff09;到784像素值的一个向量&＃xff0c;同时将数据格式转换为浮点型;
②按照自己的设计搭建神经网络&＃xff1a;
在这里插入图片描述
③设定合适的参数训练神经网络:
a.编译&＃xff1a;确定优化器和损失函数;
b.训练网络&＃xff1a;确定训练的数据、训练的轮数和每次训练的样本数等&＃xff1b;
④在测试集上评价训练效果&＃xff1a;
a.利用损失函数变化和训练集的准确率评估它在数据集上的表现&＃xff1a;
损失函数逐渐下降&＃xff0c;训练集的准确率逐渐提升;
b.用训练好的模型进行预测&＃xff0c;并在测试集上进行评价。
2&＃xff0e;网络作用
神经网络是机器学习诸多算法中的一种&＃xff0c;它既可以用来做有监督的任务&＃xff0c;如分类、视觉识别等&＃xff0c;也可以用作无监督的任务。同时它能够处理复杂的非线性问题&＃xff0c;它的基本结构是神经元。&＃xff0c;如下图所示&＃xff1a; 在这里插入图片描述
其中&＃xff0c;x1、x2、x3代表输入&＃xff0c;中间部分为神经元&＃xff0c;而最后的hw,b(x)是神经元的输出。整个过程可以理解为输入——>处理——>输出。
由多个神经元组成的就是神经网络

如图所示&＃xff1a;
这是一个4层结构的神经网络&＃xff0c;layer1为输入层&＃xff0c;layer4为输出层&＃xff0c;layer2,layer3为隐藏层&＃xff0c;即神经网络的结构由输入层&＃xff0c;隐藏层&＃xff0c;输出层构成。其中除了输入层以外&＃xff0c;每一层的输入都是上一层的输出。
而现在所用的卷积神经网络是一种深度学习模型或类似于人工神经网络的多层感知器&＃xff0c;常用来分析视觉图像。卷积神经网络能够接受多个特征图作为输入&＃xff0c;而不是向量。
3&＃xff0e;各个网络层的功能描述
第一层——输入层&＃xff1a;
输入层每个神经单元直接对应原始数据&＃xff0c;然后向隐藏层提供信息&＃xff0c;图片的每一个像素都需要输入层神经元与之对应&＃xff0c;对原始图像数据进行预处理&＃xff0c;而我们的每个图片大小包含784像素&＃xff0c;输入层需要784个神经元&＃xff1b;
第二层——隐藏层&＃xff08;中间层&＃xff09;&＃xff1a;
隐藏层每个神经单元对不同的输入层神经单元有不同的权重&＃xff0c;从而偏向于对某种识别模式兴奋&＃xff0c;隐藏层为15个神经元&＃xff1b;
第三层——输出层&＃xff1a;
多个隐藏层的神经单元兴奋后&＃xff0c;输出层的神经单元根据不同隐藏层的兴奋加上权重后&＃xff0c;给到不同的兴奋度&＃xff0c;这个兴奋度就是模型最终识别的结果&＃xff0c;它的神经元个数是确定的&＃xff0c;一共为10类&＃xff0c;10个神经元

四&＃xff0e;详细设计

1&＃xff0e;网络结构图
&＃xff08;用 print(network.summary()) 打印&＃xff09;
在这里插入图片描述

2&＃xff0e;各个参数设计

①修改训练集及测试集的图片(28*28像素)从二维矩阵到一维向量:
train_images &＃61; train_images.reshape((60000, 28, 28, 1)).astype(‘float’) / 255
test_images &＃61; test_images.reshape((10000, 28, 28, 1)).astype(‘float’) / 255
将数据格式转换为浮点型
②训练网络参数:
network.fit(train_images, train_labels, epochs&＃61;10, batch_size&＃61;128, verbose&＃61;2)
epochs:训练多少个回合&＃xff0c;
batch_size:每次训练给多大的数据
verbose &＃61; 2 为每个epoch输出一行记录
③变量类型及大小:
在这里插入图片描述

五&＃xff0e;测试数据及运行结果

1&＃xff0e;正常测试数据和运行结果
①取前五个图片进行预测(结果正常):
在这里插入图片描述
②取前10个图片进行预测(结果正常)&＃xff1a;

在这里插入图片描述

3&＃xff0e;实验结果分析
通过多轮测试集的测试,发现训练效果基本符合,并且打印出训练集和测试集的准确率发现拟合基本相符,准确率如图所示:
在这里插入图片描述

六&＃xff0e;调试情况&＃xff0c;设计技巧及体会

1&＃xff0e;改进方案
①实验一开始训练集和测试集的准确率低:原来隐藏层个数为15,现在增加到84;
②训练集比测试集拟合的更好:使用正则化 dropout解决
2&＃xff0e;体会
一开始根据老师发的教程进行安装&＃xff0c;发现运行起来导入库的速度较慢&＃xff0c;于是在网上搜索发现Anaconda是一个集成库&＃xff0c;于是便开始了安装它&＃xff0c;过程比较艰辛&＃xff0c;索性安装成功了&＃xff0c;最后跑代码的结果很快。
在运行代码的过程中&＃xff0c;发现版本更新运行后代码也发生了相应的变化&＃xff0c;对此进行了改进。本次应用的是卷积神经网络&＃xff0c;它常用来分析视觉图像&＃xff0c;十分符合我们这次的实验要求。每次不同的课题&＃xff0c;我们对网络模型的选择也是非常重要的。
这个实验我们在课上做了两三次&＃xff0c;每次运行代码都会有新的改进收获匪浅。通过CSDN博客&＃xff0c;我学习到了tensorflow框架的基本使用方法&＃xff0c;通过python和tensorflow进行了神经网络的构造和实现&＃xff0c;并通过神经网络实现了手写数字识别的功能。
通过这次实验&＃xff0c;我觉得机器学习是个特别有意思的学科&＃xff0c;可以进行爬虫和数据预测等&＃xff0c;通过自己的努力看到实验的准确率稳步上升&＃xff0c;成就感满满。在以后的学习生活中&＃xff0c;我会以更大的兴趣投入其中&＃xff0c;并深入学习神经网络的内容。fighting!!!

代码实现&＃xff1a;

from tensorflow.keras.utils import to_categorical from tensorflow.keras import models, layers from tensorflow.keras.optimizers import RMSprop from tensorflow.keras.datasets import mnist # 加载数据集 (train_images, train_labels), (test_images, test_labels) &＃61; mnist.load_data()# 搭建LeNet网络神经网络的模型 def LeNet():network &＃61; models.Sequential()network.add(layers.Conv2D(filters&＃61;6, kernel_size&＃61;(3, 3), activation&＃61;&＃39;relu&＃39;, input_shape&＃61;(28, 28, 1)))network.add(layers.AveragePooling2D((2, 2)))network.add(layers.Conv2D(filters&＃61;16, kernel_size&＃61;(3, 3), activation&＃61;&＃39;relu&＃39;))network.add(layers.AveragePooling2D((2, 2)))network.add(layers.Conv2D(filters&＃61;120, kernel_size&＃61;(3, 3), activation&＃61;&＃39;relu&＃39;))network.add(layers.Flatten())network.add(layers.Dense(84, activation&＃61;&＃39;relu&＃39;))network.add(layers.Dense(10, activation&＃61;&＃39;softmax&＃39;))return network network &＃61; LeNet() network.compile(optimizer&＃61;RMSprop(lr&＃61;0.001), loss&＃61;&＃39;categorical_crossentropy&＃39;, metrics&＃61;[&＃39;accuracy&＃39;])#将图片由二维铺开成一维&＃xff08;相当于将图片从二维矩阵到一维向量&＃xff09; train_images &＃61; train_images.reshape((60000, 28, 28, 1)).astype(&＃39;float&＃39;) / 255 test_images &＃61; test_images.reshape((10000, 28, 28, 1)).astype(&＃39;float&＃39;) / 255 train_labels &＃61; to_categorical(train_labels) test_labels &＃61; to_categorical(test_labels) print(test_labels[0]) # 训练网络&＃xff0c;用fit函数, epochs表示训练多少个回合&＃xff0c; batch_size表示每次训练给多大的数据 network.fit(train_images, train_labels, epochs&＃61;10, batch_size&＃61;1280, verbose&＃61;2)#print(network.summary()) #测试集测试模型性能取前五张图片 y_pre &＃61; network.predict(test_images[:10]) print(y_pre,test_labels[:10]) test_loss, test_accuracy &＃61; network.evaluate(test_images, test_labels) print("test_loss:", test_loss, " test_accuracy:", test_accuracy)

推荐阅读

import
利用决策树预测NBA比赛胜负的Python数据挖掘实践

本文通过使用2013-14赛季NBA赛程与结果数据集以及2013年NBA排名数据，结合《Python数据挖掘入门与实践》一书中的方法，展示如何应用决策树算法进行比赛胜负预测。我们将详细讲解数据预处理、特征工程及模型评估等关键步骤。 ... [详细]

蜡笔小新 2024-12-23 09:07:40
byte
深入理解org.neo4j.helpers.collection.Iterators.single()方法及其应用

本文详细介绍了Java中org.neo4j.helpers.collection.Iterators.single()方法的功能、使用场景及代码示例，帮助开发者更好地理解和应用该方法。 ... [详细]

蜡笔小新 2024-12-28 10:51:55
import
技术分享：从动态网站提取站点密钥的解决方案

本文探讨了如何从动态网站中提取站点密钥，特别是针对验证码（reCAPTCHA）的处理方法。通过结合Selenium和requests库，提供了详细的代码示例和优化建议。 ... [详细]

蜡笔小新 2024-12-28 04:11:47
string
Java面试题解析

本文详细介绍了Java编程语言中的核心概念和常见面试问题，包括集合类、数据结构、线程处理、Java虚拟机（JVM）、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题，帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]

蜡笔小新 2024-12-27 13:55:14
ip
360SRC安全应急响应：从漏洞提交到修复的全过程

本文详细介绍了360SRC平台处理一起关键安全事件的过程，涵盖从漏洞提交、验证、排查到最终修复的各个环节。通过这一案例，展示了360在安全应急响应方面的专业能力和严谨态度。 ... [详细]

蜡笔小新 2024-12-27 11:10:05
php
macOS系统及其关键功能解析

本文详细介绍了macOS系统的核心组件，包括如何管理其安全特性——系统完整性保护（SIP），并探讨了不同版本的更新亮点。对于使用macOS系统的用户来说，了解这些信息有助于更好地管理和优化系统性能。 ... [详细]

蜡笔小新 2024-12-26 18:05:04
byte
从 .NET 转 Java 的自学之路：IO 流基础篇

本文详细介绍了 Java 中的 IO 流，包括字节流和字符流的基本概念及其操作方式。探讨了如何处理不同类型的文件数据，并结合编码机制确保字符数据的正确读写。同时，文中还涵盖了装饰设计模式的应用，以及多种常见的 IO 操作实例。 ... [详细]

蜡笔小新 2024-12-26 17:37:25
php
MicroATX与MATX：主板规格详解

本文详细介绍了MicroATX（也称Mini ATX）和MATX主板规格，探讨了它们的结构特点、应用场景及对电脑系统成本和性能的影响。同时，文章还涵盖了相关操作系统的实用技巧，如蓝牙设备图标删除、磁盘管理等。 ... [详细]

蜡笔小新 2024-12-25 18:53:29
import
毕业设计：基于机器学习与深度学习的垃圾邮件（短信）分类算法实现

本文详细介绍了如何使用机器学习和深度学习技术对垃圾邮件和短信进行分类。内容涵盖从数据集介绍、预处理、特征提取到模型训练与评估的完整流程，并提供了具体的代码示例和实验结果。 ... [详细]

蜡笔小新 2024-12-25 17:38:50
import
使用 Bokeh 在 Python 中绘制菱形标记

本文介绍了如何使用 Python 的 Bokeh 库在图表上绘制菱形标记。Bokeh 是一个强大的交互式数据可视化工具，支持丰富的图形自定义选项。 ... [详细]

蜡笔小新 2024-12-25 15:53:56
text
在Xcode中配置自定义文本样式

本文探讨了如何在iOS开发环境中，特别是在Xcode 6.1中，设置和应用自定义文本样式。我们将详细介绍实现方法，并提供一些实用的技巧。 ... [详细]

蜡笔小新 2024-12-23 14:36:31
import
社交网络中的级联行为

社交网络中的级联行为 ... [详细]

蜡笔小新 2024-12-22 16:47:55
import
利用CIFAR10数据集快速掌握Mixup数据增强技术，显著提高图像分类精度

通过使用CIFAR-10数据集，本文详细介绍了如何快速掌握Mixup数据增强技术，并展示了该方法在图像分类任务中的显著效果。实验结果表明，Mixup能够有效提高模型的泛化能力和分类精度，为图像识别领域的研究提供了有价值的参考。 ... [详细]

蜡笔小新 2024-11-05 14:24:36
text
MySQL索引详解及其优化策略

本文详细解析了MySQL索引的概念、数据结构及管理方法，并探讨了如何正确使用索引以提升查询性能。文章还深入讲解了联合索引与覆盖索引的应用场景，以及它们在优化数据库性能中的重要作用。此外，通过实例分析，进一步阐述了索引在高读写比系统中的必要性和优势。 ... [详细]

蜡笔小新 2024-11-05 10:36:17
ip
深入探讨JVM高级特性：即时编译技术解析

在启用分层编译的情况下，即时编译器（JIT）的触发条件涉及多个因素，包括方法调用频率、代码复杂度和运行时性能数据。本文将详细解析这些条件，并探讨分层编译如何优化JVM的执行效率。 ... [详细]

蜡笔小新 2024-10-28 20:38:58

UP向日葵氵于磊Z

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章