tensorflow实现简单的softmat分类器

作者：mobiledu2502936307 | 来源：互联网 | 2023-09-08 14:54

softmax分类器这篇文章介绍如何使用一个简单的多层感知机和softmax分类器对MNIST数据集进行分类。1.使用内建的函数加载MNIST数据fromtensorflow

softmax分类器

这篇文章介绍如何使用一个简单的多层感知机和softmax分类器对MNIST数据集进行分类。

1. 使用内建的函数加载MNIST数据

from tensorflow.examples.tutorials.mnist import input_data mnist &＃61; input_data.read_data_sets(&＃39;MNIST_data&＃39;, one_hot&＃61;True)

2. 理解输入数据集

&＃xff08;1&＃xff09;独热码形式表示label
&＃xff08;2&＃xff09;训练集&＃xff0c;验证集和测试集

- 55,000 data points - mnist.train.images for inputs - mnist.train.labels for outputs ---------------------------------------- - 5,000 data points - mnist.validation.images for inputs - mnist.validation.labels for outputs ----------------------------------------- -10,000 data points - mnist.test.images for inputs - mnist.test.labels for outputs

3. 创建一个交互式的会话

在Tensorflow中可以使用2找个基本的方式运行代码。
一种是把图都构建好了之后才创建会话执行张量和运行计算。
另外一种是交互式会话方式&＃xff0c;创建代码时随意执行。
这里创建一个交互式的会话, 注意&＃xff1a;当执行完后要关闭会话。

sess &＃61;tf.InteractiveSession()

4. 创建占位符(placeholder)

在Tensorflow中&＃xff0c;在给变量赋值之前要先创建占位符。这里我们为输入”Xs”和输出”Ys”创建占位符。

占位符x表示分配给输入的”空间”:

这里的每一个输入有28*28 &＃61; 784个像素&＃xff1b;
placeholder中变量“shape”用于定义张量的大小&＃xff0c;格式为shape&＃61;[d1&＃xff0c;d2]&＃xff1b;
d1 &＃61; None 表示批的输入可以为任意大小&＃xff1b;
d2 &＃61; 784表示一个训练样本的像素个数。

占位符y表示最终的输出或者label&＃xff1a;

10 个可能的输出类别
placeholder中变量“shape”用于定义张量的大小&＃xff0c;格式为shape&＃61;[d1&＃xff0c;d2]&＃xff1b;
d1 &＃61; None 表示批的输入可以为任意大小&＃xff1b;
d2 &＃61; 10 表示输出的个数。

占位符的类型(dtype)一般使用tf.float32或者tf.float64.

x &＃61; tf.placeholder(tf.float32, shape &＃61; [None, 784] y &＃61; tf.placeholder(tf.float32, shape &＃61; [None, 10]

5. 分配偏置和权重到空的张量

创建标量的时候需要给这个变量一个初值&＃xff0c;当然这个初值还没有生效&＃xff0c;只有执行初始化时才会生效。
初值全部设置为0。
初值的选取是十分重要的&＃xff0c;但是这里只是示范&＃xff0c;为了简单起见全部设置为零。

# Weight tensor W &＃61; tf.Variable(tf.zeros([784,10],tf.float32)) # Bias tensor b &＃61; tf.Variable(tf.zeros([10],tf.float32))

6. 执行赋值操作

上面我们只是给分配权重和偏置&＃xff0c;但是还没有初始化。
因为我们创建的是一个交互式的会话&＃xff0c;所以在创建会话后任何地方执行run.sess()都可以。
执行tf.global_variables_initializer()初始化变量。

sess.run(tf.global_variables_initializer())

7. 添加权重和偏置到输入

如下如&＃xff0c;我们将输入与权重相乘在加上偏置就得到输出。
注意&＃xff1a;这里并没有使用激活函数。

tf.matmul(x,w) &＃43; b

8. softmax 回归

分类问题中常常使用softmax分类器解决分类问题。他能产生一个概率输出。在这个例子中&＃xff0c;我们的模型不会提供一个100%确定的输出&＃xff0c;而是一个概率分布&＃xff0c;比如模型是正确的&＃xff0c;对应某个输入&＃xff0c;输出的结果概率就会比较大。
比如输入数字9&＃xff0c;输出有很大概率是9.

0 -->.0.1% 1 -->...2% 2 -->...3% 3 -->...2% 4 -->..12% 5 -->..10% 6 -->..57% 7 -->..20% 8 -->..55% 9 -->..80%

9. 损失函数

用于最小化预测结果和真实结果的误差。
这里使用的是交叉熵。

cross_entropy &＃61; tf.reduce_mean(-tf.reduce_sum(y_*log(y),reduction_indices&＃61;[1]))

10. 优化方法

Tensorflow集成许多优化方法&＃xff0c;如SGD, Adam&＃xff0c; RMSqr&＃xff0c;Momentum等。
这里使用梯度下降&＃xff1a;

train_step &＃61; tf.train.GradientDescentOptimizer(0.5).minimize(cross_entropy)

11. 训练批大小的设置

由于批梯度下降太过耗费计算资源&＃xff0c;所以不常用。
所谓批梯度下降就是一次使用所有的数据作为输入&＃xff0c;去训练模型。
因此&＃xff0c;常用的是mini-batch梯度下降。
通过选择合适的nimi-batch&＃xff0c;能够快速地训练网络。

for i in range(1000):batch &＃61; mnist.train.next_batch(50)train_step.run(feed_dict&＃61;{x:batch[0], y_:batch[1]})

12. 测试

correct_prediction &＃61; tf.equal(tf.argmax(y,1), tf.argmax(y_,1)) accuracy &＃61; tf.reduce_mean(tf.cast(correct_prediction, tf.float32)) acc &＃61; accuracy.eval(feed_dict&＃61;{x:mnist.test.images, y_:mnist.test.labels})*100 print("The final accuracy for the simple ANN model is: {} % ".format(acc))

13. 关闭会话

sess.close()

完整代码及运行结果

import tensorflow as tf # import MNIST dataset using tensoflow build-in function from tensorflow.examples.tutorials.mnist import input_data mnist &＃61; input_data.read_data_sets(&＃39;MNIST_data&＃39;, one_hot&＃61;True)# creating a interactive session sess &＃61; tf.InteractiveSession()# creating placeholder for input and output x &＃61; tf.placeholder(tf.float32, shape &＃61; [None, 784]) y_ &＃61; tf.placeholder(tf.float32, shape&＃61;[None, 10])# assign bias and weight to null tensors w &＃61; tf.Variable(initial_value&＃61;tf.zeros([784,10], dtype&＃61;tf.float32)) b &＃61; tf.Variable(initial_value&＃61;tf.zeros([10],dtype&＃61;tf.float32))#excute the assignment operation sess.run(tf.global_variables_initializer())# softmax regression y &＃61; tf.nn.softmax(tf.matmul(x,w) &＃43; b)# cost function cross_entropy &＃61; tf.reduce_mean(-tf.reduce_sum(y_*tf.log(y), reduction_indices&＃61;[1]))# optimizaiton train_step &＃61; tf.train.GradientDescentOptimizer(0.5).minimize(cross_entropy)# mini- batch setting for i in range(1000):batch &＃61; mnist.train.next_batch(50)train_step.run(feed_dict&＃61;{x:batch[0], y_:batch[1]})# test correct_prediction &＃61; tf.equal(tf.argmax(y,1), tf.argmax(y_,1)) accuracy &＃61; tf.reduce_mean(tf.cast(correct_prediction, tf.float32)) acc &＃61; accuracy.eval(feed_dict&＃61;{x:mnist.test.images, y_:mnist.test.labels})*100 print("The final accuracy for the simple ANN model is: {} % ".format(acc))# close session sess.close()

结果&＃xff1a;

The final accuracy for the simple ANN model is: 90.75000286102295 %

译自 Deep Learning with TensorFlow IBM Cognitive Class ML0120EN
ML0120EN-2.2-Review-CNN-MNIST-Dataset 1st part: classify MNIST using a simple model.

推荐阅读

list
普通树(每个节点可以有任意数量的子节点)级序遍历

普通树(每个节点可以有任意数量的子节点)级序遍历 ... [详细]

蜡笔小新 2024-11-14 18:53:26
go
c/c++常用代码doc,ppt,xls文件格式转PDF格式[转]

[转]doc,ppt,xls文件格式转PDF格式http:blog.csdn.netlee353086articledetails7920355确实好用。需要注意的是#import ... [详细]

蜡笔小新 2024-11-12 16:19:40
数组
自然语言处理(NLP)——LDA模型:对电商购物评论进行情感分析

目录一、2020数学建模美赛C题简介需求评价内容提供数据二、解题思路三、LDA简介四、代码实现1.数据预处理1.1剔除无用信息1.1.1剔除掉不需要的列1.1.2找出无效评论并剔除 ... [详细]

蜡笔小新 2024-11-14 18:21:21
go
pytorch(一)：torch构建数据集并训练一个神经网络

目录预备知识导包构建数据集神经网络结构训练测试精度可视化计算模型精度损失可视化输出网络结构信息训练神经网络定义参数载入数据载入神经网络结构、损失及优化训练及测试损失、精度可视化qu ... [详细]

蜡笔小新 2024-11-14 13:06:38
list
Android Studio SQLite 数据库增删改查简单（代码参考）

一个建表一个执行crud操作建表代码importandroid.content.Context;importandroid.database.sqlite.SQLiteDat ... [详细]

蜡笔小新 2024-11-14 11:01:49
datetime
Python多进程高效读取超大文件的技巧

本文详细介绍了如何使用Python的多进程技术来高效地分块读取超大文件，并将其输出为多个文件。通过这种方式，可以显著提高读取速度和处理效率。 ... [详细]

蜡笔小新 2024-11-14 10:59:08
list
MySQL初级篇——字符串、日期时间、流程控制函数的相关应用

文章目录：1.字符串函数2.日期时间函数2.1获取日期时间2.2日期与时间戳的转换2.3获取年月日、时分秒、星期数、天数等函数2.4时间和秒钟的转换2. ... [详细]

蜡笔小新 2024-11-14 10:57:02
list
第十九天 - 类的约束、异常处理与日志记录

本文介绍了如何通过类的约束来确保代码的一致性，以及如何使用异常处理和日志记录来提高代码的健壮性和可维护性。具体包括抛出异常、使用抽象类和方法，以及异常处理和日志记录的详细示例。 ... [详细]

蜡笔小新 2024-11-14 06:38:46
python
使用多项式拟合分析淘宝双11销售趋势

根据天猫官方数据，2019年双11成交额达到2684亿元，再次刷新历史记录。本文通过多项式拟合方法，分析并预测未来几年的销售趋势。 ... [详细]

蜡笔小新 2024-11-12 16:57:26
list
使用Python爬取妙笔阁小说信息并保存为TXT和CSV格式

本文介绍了如何使用Python爬取妙笔阁小说网仙侠系列中所有小说的信息，并将其保存为TXT和CSV格式。主要内容包括如何构造请求头以避免被网站封禁，以及如何利用XPath解析HTML并提取所需信息。 ... [详细]

蜡笔小新 2024-11-14 19:54:58
char
Spring Boot 中使用 spring-boot-starter-quartz 实现定时任务

本文介绍了如何在 Spring Boot 项目中使用 spring-boot-starter-quartz 组件实现定时任务，并将 cron 表达式存储在数据库中，以便动态调整任务执行频率。 ... [详细]

蜡笔小新 2024-11-14 18:55:09
get
ASP.NET 中操作 Excel 的常见方法和属性

本文介绍了如何在 ASP.NET 中设置 Excel 单元格格式为文本，获取多个单元格区域并作为表头，以及进行单元格合并、赋值、格式设置等操作。 ... [详细]

蜡笔小新 2024-11-13 19:46:18
export
日志处理流程：Flume+MapReduce+Hive+Sqoop+MySQL

本文介绍了如何使用Flume从Linux文件系统收集日志并存储到HDFS，然后通过MapReduce清洗数据，使用Hive进行数据分析，并最终通过Sqoop将结果导出到MySQL数据库。 ... [详细]

蜡笔小新 2024-11-13 18:47:34
list
（7）Python爬虫——爬取豆瓣电影Top250

利用python爬取豆瓣电影Top250的相关信息，包括电影详情链接,图片链接,影片中文名,影片外国名,评分,评价数,概况,导演,主演,年份,地区,类别这12项内容，然后将爬取的信息写入Exce ... [详细]

蜡笔小新 2024-11-13 11:35:24
grid
在AX2012中使用自定义查询在数据网格视图中显示数据

本文介绍了如何在AX2012中通过自定义查询在数据网格视图中显示所有记录的方法。 ... [详细]

蜡笔小新 2024-11-12 12:02:50

mobiledu2502936307

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章