当前位置: 开发笔记 > 编程语言 > 正文

python从图片里输出数据_详解如何从TensorFlow的mnist数据集导出手写体数字图片

作者：平头 | 来源：互联网 | 2023-06-16 18:11

在TensorFlow的官方入门课程中，多次用到mnist数据集。mnist数据集是一个数字手写体图片库，但它的存储格式并非常见的图片格式，

在TensorFlow的官方入门课程中&＃xff0c;多次用到mnist数据集。

mnist数据集是一个数字手写体图片库&＃xff0c;但它的存储格式并非常见的图片格式&＃xff0c;所有的图片都集中保存在四个扩展名为idx3-ubyte的二进制文件。

如果我们想要知道大名鼎鼎的mnist手写体数字都长什么样子&＃xff0c;就需要从mnist数据集中导出手写体数字图片。了解这些手写体的总体形状&＃xff0c;也有助于加深我们对TensorFlow入门课程的理解。

下面先给出通过TensorFlow api接口导出mnist手写体数字图片的python代码&＃xff0c;再对代码进行分析。代码在win7下测试通过&＃xff0c;linux环境也可以参考本处代码。

(非常良心的注释和打印有木有)

#!/usr/bin/python3.5

# -*- coding: utf-8 -*-

import os

import tensorflow as tf

from tensorflow.examples.tutorials.mnist import input_data

from PIL import Image

# 声明图片宽高

rows &＃61; 28

cols &＃61; 28

# 要提取的图片数量

images_to_extract &＃61; 8000

# 当前路径下的保存目录

save_dir &＃61; "./mnist_digits_images"

# 读入mnist数据

mnist &＃61; input_data.read_data_sets("MNIST_data/", one_hot&＃61;False)

# 创建会话

sess &＃61; tf.Session()

# 获取图片总数

shape &＃61; sess.run(tf.shape(mnist.train.images))

images_count &＃61; shape[0]

pixels_per_image &＃61; shape[1]

# 获取标签总数

shape &＃61; sess.run(tf.shape(mnist.train.labels))

labels_count &＃61; shape[0]

# mnist.train.labels是一个二维张量&＃xff0c;为便于后续生成数字图片目录名&＃xff0c;有必要一维化(后来发现只要把数据集的one_hot属性设为False&＃xff0c;mnist.train.labels本身就是一维)

#labels &＃61; sess.run(tf.argmax(mnist.train.labels, 1))

labels &＃61; mnist.train.labels

# 检查数据集是否符合预期格式

if (images_count &＃61;&＃61; labels_count) and (shape.size &＃61;&＃61; 1):

print ("数据集总共包含 %s 张图片&＃xff0c;和 %s 个标签" % (images_count, labels_count))

print ("每张图片包含 %s 个像素" % (pixels_per_image))

print ("数据类型&＃xff1a;%s" % (mnist.train.images.dtype))

# mnist图像数据的数值范围是[0,1]&＃xff0c;需要扩展到[0,255]&＃xff0c;以便于人眼观看

if mnist.train.images.dtype &＃61;&＃61; "float32":

print ("准备将数据类型从[0,1]转为binary[0,255]...")

for i in range(0,images_to_extract):

for n in range(pixels_per_image):

if mnist.train.images[i][n] !&＃61; 0:

mnist.train.images[i][n] &＃61; 255

# 由于数据集图片数量庞大&＃xff0c;转换可能要花不少时间&＃xff0c;有必要打印转换进度

if ((i&＃43;1)%50) &＃61;&＃61; 0:

print ("图像浮点数值扩展进度&＃xff1a;已转换 %s 张&＃xff0c;共需转换 %s 张" % (i&＃43;1, images_to_extract))

# 创建数字图片的保存目录

for i in range(10):

dir &＃61; "%s/%s/" % (save_dir,i)

if not os.path.exists(dir):

print ("目录 ""%s"" 不存在&＃xff01;自动创建该目录..." % dir)

os.makedirs(dir)

# 通过python图片处理库&＃xff0c;生成图片

indices &＃61; [0 for x in range(0, 10)]

for i in range(0,images_to_extract):

img &＃61; Image.new("L",(cols,rows))

for m in range(rows):

for n in range(cols):

img.putpixel((n,m), int(mnist.train.images[i][n&＃43;m*cols]))

# 根据图片所代表的数字label生成对应的保存路径

digit &＃61; labels[i]

path &＃61; "%s/%s/%s.bmp" % (save_dir, labels[i], indices[digit])

indices[digit] &＃43;&＃61; 1

img.save(path)

# 由于数据集图片数量庞大&＃xff0c;保存过程可能要花不少时间&＃xff0c;有必要打印保存进度

if ((i&＃43;1)%50) &＃61;&＃61; 0:

print ("图片保存进度&＃xff1a;已保存 %s 张&＃xff0c;共需保存 %s 张" % (i&＃43;1, images_to_extract))

else:

print ("图片数量和标签数量不一致&＃xff01;")

上述代码的实现思路如下&＃xff1a;

1.读入mnist手写体数据&＃xff1b;

2.把数据的值从[0,1]浮点范围转化为黑白格式(背景为0-黑色&＃xff0c;前景为255-白色)&＃xff1b;

3.根据mnist.train.labels的内容&＃xff0c;生成数字索引&＃xff0c;也就是建立每一张图片和其所代表数字的关联&＃xff0c;由此创建对应的保存目录&＃xff1b;

4.循环遍历mnist.train.images&＃xff0c;把每张图片的像素数据赋值给python图片处理库PIL的Image类实例&＃xff0c;再调用Image类的save方法把图片保存在第3步骤中创建的对应目录。

在运行上述代码之前&＃xff0c;你需要确保本地已经安装python的图片处理库PIL&＃xff0c;pip安装命令如下&＃xff1a;

pip3 install Pillow

或 pip install Pillow&＃xff0c;取决于你的pip版本。

上述python代码运行后&＃xff0c;在当前目录下会生成mnist_digits_images目录&＃xff0c;在该目录下&＃xff0c;可以看到如下内容&＃xff1a;

可以看到&＃xff0c;我们成功地生成了黑底白字的数字图片。

如果仔细观察这些图片&＃xff0c;会看到一些肉眼也难以分辨的数字&＃xff0c;譬如&＃xff1a;

上面这几个数字是2。想不到吧&＃xff1f;

下面这两个是5(看起来更像6)&＃xff1a;

这个是7&＃xff1a;(7长这样&＃xff1f;有句MMP不知当讲不当讲)

猜猜下面这个是什么&＃xff1a;

这是大写的L&＃xff1f;不是。

有点像1&＃xff0c;是1吗&＃xff1f;也不是。

倒立拉粑的7&＃xff1f;sorry&＃xff0c;又猜错了。

实话告诉您&＃xff0c;它是2&＃xff01;一开始我也是不相信的&＃xff0c;知道真相的那一刻我下巴差点掉下来&＃xff01;

这些手写图片&＃xff0c;一般人用肉眼观察&＃xff0c;识别率能达到98%就不错了&＃xff0c;但是通过TensorFlow搭建的卷积神经网络识别率可以达到99%&＃xff0c;非常地神奇&＃xff01;

以上就是本文的全部内容&＃xff0c;希望对大家的学习有所帮助&＃xff0c;也希望大家多多支持我们。

本文标题: 详解如何从TensorFlow的mnist数据集导出手写体数字图片

本文地址: http://www.cppcns.com/jiaoben/python/267585.html

推荐阅读

stream
如何将TS文件转换为M3U8直播流：HLS与M3U8格式详解

在视频传输领域，MP4虽然常见，但在直播场景中直接使用MP4格式存在诸多问题。例如，MP4文件的头部信息（如ftyp、moov）较大，导致初始加载时间较长，影响用户体验。相比之下，HLS（HTTP Live Streaming）协议及其M3U8格式更具优势。HLS通过将视频切分成多个小片段，并生成一个M3U8播放列表文件，实现低延迟和高稳定性。本文详细介绍了如何将TS文件转换为M3U8直播流，包括技术原理和具体操作步骤，帮助读者更好地理解和应用这一技术。 ... [详细]

蜡笔小新 2024-11-11 12:12:04
command
WinMain 函数详解及示例

本文详细介绍了 WinMain 函数的参数及其用途，并提供了一个具体的示例代码来解析 WinMain 函数的实现。 ... [详细]

蜡笔小新 2024-11-13 12:49:31
format
Python 序列图分割与可视化编程入门教程

本文介绍了如何使用 Python 进行序列图的快速分割与可视化。通过一个实际案例，详细展示了从需求分析到代码实现的全过程。具体包括如何读取序列图数据、应用分割算法以及利用可视化库生成直观的图表，帮助非编程背景的用户也能轻松上手。 ... [详细]

蜡笔小新 2024-11-11 07:14:26
main
（7）Python爬虫——爬取豆瓣电影Top250

利用python爬取豆瓣电影Top250的相关信息，包括电影详情链接,图片链接,影片中文名,影片外国名,评分,评价数,概况,导演,主演,年份,地区,类别这12项内容，然后将爬取的信息写入Exce ... [详细]

蜡笔小新 2024-11-13 11:35:24
main
macOS 上 Visual Studio Code 的安装与配置指南

Visual Studio Code (VSCode) 是一款功能强大的源代码编辑器，支持多种编程语言，具备丰富的扩展生态。本文将详细介绍如何在 macOS 上安装、配置并使用 VSCode。 ... [详细]

蜡笔小新 2024-11-12 19:45:55
format
使用多项式拟合分析淘宝双11销售趋势

根据天猫官方数据，2019年双11成交额达到2684亿元，再次刷新历史记录。本文通过多项式拟合方法，分析并预测未来几年的销售趋势。 ... [详细]

蜡笔小新 2024-11-12 16:57:26
format
利用REM实现移动端布局的高效适配技巧

在移动设备上实现高效布局适配时，使用rem单位已成为一种流行且有效的技术。本文将分享过去一年中使用rem进行布局适配的经验和心得。rem作为一种相对单位，能够根据根元素的字体大小动态调整，从而确保不同屏幕尺寸下的布局一致性。通过合理设置根元素的字体大小，开发者可以轻松实现响应式设计，提高用户体验。此外，文章还将探讨一些常见的问题和解决方案，帮助开发者更好地掌握这一技术。 ... [详细]

蜡笔小新 2024-11-11 19:11:53
go
大类|电阻器_使用Requests、Etree、BeautifulSoup、Pandas和Path库进行数据抓取与处理 | 将指定区域内容保存为HTML和Excel格式

大类|电阻器_使用Requests、Etree、BeautifulSoup、Pandas和Path库进行数据抓取与处理 | 将指定区域内容保存为HTML和Excel格式 ... [详细]

蜡笔小新 2024-11-11 19:05:59
go
技术日志：使用 Ruby 爬虫抓取拉勾网职位数据并生成词云分析报告

技术日志：使用 Ruby 爬虫抓取拉勾网职位数据并生成词云分析报告 ... [详细]

蜡笔小新 2024-11-07 14:33:19
format
【图像分类实战】利用DenseNet在PyTorch中实现秃头识别

本文详细介绍了如何使用DenseNet模型在PyTorch框架下实现秃头识别。首先，文章概述了项目所需的库和全局参数设置。接着，对图像进行预处理并读取数据集。随后，构建并配置DenseNet模型，设置训练和验证流程。最后，通过测试阶段验证模型性能，并提供了完整的代码实现。本文不仅涵盖了技术细节，还提供了实用的操作指南，适合初学者和有经验的研究人员参考。 ... [详细]

蜡笔小新 2024-11-06 15:21:35
format
中国学者实现 CNN 全程可视化，详尽展示每次卷积、ReLU 和池化过程

中国学者实现 CNN 全程可视化，详尽展示每次卷积、ReLU 和池化过程 ... [详细]

蜡笔小新 2024-11-03 13:52:28
process
Flowable 流程图路径与节点展示：已执行节点高亮红色标记，增强可视化效果

在Flowable流程图中，通常仅显示当前节点，而路径则需自行获取。特别是在多次驳回的情况下，节点可能会出现混乱。本文重点探讨了如何准确地展示流程图效果，包括已结束的流程和正在执行的流程。具体实现方法包括生成带有高亮红色标记的图片，以增强可视化效果，确保用户能够清晰地了解每个节点的状态。 ... [详细]

蜡笔小新 2024-11-11 10:46:10
format
使用Maven JAR插件将单个或多个文件及其依赖项合并为一个可引用的JAR包

本文介绍了如何利用Maven中的maven-assembly-plugin插件将单个或多个Java文件及其依赖项打包成一个可引用的JAR文件。首先，需要创建一个新的Maven项目，并将待打包的Java文件复制到该项目中。通过配置maven-assembly-plugin，可以实现将所有文件及其依赖项合并为一个独立的JAR包，方便在其他项目中引用和使用。此外，该方法还支持自定义装配描述符，以满足不同场景下的需求。 ... [详细]

蜡笔小新 2024-11-09 01:59:29
format
图像分类训练方案优化设计

针对图像分类任务的训练方案进行了优化设计。通过引入PyTorch等深度学习框架，利用其丰富的工具包和模块，如 `torch.nn` 和 `torch.nn.functional`，提升了模型的训练效率和分类准确性。优化方案包括数据预处理、模型架构选择和损失函数的设计等方面，旨在提高图像分类任务的整体性能。 ... [详细]

蜡笔小新 2024-11-07 16:45:46
php
ButterKnife的基础应用与实践指南

ButterKnife 是一款用于 Android 开发的注解库，主要用于简化视图和事件绑定。本文详细介绍了 ButterKnife 的基础用法，包括如何通过注解实现字段和方法的绑定，以及在实际项目中的应用示例。此外，文章还提到了截至 2016 年 4 月 29 日，ButterKnife 的最新版本为 8.0.1，为开发者提供了最新的功能和性能优化。 ... [详细]

蜡笔小新 2024-11-07 13:17:24

平头

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章