热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

python调用数据集mnist_pythonMNIST手写识别数据调用API的方法

MNIST数据集比较小,一般入门机器学习都会采用这个数据集来训练有4个有用的文件:train-images-idx3-ubyte:trainingset

MNIST数据集比较小,一般入门机器学习都会采用这个数据集来训练

有4个有用的文件:

train-images-idx3-ubyte: training set images

train-labels-idx1-ubyte: training set labels

t10k-images-idx3-ubyte: test set images

t10k-labels-idx1-ubyte: test set labels

The training set contains 60000 examples, and the test set 10000 examples. 数据集存储是用binary file存储的,黑白图片。

下面给出load数据集的代码:

import os

import struct

import numpy as np

import matplotlib.pyplot as plt

def load_mnist():

'''

Load mnist data

http://yann.lecun.com/exdb/mnist/

60000 training examples

10000 test sets

Arguments:

kind: 'train' or 'test', string charater input with a default value 'train'

Return:

xxx_images: n*m array, n is the sample count, m is the feature number which is 28*28

xxx_labels: class labels for each image, (0-9)

'''

root_path = '/home/cc/deep_learning/data_sets/mnist'

train_labels_path = os.path.join(root_path, 'train-labels.idx1-ubyte')

train_images_path = os.path.join(root_path, 'train-images.idx3-ubyte')

test_labels_path = os.path.join(root_path, 't10k-labels.idx1-ubyte')

test_images_path = os.path.join(root_path, 't10k-images.idx3-ubyte')

with open(train_labels_path, 'rb') as lpath:

# '>' denotes bigedian

# 'I' denotes unsigned char

magic, n = struct.unpack('>II', lpath.read(8))

#loaded = np.fromfile(lpath, dtype = np.uint8)

train_labels = np.fromfile(lpath, dtype = np.uint8).astype(np.float)

with open(train_images_path, 'rb') as ipath:

magic, num, rows, cols = struct.unpack('>IIII', ipath.read(16))

loaded = np.fromfile(train_images_path, dtype = np.uint8)

# images start from the 16th bytes

train_images = loaded[16:].reshape(len(train_labels), 784).astype(np.float)

with open(test_labels_path, 'rb') as lpath:

# '>' denotes bigedian

# 'I' denotes unsigned char

magic, n = struct.unpack('>II', lpath.read(8))

#loaded = np.fromfile(lpath, dtype = np.uint8)

test_labels = np.fromfile(lpath, dtype = np.uint8).astype(np.float)

with open(test_images_path, 'rb') as ipath:

magic, num, rows, cols = struct.unpack('>IIII', ipath.read(16))

loaded = np.fromfile(test_images_path, dtype = np.uint8)

# images start from the 16th bytes

test_images = loaded[16:].reshape(len(test_labels), 784)

return train_images, train_labels, test_images, test_labels

再看看图片集是什么样的:

def test_mnist_data():

'''

Just to check the data

Argument:

none

Return:

none

'''

train_images, train_labels, test_images, test_labels = load_mnist()

fig, ax = plt.subplots(nrows = 2, ncols = 5, sharex = True, sharey = True)

ax =ax.flatten()

for i in range(10):

img = train_images[i][:].reshape(28, 28)

ax[i].imshow(img, cmap = 'Greys', interpolation = 'nearest')

print('corresponding labels = %d' %train_labels[i])

if __name__ == '__main__':

test_mnist_data()

跑出的结果如下:

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。



推荐阅读
  • 本文介绍如何使用Objective-C结合dispatch库进行并发编程,以提高素数计数任务的效率。通过对比纯C代码与引入并发机制后的代码,展示dispatch库的强大功能。 ... [详细]
  • UNP 第9章:主机名与地址转换
    本章探讨了用于在主机名和数值地址之间进行转换的函数,如gethostbyname和gethostbyaddr。此外,还介绍了getservbyname和getservbyport函数,用于在服务器名和端口号之间进行转换。 ... [详细]
  • 扫描线三巨头 hdu1928hdu 1255  hdu 1542 [POJ 1151]
    学习链接:http:blog.csdn.netlwt36articledetails48908031学习扫描线主要学习的是一种扫描的思想,后期可以求解很 ... [详细]
  • 本文深入探讨了C++对象模型中的一些细节问题,特别是虚拟继承和析构函数的处理。通过具体代码示例和详细分析,揭示了书中某些观点的不足之处,并提供了更合理的解释。 ... [详细]
  • 深入理解Redis的数据结构与对象系统
    本文详细探讨了Redis中的数据结构和对象系统的实现,包括字符串、列表、集合、哈希表和有序集合等五种核心对象类型,以及它们所使用的底层数据结构。通过分析源码和相关文献,帮助读者更好地理解Redis的设计原理。 ... [详细]
  • 本文深入探讨了HTTP请求和响应对象的使用,详细介绍了如何通过响应对象向客户端发送数据、处理中文乱码问题以及常见的HTTP状态码。此外,还涵盖了文件下载、请求重定向、请求转发等高级功能。 ... [详细]
  • 本文将介绍如何编写一些有趣的VBScript脚本,这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例,帮助您了解VBScript的基本语法和功能。 ... [详细]
  • 导航栏样式练习:项目实例解析
    本文详细介绍了如何创建一个具有动态效果的导航栏,包括HTML、CSS和JavaScript代码的实现,并附有详细的说明和效果图。 ... [详细]
  • 本文介绍了如何使用JQuery实现省市二级联动和表单验证。首先,通过change事件监听用户选择的省份,并动态加载对应的城市列表。其次,详细讲解了使用Validation插件进行表单验证的方法,包括内置规则、自定义规则及实时验证功能。 ... [详细]
  • 从 .NET 转 Java 的自学之路:IO 流基础篇
    本文详细介绍了 Java 中的 IO 流,包括字节流和字符流的基本概念及其操作方式。探讨了如何处理不同类型的文件数据,并结合编码机制确保字符数据的正确读写。同时,文中还涵盖了装饰设计模式的应用,以及多种常见的 IO 操作实例。 ... [详细]
  • 基于KVM的SRIOV直通配置及性能测试
    SRIOV介绍、VF直通配置,以及包转发率性能测试小慢哥的原创文章,欢迎转载目录?1.SRIOV介绍?2.环境说明?3.开启SRIOV?4.生成VF?5.VF ... [详细]
  • 毕业设计:基于机器学习与深度学习的垃圾邮件(短信)分类算法实现
    本文详细介绍了如何使用机器学习和深度学习技术对垃圾邮件和短信进行分类。内容涵盖从数据集介绍、预处理、特征提取到模型训练与评估的完整流程,并提供了具体的代码示例和实验结果。 ... [详细]
  • 本题旨在通过给定的评级信息,利用拓扑排序和并查集算法来确定全球 Tetris 高手排行榜。题目要求判断是否可以根据提供的信息生成一个明确的排名表,或者是否存在冲突或信息不足的情况。 ... [详细]
  • 本文将深入探讨如何在不依赖第三方库的情况下,使用 React 处理表单输入和验证。我们将介绍一种高效且灵活的方法,涵盖表单提交、输入验证及错误处理等关键功能。 ... [详细]
  • 开发笔记:2020 BJDCTF Re encode
    开发笔记:2020 BJDCTF Re encode ... [详细]
author-avatar
版中凌菱
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有