Tensorflow快餐教程(11)-不懂机器学习就只调API行不行？

作者：血色的蓮花 | 来源：互联网 | 2023-09-10 11:35

高层封装API有同学问，我们学习Tensorflow就是想学习一套可以用的套，像编程一样调用就行了，不想学习机器学习的细节，有没有这样的方式？针对于已经有成熟解决方案的模型，why

高层封装API
有同学问，我们学习Tensorflow就是想学习一套可以用的套，像编程一样调用就行了，不想学习机器学习的细节，有没有这样的方式？

针对于已经有成熟解决方案的模型，why not呢？
在前面已经快速将CNN, RNN的大致概念和深度学习的简史走马观花过了一遍之后，我们就可以开始尝试使用高层封装的API。

模型 - 训练 - 评估三条语句搞定

既然高层封装，我们就采用最简单的方式：首先是一个模型，然后就开始训练，最后评估一下效果如何。

我们还是举祖传的MNIST的例子。
核心三条语句，一句模型，一句训练，一句评估：

estimator = tf.estimator.LinearClassifier(feature_columns=[image_column], n_classes=10)

# Train.
estimator.train(input_fn=train_input_fn, steps=2000)

# Evaluate and report metrics.
eval_metrics = estimator.evaluate(input_fn=eval_input_fn, steps=1)

我们首先知道MNIST是把手写图像分成十类，那么就用个线性回归分类器，指定分成10类：

estimator = tf.estimator.LinearClassifier(feature_columns=[image_column], n_classes=10)

训练也是无脑的，指定训练多少步就是了：

estimator.train(input_fn=train_input_fn, steps=2000)

评估也不需要懂啥，给个测试集就是了：

eval_metrics = estimator.evaluate(input_fn=eval_input_fn, steps=1)

给大家一个完整能运行的例子，主要的工作量都在处理输入数据上，真正有功能的就是那三条语句：

import numpy as np
import tensorflow as tf

def get_input_fn(dataset_split, batch_size, capacity=10000, min_after_dequeue=3000):

  def _input_fn():
    images_batch, labels_batch = tf.train.shuffle_batch(
        tensors=[dataset_split.images, dataset_split.labels.astype(np.int32)],
        batch_size=batch_size,
        capacity=capacity,
        min_after_dequeue=min_after_dequeue,
        enqueue_many=True,
        num_threads=4)
    features_map = {'images': images_batch}
    return features_map, labels_batch

  return _input_fn

data = tf.contrib.learn.datasets.mnist.load_mnist()

train_input_fn = get_input_fn(data.train, batch_size=256)
eval_input_fn = get_input_fn(data.validation, batch_size=5000)

# Specify the feature(s) to be used by the estimator.
image_column = tf.contrib.layers.real_valued_column('images', dimension=784)
estimator = tf.estimator.LinearClassifier(feature_columns=[image_column], n_classes=10)

# Train.
estimator.train(input_fn=train_input_fn, steps=2000)

# Evaluate and report metrics.
eval_metrics = estimator.evaluate(input_fn=eval_input_fn, steps=1)
print(eval_metrics)

三步法进阶

现在我们已经学会三步法了。虽然不涉及底层细节，我们还是有很多工具可以做得更好的。

比如我们要自己设计优化方法, 从三条语句变成四条：

optimizer2 = tf.train.FtrlOptimizer(learning_rate=5.0, l2_regularization_strength=1.0)
estimator2 = tf.estimator.LinearClassifier(
    feature_columns=[image_column], n_classes=10, optimizer=optimizer2)

# Train.
estimator2.train(input_fn=train_input_fn, steps=2000)

# Evaluate and report metrics.
eval_metrics2 = estimator2.evaluate(input_fn=eval_input_fn, steps=1)
print(eval_metrics2)

这段代码不是片断，拼接到上面的代码的后面就可以直接运行。

更进一步：支持向量机

默认的虽然通用，但是效果可能不如更专业的更好。比如我们想用前深度学习时代最强大的工具之一 - 支持向量机来进行MNIST识别。我们还是可以用高层API来实现。将LinearClassifier换成KernelLinearClassifier。

optimizer3 = tf.train.FtrlOptimizer(
   learning_rate=50.0, l2_regularization_strength=0.001)

kernel_mapper3 = tf.contrib.kernel_methods.RandomFourierFeatureMapper(
  input_dim=784, output_dim=2000, stddev=5.0, name='rffm')
kernel_mappers3 = {image_column: [kernel_mapper3]}
estimator3 = tf.contrib.kernel_methods.KernelLinearClassifier(
   n_classes=10, optimizer=optimizer3, kernel_mappers=kernel_mappers3)

# Train.
estimator3.fit(input_fn=train_input_fn, steps=2000)

# Evaluate and report metrics.
eval_metrics3 = estimator3.evaluate(input_fn=eval_input_fn, steps=1)
print(eval_metrics3)

我们来比较一下三种方法：

Elapsed time: 80.69186925888062 seconds
{'loss': 0.26811677, 'accuracy': 0.9228, 'global_step': 2000}
Elapsed time: 80.33205699920654 seconds
{'loss': 0.26356304, 'accuracy': 0.9276, 'global_step': 2000}
Elapsed time: 98.87778902053833 seconds
{'loss': 0.10834637, 'accuracy': 0.9668, 'global_step': 2000}

SVM支持向量机力量果然强大，从92%的识别率提升到了96%.

高层深度学习API

准备数据的语句不变，我们再加一种采用深度学习的方式，也是三步：

classifier = tf.estimator.DNNClassifier(
    feature_columns=[image_column],
    hidden_units=[784, 625],
    n_classes=10)

# Train.
classifier.train(
    input_fn=train_input_fn,
    steps=2000)

eval_result = classifier.evaluate(
    input_fn=eval_input_fn, steps=1)

print(eval_result)

打印出来的结果如下：

{'accuracy': 0.9812, 'average_loss': 0.064692736, 'loss': 323.46368, 'global_step': 2000}

识别率达到98%，比支持向量机还要强一些。

Tensorflow的API结构

Tensorflow API

我们从第一讲到第十讲学习的都是Mid-Level API。这一讲讲的是High-Level API。

Tensorflow r1.8 Estimators API的变化

Tensorflow API的变化一向以迅速著称，兼容性也不是很好。
tf.estimator.Estimators的前身是tf.contrib.learn.Estimators。

我们对比一下LinearClassifier在这两个版本的区别：
新版：

estimator = tf.estimator.LinearClassifier(feature_columns=[image_column],
                                          n_classes=10)

# Train.
estimator.train(input_fn=train_input_fn, steps=2000)

# Evaluate and report metrics.
eval_metrics = estimator.evaluate(input_fn=eval_input_fn, steps=1)

旧版：

estimator = tf.contrib.learn.LinearClassifier(feature_columns=[image_column], n_classes=10)

# Train.
estimator.fit(input_fn=train_input_fn, steps=2000)

# Evaluate and report metrics.
eval_metrics = estimator.evaluate(input_fn=eval_input_fn, steps=1)
print(eval_metrics)

主要区别为：
1. 包名改变了
2. 新版的训练方法是train，而旧版是fit。
因为新版本没有提供支持向量机的分类器，我们用的核函数版本的KernelLinearClassifier还是老的包中的，所以还是用的fit来训练。

前情提要

这是Tensorflow快餐教程的第11篇。还没看到前10篇的请移步：
Tensorflow快餐教程(1) - 30行代码搞定手写识别: https://blog.csdn.net/lusing/article/details/79965160
Tensorflow快餐教程(2) - 标量计算: https://blog.csdn.net/lusing/article/details/79980808
Tensorflow快餐教程(3) - 向量: https://blog.csdn.net/lusing/article/details/80054716
Tensorflow快餐教程(4) - 矩阵: https://blog.csdn.net/lusing/article/details/80071169
Tensorflow快餐教程(5) - 范数: https://blog.csdn.net/lusing/article/details/80082235
Tensorflow快餐教程(6) - 矩阵分解: https://blog.csdn.net/lusing/article/details/80113583
Tensorflow快餐教程(7) - 梯度下降: https://blog.csdn.net/lusing/article/details/80178069
Tensorflow快餐教程(8) - 深度学习简史：https://blog.csdn.net/lusing/article/details/80182063
Tensorflow快餐教程(9) - 卷积: https://blog.csdn.net/lusing/article/details/80199015
Tensorflow快餐教程(10) - 循环神经网络: https://blog.csdn.net/lusing/article/details/80246226

推荐阅读

int
JUC（三）：深入解析AQS

本文详细介绍了Java并发工具包中的核心类AQS（AbstractQueuedSynchronizer），包括其基本概念、数据结构、源码分析及核心方法的实现。 ... [详细]

蜡笔小新 2024-11-13 15:40:34
byte
Java反射机制详解及应用场景

本文详细介绍了Java反射机制的基本概念、获取Class对象的方法、反射的主要功能及其在实际开发中的应用。通过具体示例，帮助读者更好地理解和使用Java反射。 ... [详细]

蜡笔小新 2024-11-13 16:08:08
int
利用OpenCV和线性SVM实现人脸识别

本文介绍如何使用OpenCV和线性支持向量机（SVM）模型来开发一个简单的人脸识别系统，特别关注在只有一个用户数据集时的处理方法。 ... [详细]

蜡笔小新 2024-11-13 14:50:37
text
Leetcode学习成长记：天池leetcode基础训练营Task01数组

前言这是本人第一次参加由Datawhale举办的组队学习活动，这个活动每月一次，之前也一直关注，但未亲身参与过，这次看到活动 ... [详细]

蜡笔小新 2024-11-14 18:01:31
int
pytorch(一)：torch构建数据集并训练一个神经网络

目录预备知识导包构建数据集神经网络结构训练测试精度可视化计算模型精度损失可视化输出网络结构信息训练神经网络定义参数载入数据载入神经网络结构、损失及优化训练及测试损失、精度可视化qu ... [详细]

蜡笔小新 2024-11-14 13:06:38
byte
浅析python实现布隆过滤器及Redis中的缓存穿透原理_python

本文带你了解了位图的实现，布隆过滤器的原理及Python中的使用，以及布隆过滤器如何应对Redis中的缓存穿透，相信你对布隆过滤 ... [详细]

蜡笔小新 2024-11-13 16:43:07
instance
Spring – Bean Life Cycle

Spring – Bean Life Cycle ... [详细]

蜡笔小新 2024-11-13 13:24:40
instance
Java DAO模式详解与代码示例

DAO（Data Access Object）模式是一种用于抽象和封装所有对数据库或其他持久化机制访问的方法，它通过提供一个统一的接口来隐藏底层数据访问的复杂性。 ... [详细]

蜡笔小新 2024-11-13 12:25:33
byte
Go语言中正则表达式的简易应用

本文介绍了Go语言中正则表达式的基本使用方法，并提供了一些实用的示例代码。 ... [详细]

蜡笔小新 2024-11-14 20:27:47
text
Go Echo 框架入门指南【1】

本文介绍了 Go 语言中的高性能、可扩展、轻量级 Web 框架 Echo。Echo 框架简单易用，仅需几行代码即可启动一个高性能 HTTP 服务。 ... [详细]

蜡笔小新 2024-11-14 18:30:58
int
Python中调整数据分辨率的方法

本文介绍了如何在Python中使用插值方法将不同分辨率的数据统一到相同的分辨率。 ... [详细]

蜡笔小新 2024-11-14 15:10:26
int
兆芯X86 CPU架构的演进与现状（国产CPU系列）

本文详细介绍了兆芯X86 CPU架构的发展历程，从公司成立背景到关键技术授权，再到具体芯片架构的演进，全面解析了兆芯在国产CPU领域的贡献与挑战。 ... [详细]

蜡笔小新 2024-11-14 15:04:34
instance
Spring Data JdbcTemplate 入门指南

本文将介绍如何使用 Spring JdbcTemplate 进行数据库操作，包括查询和插入数据。我们将通过一个学生表的示例来演示具体步骤。 ... [详细]

蜡笔小新 2024-11-14 10:33:29
text
Python基础：使用NLTK和Python构建机器学习应用

本文节选自《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书的第1章第1.2节，作者Nitin Hardeniya。本文将带领读者快速了解Python的基础知识，为后续的机器学习应用打下坚实的基础。 ... [详细]

蜡笔小新 2024-11-13 21:23:34
byte
WinMain 函数详解及示例

本文详细介绍了 WinMain 函数的参数及其用途，并提供了一个具体的示例代码来解析 WinMain 函数的实现。 ... [详细]

蜡笔小新 2024-11-13 12:49:31