利用微调模型来完成图像分类的任务

作者：低调浪漫0613 | 来源：互联网 | 2023-09-14 21:49

学习目标知道微调的原理能够利用微调模型来完成图像的分类任务1.微调如何在只有6万张图像的MNIST训练数据集上训练模型。学术界当下使用最广泛的大规模图像数据集ImageNet&

学习目标

知道微调的原理
能够利用微调模型来完成图像的分类任务

1.微调

如何在只有6万张图像的MNIST训练数据集上训练模型。学术界当下使用最广泛的大规模图像数据集ImageNet&＃xff0c;它有超过1,000万的图像和1,000类的物体。然而&＃xff0c;我们平常接触到数据集的规模通常在这两者之间。假设我们想从图像中识别出不同种类的椅子&＃xff0c;然后将购买链接推荐给用户。一种可能的方法是先找出100种常见的椅子&＃xff0c;为每种椅子拍摄1,000张不同角度的图像&＃xff0c;然后在收集到的图像数据集上训练一个分类模型。另外一种解决办法是应用迁移学习&＃xff08;transfer learning&＃xff09;&＃xff0c;将从源数据集学到的知识迁移到目标数据集上。例如&＃xff0c;虽然ImageNet数据集的图像大多跟椅子无关&＃xff0c;但在该数据集上训练的模型可以抽取较通用的图像特征&＃xff0c;从而能够帮助识别边缘、纹理、形状和物体组成等。这些类似的特征对于识别椅子也可能同样有效。

微调由以下4步构成。

在源数据集&＃xff08;如ImageNet数据集&＃xff09;上预训练一个神经网络模型&＃xff0c;即源模型。
创建一个新的神经网络模型&＃xff0c;即目标模型。它复制了源模型上除了输出层外的所有模型设计及其参数。我们假设这些模型参数包含了源数据集上学习到的知识&＃xff0c;且这些知识同样适用于目标数据集。我们还假设源模型的输出层跟源数据集的标签紧密相关&＃xff0c;因此在目标模型中不予采用。
为目标模型添加一个输出大小为目标数据集类别个数的输出层&＃xff0c;并随机初始化该层的模型参数。
在目标数据集&＃xff08;如椅子数据集&＃xff09;上训练目标模型。我们将从头训练输出层&＃xff0c;而其余层的参数都是基于源模型的参数微调得到的。

当目标数据集远小于源数据集时&＃xff0c;微调有助于提升模型的泛化能力。

2.热狗识别

接下来我们来实践一个具体的例子&＃xff1a;热狗识别。将基于一个小数据集对在ImageNet数据集上训练好的ResNet模型进行微调。该小数据集含有数千张热狗或者其他事物的图像。我们将使用微调得到的模型来识别一张图像中是否包含热狗。

首先&＃xff0c;导入实验所需的工具包。

import tensorflow as tf import numpy as np

2.1 获取数据集¶

我们首先将数据集放在路径hotdog/data之下:

实现时实例化模型架构&＃xff1a;

tf.keras.applications.ResNet50(include_top&＃61;True, weights&＃61;&＃39;imagenet&＃39;, input_tensor&＃61;None, input_shape&＃61;None,pooling&＃61;None, classes&＃61;1000, **kwargs )

主要参数&＃xff1a;

include_top: 是否包括顶层的全连接层。
weights: None 代表随机初始化&＃xff0c; &＃39;imagenet&＃39; 代表加载在 ImageNet 上预训练的权值。
input_shape: 可选&＃xff0c;输入尺寸元组&＃xff0c;仅当 include_top&＃61;False 时有效&＃xff0c;否则输入形状必须是 (224, 224, 3)&＃xff08;channels_last 格式&＃xff09;或 (3, 224, 224)&＃xff08;channels_first 格式&＃xff09;。它必须为 3 个输入通道&＃xff0c;且宽高必须不小于 32&＃xff0c;比如 (200, 200, 3) 是一个合法的输入尺寸。

在该案例中我们使用resNet50预训练模型构建模型&＃xff1a;

# 加载预训练模型 ResNet50 &＃61; tf.keras.applications.ResNet50(weights&＃61;&＃39;imagenet&＃39;, input_shape&＃61;(224,224,3)) # 设置所有层不可训练 for layer in ResNet50.layers:layer.trainable &＃61; False # 设置模型 net &＃61; tf.keras.models.Sequential() # 预训练模型 net.add(ResNet50) # 展开 net.add(tf.keras.layers.Flatten()) # 二分类的全连接层 net.add(tf.keras.layers.Dense(2, activation&＃61;&＃39;softmax&＃39;))

接下来我们使用之前定义好的ImageGenerator将训练集图片送入ResNet50进行训练。

# 模型编译&＃xff1a;指定优化器&＃xff0c;损失函数和评价指标 net.compile(optimizer&＃61;&＃39;adam&＃39;,loss&＃61;&＃39;categorical_crossentropy&＃39;,metrics&＃61;[&＃39;accuracy&＃39;]) # 模型训练&＃xff1a;指定数据&＃xff0c;每一个epoch中只运行10个迭代&＃xff0c;指定验证数据集 history &＃61; net.fit(train_data_gen,steps_per_epoch&＃61;10,epochs&＃61;3,validation_data&＃61;test_data_gen,validation_steps&＃61;10) Epoch 1/3 10/10 [&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;] - 28s 3s/step - loss: 0.6931 - accuracy: 0.5031 - val_loss: 0.6930 - val_accuracy: 0.5094 Epoch 2/3 10/10 [&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;] - 29s 3s/step - loss: 0.6932 - accuracy: 0.5094 - val_loss: 0.6935 - val_accuracy: 0.4812 Epoch 3/3 10/10 [&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;] - 31s 3s/step - loss: 0.6935 - accuracy: 0.4844 - v

推荐阅读

filter
TensorFlow基础知识深化讲解

批标准化批标准化（batchnormalization,BN）是为了克服神经网络层数加深导致难以训练而诞生的。深度神经网络随着深度加深，收 ... [详细]

蜡笔小新 2024-10-22 10:19:31
数组
基于TensorFlow的鸢尾花数据集神经网络模型深度解析

基于TensorFlow的鸢尾花数据集神经网络模型深度解析 ... [详细]

蜡笔小新 2024-10-22 11:56:51
list
Google Colab 免费 GPU 使用指南（第一部分）

本文介绍了如何使用 Google Colab 的免费 GPU 资源进行深度学习应用开发。Google Colab 是一个无需配置即可使用的云端 Jupyter 笔记本环境，支持多种深度学习框架，并且提供免费的 GPU 计算资源。 ... [详细]

蜡笔小新 2024-11-14 13:42:03
get
pytorch(一)：torch构建数据集并训练一个神经网络

目录预备知识导包构建数据集神经网络结构训练测试精度可视化计算模型精度损失可视化输出网络结构信息训练神经网络定义参数载入数据载入神经网络结构、损失及优化训练及测试损失、精度可视化qu ... [详细]

蜡笔小新 2024-11-14 13:06:38
include
在Windows系统中安装TensorFlow GPU版的详细指南与常见问题解决

在Windows系统中安装TensorFlow GPU版是许多深度学习初学者面临的挑战。本文详细介绍了安装过程中的每一个步骤，并针对常见的问题提供了有效的解决方案。通过本文的指导，读者可以顺利地完成安装并避免常见的陷阱。 ... [详细]

蜡笔小新 2024-11-11 19:02:49
include
神经网络在二分类任务中输出层应配置多少神经元及选择何种激活函数？处理MNIST数据集时输出层神经元数量与激活函数如何确定？神经网络预测房价时输出层神经元数量和激活函数的选择策略？

在神经网络进行二分类任务时，输出层应配置多少个神经元以及选择哪种激活函数是一个关键问题。对于MNIST数据集的处理，输出层的神经元数量和激活函数的选择策略是什么？而在预测房价的任务中，输出层的神经元数量和激活函数又该如何确定？本文将详细探讨这些选择背后的原理和实践建议，以帮助读者更好地理解和应用神经网络模型。 ... [详细]

蜡笔小新 2024-11-03 19:21:50
include
深入解析经典卷积神经网络及其实现代码

深入解析经典卷积神经网络及其实现代码 ... [详细]

蜡笔小新 2024-11-01 11:16:09
include
使用TensorFlow 2.0构建VGG16神经网络：详解API应用与实现

使用TensorFlow 2.0构建VGG16神经网络：详解API应用与实现 ... [详细]

蜡笔小新 2024-10-30 13:11:45
heatmap
共享单车C语言开发项目：全面分析与实现

在该项目中，参与者需结合历史使用模式和天气数据，以预测华盛顿特区自行车共享系统的租赁需求。数据分析部分首先涉及数据的收集，包括用户骑行记录和气象信息，为后续模型构建提供基础。通过深入的数据预处理和特征工程，确保数据质量和模型准确性，最终实现对自行车租赁需求的有效预测。 ... [详细]

蜡笔小新 2024-10-30 10:33:38
heatmap
AI学习进阶（5）：深入解析NumPy的核心功能与应用

在之前的系列中，我们探讨了多个关于AI学习的基础知识点。本篇将重点深入解析NumPy这一关键库的核心功能及其广泛应用。即使您对之前提到的例子印象模糊，也无妨，我们将从头开始，详细分析其代码结构与实现逻辑，如`import numpy as np`等基础语句，帮助您全面理解NumPy在数据处理与科学计算中的重要作用。 ... [详细]

蜡笔小新 2024-10-30 09:33:25
list
PyTorch常见预训练模型的下载链接及使用指南

本文提供了PyTorch框架中常用的预训练模型的下载链接及详细使用指南，涵盖ResNet、Inception、DenseNet、AlexNet、VGGNet等六大分类模型。每种模型的预训练参数均经过精心调优，适用于多种计算机视觉任务。文章不仅介绍了模型的下载方式，还详细说明了如何在实际项目中高效地加载和使用这些模型，为开发者提供全面的技术支持。 ... [详细]

蜡笔小新 2024-10-27 13:57:42
数组
利用 PyTorch 实现 Python 中的高效矩阵运算

利用 PyTorch 实现 Python 中的高效矩阵运算 ... [详细]

蜡笔小新 2024-10-26 20:00:47
list
如何在Linux系统中部署TensorFlow的详细指南

本文详细介绍了在Linux系统中部署TensorFlow的过程。作者基于北京大学曹建教授的MOOC课程进行学习，但由于课程内容较旧，环境配置方面遇到了不少挑战。经过多次尝试，最终成功解决了这些问题，并总结了一套详细的安装指南，帮助初学者快速上手TensorFlow。 ... [详细]

蜡笔小新 2024-10-24 13:06:19
list
数据科学笔记26：深入解析随机森林分类算法及其在Python和R中的应用

### 摘要随机森林是一种在集成学习领域备受推崇的算法，被誉为“集成学习技术的典范”。该方法因其简洁性、易实现性和较低的计算成本而被广泛应用。本文将深入探讨随机森林的工作原理，特别是其在Python和R中的具体应用。随机森林通过结合多个决策树和Bagging技术，有效提高了模型的准确性和鲁棒性。我们将详细解析其核心机制，并通过实际案例展示如何在不同编程环境中高效实现这一强大的分类算法。 ... [详细]

蜡笔小新 2024-10-24 11:40:42
get
利用TensorFlow.js在网页浏览器中实现高效的人脸识别JavaScript接口

作者|VincentMühle编译|姗姗出品|人工智能头条（公众号ID：AI_Thinker）【导读】随着深度学习方法的应用，浏览器调用人脸识别技术已经得到了更广泛的应用与提升。在 ... [详细]

蜡笔小新 2024-10-23 10:50:38

低调浪漫0613

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章