深度学习数据集制作_R语言基于Keras的小数据集深度学习图像分类

作者：xi曦 | 来源：互联网 | 2023-07-26 16:04

原文链接：http:tecdat.cn?p6714必须使用非常少的数据训练图像分类模型是一种常见情况，如果您在专业环境中进行计算机视觉，则

原文链接&＃xff1a;http://tecdat.cn/?p&＃61;6714

必须使用非常少的数据训练图像分类模型是一种常见情况&＃xff0c;如果您在专业环境中进行计算机视觉&＃xff0c;则在实践中可能会遇到这种情况。“少数”样本可以表示从几百到几万个图像的任何地方。作为一个实际例子&＃xff0c;我们将重点放在将图像分类为狗或猫的数据集中&＃xff0c;其中包含4,000张猫狗图片(2,000只猫&＃xff0c;2,000只狗)。我们将使用2,000张图片进行训练- 1,000张用于验证&＃xff0c;1,000张用于测试。

深度学习与小数据问题的相关性

您有时会听到深度学习仅在有大量数据可用时才有效。这部分是有效的&＃xff1a;深度学习的一个基本特征是它可以自己在训练数据中找到有趣的特征&＃xff0c;而不需要手动特征工程&＃xff0c;这只有在有大量训练样例可用时才能实现。对于输入样本非常高维的问题(如图像)尤其如此。

让我们从数据开始吧。

下载数据

使用 Dogs vs. Cats数据集。

这里有些例子&＃xff1a;

该数据集包含25,000张狗和猫的图像(每类12,500张)&＃xff0c;543 MB 。下载并解压缩后&＃xff0c;您将创建一个包含三个子集的新数据集&＃xff1a;每个类包含1,000个样本的训练集&＃xff0c;每个类500个样本的验证集&＃xff0c;以及每个类500个样本的测试集。

以下是执行此操作的代码&＃xff1a;

original_dataset_dir <- “〜/ Downloads / kaggle_original_data”base_dir <- “〜/ Downloads / cats_and_dogs_small”dir.create(base_dir)train_dir <- file.path(base_dir&＃xff0c;“train”)dir.create(train_dir)validation_dir <- file。path(base_dir&＃xff0c;“validation”)

使用预训练的convnet

在小图像数据集上深入学习的一种常见且高效的方法是使用预训练网络。一个预训练的网络是一个先前在大型数据集上训练的已保存网络&＃xff0c;通常是在大规模图像分类任务上。如果这个原始数据集足够大且足够通用&＃xff0c;则预训练网络学习的特征的空间层次结构可以有效地充当视觉世界的通用模型&＃xff0c;因此其特征可以证明对许多不同的计算机视觉问题有用&＃xff0c;甚至虽然这些新问题可能涉及与原始任务完全不同的类。

有两种方法可以使用预训练网络&＃xff1a;特征提取和微调。让我们从特征提取开始。

特征提取

特征提取包括使用先前网络学习的表示来从新样本中提取感兴趣的特征。然后&＃xff0c;这些功能将通过一个新的分类器运行&＃xff0c;该分类器从头开始训练。

为什么只重用卷积基数&＃xff1f;您是否可以重复使用密集连接的分类器&＃xff1f;一般来说&＃xff0c;应该避免这样做。原因是卷积基础学习的表示可能更通用&＃xff0c;因此更具可重用性。

注意&＃xff0c;由特定卷积层提取的表示的一般性(以及因此可重用性)的级别取决于模型中的层的深度。模型中较早出现的图层会提取局部的&＃xff0c;高度通用的特征贴图(例如可视边缘&＃xff0c;颜色和纹理)&＃xff0c;而较高层的图层会提取更抽象的概念(例如“猫耳朵”或“狗眼”) 。因此&＃xff0c;如果您的新数据集与训练原始模型的数据集有很大不同&＃xff0c;那么最好只使用模型的前几层来进行特征提取&＃xff0c;而不是使用整个卷积基础。

让我们通过使用在ImageNet上训练的VGG16网络的卷积基础来实现这一点&＃xff0c;从猫和狗图像中提取有趣的特征&＃xff0c;然后在这些特征之上训练狗与猫的分类器。

让我们实例化VGG16模型。

conv_base <- application_vgg16(weights &＃61;“imagenet”&＃xff0c;include_top &＃61; FALSE&＃xff0c;input_shape &＃61; c(150,150,3))

将三个参数传递给函数&＃xff1a;

weights 指定从中初始化模型的权重。
include_top“密集连接”是指在网络顶部包括(或不包括)密集连接的分类器。默认情况下&＃xff0c;此密集连接的分类器对应于ImageNet的1,000个类。
input_shape是您将提供给网络的图像张量的形状。这个参数是可选的&＃xff1a;如果你不传递它&＃xff0c;网络将能够处理任何大小的输入。

它类似于你已经熟悉的简单的网络&＃xff1a;

summary(conv_base)Layer (type) Output Shape Param #&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;input_1 (InputLayer) (None, 150, 150, 3) 0________________________________________________________________block1_conv1 (Convolution2D) (None, 150, 150, 64) 1792________________________________________________________________block1_conv2 (Convolution2D) (None, 150, 150, 64) 36928________________________________________________________________block1_pool (MaxPooling2D) (None, 75, 75, 64) 0________________________________________________________________block2_conv1 (Convolution2D) (None, 75, 75, 128) 73856________________________________________________________________block2_conv2 (Convolution2D) (None, 75, 75, 128) 147584________________________________________________________________block2_pool (MaxPooling2D) (None, 37, 37, 128) 0________________________________________________________________block3_conv1 (Convolution2D) (None, 37, 37, 256) 295168________________________________________________________________block3_conv2 (Convolution2D) (None, 37, 37, 256) 590080________________________________________________________________block3_conv3 (Convolution2D) (None, 37, 37, 256) 590080________________________________________________________________block3_pool (MaxPooling2D) (None, 18, 18, 256) 0________________________________________________________________block4_conv1 (Convolution2D) (None, 18, 18, 512) 1180160________________________________________________________________block4_conv2 (Convolution2D) (None, 18, 18, 512) 2359808________________________________________________________________block4_conv3 (Convolution2D) (None, 18, 18, 512) 2359808________________________________________________________________block4_pool (MaxPooling2D) (None, 9, 9, 512) 0________________________________________________________________block5_conv1 (Convolution2D) (None, 9, 9, 512) 2359808________________________________________________________________block5_conv2 (Convolution2D) (None, 9, 9, 512) 2359808________________________________________________________________block5_conv3 (Convolution2D) (None, 9, 9, 512) 2359808________________________________________________________________block5_pool (MaxPooling2D) (None, 4, 4, 512) 0&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;Total params: 14,714,688Trainable params: 14,714,688Non-trainable params: 0

此时&＃xff0c;有两种方法可以继续&＃xff1a;

在数据集上运行卷积。
conv_base通过在顶部添加密集层来扩展您的模型() 。

在这篇文章中&＃xff0c;我们将详细介绍第二种技术。请注意&＃xff0c; 只有在您可以访问GPU时才应该尝试。

特征提取

由于模型的行为与图层类似&＃xff0c;因此您可以像添加图层一样将模型(如conv_base)添加到顺序模型中。

model <- keras_model_sequential()&＃xff05;>&＃xff05;conv_base&＃xff05;>&＃xff05;layer_flatten()&＃xff05;>&＃xff05;layer_dense( &＃61; 256&＃xff0c;activation &＃61;“relu”)&＃xff05;>&＃xff05;layer_dense(u its &＃61; &＃xff0c; “sigmoid”)

这就是模型现在的样子&＃xff1a;

summary(model)Layer (type) Output Shape Param #&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;vgg16 (Model) (None, 4, 4, 512) 14714688________________________________________________________________flatten_1 (Flatten) (None, 8192) 0________________________________________________________________dense_1 (Dense) (None, 256) 2097408________________________________________________________________dense_2 (Dense) (None, 1) 257&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;Total params: 16,812,353Trainable params: 16,812,353Non-trainable params: 0

如您所见&＃xff0c;VGG16的卷积基数有14,714,688个参数&＃xff0c;非常大。

在Keras中&＃xff0c; 使用以下freeze_weights()函数冻结网络&＃xff1a;

freeze_weights(conv_base)length(model $ trainable_weights)

使用数据扩充

过度拟合是由于过多的样本需要学习&＃xff0c;导致无法训练可以推广到新数据的模型。

在Keras中&＃xff0c;这可以通过配置对读取的图像执行的多个随机变换来完成&＃xff0c;image_data_generator()。例如&＃xff1a;

train_datagen &＃61; image_data_generator(rescale &＃61; 1/255&＃xff0c; &＃61; 40&＃xff0c;width_shift_range &＃61; 0.2&＃xff0c;height_shift_range &＃61; 0.2&＃xff0c; &＃61; 0.2&＃xff0c;zoom_range &＃61; 0.2&＃xff0c;horizo &＃61; TRUE&＃xff0c;fill_mode &＃61;“nearest”)

浏览一下这段代码&＃xff1a;

rotation_range 是一个度数(0-180)的值&＃xff0c;一个随机旋转图片的范围。
width_shift并且height_shift是在垂直或水平方向上随机平移图片的范围。
shear_range 用于随机应用剪切变换。
zoom_range 用于随机缩放图片内部。
horizontal_flip 用于水平地随机翻转一半图像 - 当没有水平不对称假设时相关(例如&＃xff0c;真实世界的图片)。
fill_mode 是用于填充新创建的像素的策略&＃xff0c;可以在旋转或宽度/高度偏移后出现。

现在我们可以使用图像数据生成器训练我们的模型&＃xff1a;

model&＃xff05;>&＃xff05;compile(loss &＃61;“binary_crossentropy”&＃xff0c;optimizer &＃61; optimizer_rmsprop(lr &＃61; 2e-5)&＃xff0c;metrics &＃61; c(“accuracy”))history <- model&＃xff05;>&＃xff05;fit_generator(train_generator&＃xff0c;steps_per_epoch &＃61; 100&＃xff0c;

绘制结果。准确率达到约90&＃xff05;。

微调

另一种广泛使用的模型重用技术&＃xff0c;是对特征提取的补充&＃xff0c;是微调 &＃xff0c;微调网络的步骤如下&＃xff1a;

在已经训练过的基础网络上添加自定义网络。
冻结基础网络。
训练你添加的部分。
解冻基础网络中的某些层。
联合训练这些层和您添加的部分。

在进行特征提取时&＃xff0c;您已经完成了前三个步骤。让我们继续第4步&＃xff1a;您将解冻您的内容conv_base&＃xff0c;然后冻结其中的各个图层。

现在您可以开始微调网络了。

model&＃xff05;>&＃xff05;compile(lo ropy”&＃xff0c;optimizer &＃61; opt imizer_rmsprop(lr &＃61; 1e-5)&＃xff0c;metrics &＃61; c(“accuracy”))his el&＃xff05;>&＃xff05;fit_generator(train_ g steps_per_epoch &＃61; 100&＃xff0c;epochs &＃61; 100 &＃xff0c;validation_data &＃61; validation_genera tor&＃xff0c;validation_steps &＃61; 50)

让我们绘制结果&＃xff1a;

你可以看到准确度有6&＃xff05;的提升&＃xff0c;从大约90&＃xff05;到高于96&＃xff05;。

您现在可以最终在测试数据上评估此模型&＃xff1a;

test_generator <- (test_dir&＃xff0c;test_datagen&＃xff0c;target_size &＃61; c(150,150)&＃xff0c;batch_size &＃61; 20&＃xff0c; &＃61;“binary”)model&＃xff05;>&＃xff05;evaluate_generator( &＃xff0c;steps &＃61; 50) $ loss[1] 0.2158171$ acc[1] 0.965

在这里&＃xff0c;您可以获得96.5&＃xff05;的测试精度。

非常感谢您阅读本文&＃xff0c;有任何问题请在下面留言&＃xff01;

点击标题查阅往期内容

图像倾斜校正算法的MATLAB实现&＃xff1a;图像倾斜角检测及校正R语言基于Keras的小数据集深度学习图像分类使用Python和Keras进行主成分分析、神经网络构建图像重建使用OpenCV在Python中进行图像处理python卷积神经网络人体图像识别TensorFlow 2keras开发深度学习模型实例&＃xff1a;多层感知器(MLP)&＃xff0c;卷积神经网络(CNN)和递归神经网络(RNN)R和Python机器学习:广义线性回归glm&＃xff0c;样条glm&＃xff0c;梯度增强&＃xff0c;随机森林和深度学习模型分析matlab使用贝叶斯优化的深度学习Python中基于网格搜索算法优化的深度学习模型分析糖尿病数据用于NLP的Python&＃xff1a;使用Keras进行深度学习文本生成如何在python深度学习Keras中计算神经网络集成模型用R语言中的神经网络预测时间序列&＃xff1a;多层感知器和极限学习机基于keras平台CNN神经网络模型的服装识别分析用R语言实现神经网络预测股票实例R语言实现拟合神经网络预测和结果可视化R语言用神经网络改进Nelson-Siegel模型拟合收益率曲线分析用于NLP的Python&＃xff1a;使用Keras的多标签文本LSTM神经网络分类

更多内容&＃xff0c;请点击左下角“”查看报告全文

关注我们

案例精选、技术干货第一时间与您分享

长按二维码加关注

更多内容&＃xff0c;请点击左下角“”查看报告全文

推荐阅读

list
深入解析Android自定义View面试题

本文探讨了Android Launcher开发中自定义View的重要性，并通过一道经典的面试题，帮助开发者更好地理解自定义View的实现细节。文章不仅涵盖了基础知识，还提供了实际操作建议。 ... [详细]

蜡笔小新 2024-12-28 11:15:04
settings
编写有趣的VBScript恶作剧脚本

本文将介绍如何编写一些有趣的VBScript脚本，这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例，帮助您了解VBScript的基本语法和功能。 ... [详细]

蜡笔小新 2024-12-28 09:46:23
hash
Linux 网卡绑定的七种工作模式详解

本文深入探讨了Linux系统中网卡绑定（bonding）的七种工作模式。网卡绑定技术通过将多个物理网卡组合成一个逻辑网卡，实现网络冗余、带宽聚合和负载均衡，在生产环境中广泛应用。文章详细介绍了每种模式的特点、适用场景及配置方法。 ... [详细]

蜡笔小新 2024-12-27 10:18:13
java
寻找满足特定条件的整数N的最大和(a+b)

本文探讨了如何在给定整数N的情况下，找到两个不同的整数a和b，使得它们的和最大，并且满足特定的数学条件。 ... [详细]

蜡笔小新 2024-12-26 19:26:18
java
计算机图形学实训：OpenGL入门与直线光栅化算法

本教程涵盖OpenGL基础操作及直线光栅化技术，包括点的绘制、简单图形绘制、直线绘制以及DDA和中点画线算法。通过逐步实践，帮助读者掌握OpenGL的基本使用方法。 ... [详细]

蜡笔小新 2024-12-26 12:24:25
list
CUGB图论专题：排水系统中的最大流问题 - EK与Dinic算法解析

本题探讨如何通过最大流算法解决农场排水系统的设计问题。题目要求计算从水源点到汇合点的最大水流速率，使用经典的EK（Edmonds-Karp）和Dinic算法进行求解。 ... [详细]

蜡笔小新 2024-12-25 17:47:23
list
USACO 2014 Jan - Moolympics区间记录优化算法

题目描述：给定n个半开区间[a, b)，要求使用两个互不重叠的记录器，求最多可以记录多少个区间。解决方案采用贪心算法，通过排序和遍历实现最优解。 ... [详细]

蜡笔小新 2024-12-27 18:14:31
settings
深入解析 MVC 源码：ParameterDescriptor 与 Action 方法参数绑定

在前两篇文章中，我们探讨了 ControllerDescriptor 和 ActionDescriptor 这两个描述对象，分别对应控制器和操作方法。本文将基于 MVC3 源码进一步分析 ParameterDescriptor，即用于描述 Action 方法参数的对象，并详细介绍其工作原理。 ... [详细]

蜡笔小新 2024-12-27 15:26:10
java
网络攻防实战：从HTTP到HTTPS的演变

本文通过一系列日记记录了从发现漏洞到逐步加强安全措施的过程，探讨了如何应对网络攻击并最终实现全面的安全防护。 ... [详细]

蜡笔小新 2024-12-27 11:34:50
list
UNP 第9章：主机名与地址转换

本章探讨了用于在主机名和数值地址之间进行转换的函数，如gethostbyname和gethostbyaddr。此外，还介绍了getservbyname和getservbyport函数，用于在服务器名和端口号之间进行转换。 ... [详细]

蜡笔小新 2024-12-27 11:26:39
java
扫描线三巨头 hdu1928hdu 1255 hdu 1542 [POJ 1151]

学习链接：http:blog.csdn.netlwt36articledetails48908031学习扫描线主要学习的是一种扫描的思想，后期可以求解很 ... [详细]

蜡笔小新 2024-12-26 20:04:36
java
长春大学软件工程：二叉排序树实验报告

本实验主要探讨了二叉排序树（BST）的基本操作，包括创建、查找和删除节点。通过具体实例和代码实现，详细介绍了如何使用递归和非递归方法进行关键字查找，并展示了删除特定节点后的树结构变化。 ... [详细]

蜡笔小新 2024-12-26 15:32:56
settings
MySQL 数据库迁移指南：从本地到远程及磁盘间迁移

本文详细介绍了如何在不同场景下进行 MySQL 数据库的迁移，包括从一个硬盘迁移到另一个硬盘、从一台计算机迁移到另一台计算机，以及解决迁移过程中可能遇到的问题。 ... [详细]

蜡笔小新 2024-12-26 13:21:38
java
libsodium 1.0.15 发布：引入重大不兼容更新

最新发布的 libsodium 1.0.15 版本带来了若干不兼容的变更，其中包括默认密码散列算法的更改和其他重要调整。 ... [详细]

蜡笔小新 2024-12-26 11:03:58
java
Codeforces Round #566 (Div. 2) A~F个人题解

Dashboard-CodeforcesRound#566(Div.2)-CodeforcesA.FillingShapes题意：给你一个的表格，你 ... [详细]

蜡笔小新 2024-12-25 18:41:21

xi曦

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章