这篇文章主要详情如何利用AlexNet预训练模型来训练一个猫狗分类器,主要内容包括:
- 项目结构详情
- 数据探究
- 数据的准备
- AlexNet模型的构建
- 模型的训练和性能评估
- 结果的提交
一、项目结构详情
1、相关数据下载地址
项目地址:https://github.com/steelOneself/kaggle/tree/master/cat_vs_dog/AlexNet
数据下载地址:https://www.kaggle.com/c/dogs-vs-cats-redux-kernels-edition/data
AlexNet预训练文件下载地址:http://www.cs.toronto.edu/~guerzhoy/tf_alexnet/
2、项目文件详情
checkpoints --- 用来保存训练后生成的模型文件
model --- 用来存放预训练模型文件
tensorboard ---用来保存训练过程中的日志信息
txt --- 用来存放数据集的图片信息
AlexNet.py --- AlexNet模型结构文件
DataGenrator.py --- 数据生成类
Exploration.py --- 可视化分析
Generate_txt.py --- 将图片信息保存为txt文件
run.py --- 模型训练、评估、结构生成
util_data.py --- 数据集工具类,将数据分为训练集和验证集
二、数据探究
1、数据详情
数据包含两部分,训练集和测试集,训练集有25000张图片,测试集有12500张图片,在训练集的图片名称中包含了图片的标签信息,而测试集的图片名称代表的图片的id,提交结果的时候要求提交图片的id和预测对应图片的标签(1表示dog,0表示cat)。
2、数据探究
分析训练集中猫狗的分布情况
训练集中猫狗图片的分布情况
三、数据的准备
注意:我将展现出来的代码进行了省略,因为代码比较多,比较占空间,详细代码请参考git。
1、生成txt文件
将图片信息转为txt文件
将图片信息保存为txt文件,保存格式:图片id,图片路径,图片标签
2、将数据分为训练集和验证集
将数据集分为训练集和验证集
将25000张图片分为训练集和验证集,训练集占20000张图片,验证集占5000张图片,分割的时候需要注意,训练集和验证集中猫和狗所占的比例相同。
3、数据生成类
数据生成类
利用CPU资源来加载数据,在读取图片的时候需要将图片转为227×227,由于AlexNet要求输出图片的大小是227×227。
四、AlexNet模型构建
AlexNet网络结构
AlexNet网络
五、模型的训练和性能评估
1、模型的训练
模型参数设置
模型参数设置
train_layers设置需要重新训练的层数,在这次训练过程中,只重新训练AlexNet的最后三层全连接层,其他的层保持不变。
训练日志
训练完成之后,在checkpoints会产生ckpt模型文件,每一个epoch保存一次模型文件,只有当后一个在验证集上的精确率大于前一个时才会保存模型文件,在保存模型文件的时候后面有附带该次epoch在验证集上的精确率。
2、模型评估
3、查看模型在验证集上分类正确和分类错误的图片
分类正确和错误结果展现
上面一行表示分类正确的图片,下面一行表示分类错误的图片
4、查看验证集预测结果的分布情况
验证集结果分布情况
5、混淆矩阵
6、验证集分类结果报告
六、提交结果
kaggle的成绩计算是利用,是计算预测结果的交叉熵损失值,在生成预测结果的时候,通过fc8输出的结果还需要经过一个softmax层才能输出每个类别的概率,直接使用预测类标(0或者1)比预测概率的成绩会低少量。
总结:本篇文章主要详情了如何使用一个相对简单的卷积神经网络AlexNet来构建一个预训练模型,熟习一下迁移学习的过程,在下一篇文章将会详情如何来预训练一个更复杂的Inception-resent网络。
最后,给大家推荐一个非常好的学习人工智能相关知识的平台——微信小程序“八斗问答”,有不懂的问题可以在上面进行免费提问,还有大咖会进行详细解答,还可以与大咖一对一咨询。我现在也已经入驻了“八斗问答”,以后的文章在上面也会同步升级,有不懂的地方欢迎来咨询。