Keras深度学习模型可视化

作者：诚实的愛是最棒的_977_415_874 | 来源：互联网 | 2023-08-31 19:09

1.深度学习可视化深度学习的过程是一个黑盒子，模型通过大量的权重去学习拟合输入的数据和学习目标，模型的性能很大程度上取决于模型的输入的数据；

1. 深度学习可视化

深度学习的过程是一个黑盒子&＃xff0c;模型通过大量的权重去学习拟合输入的数据和学习目标&＃xff0c;模型的性能很大程度上取决于模型的输入的数据&＃xff1b;深度学习的拟合效果往往出乎我们的的想象&＃xff0c;但是模型如何拟合数据和学习目标之间的关系&＃xff0c;我们知之甚少。

有时候训练数据和验证集的选取&＃xff0c;模型真正学习到的东西和我们人类认知背道而驰。网上看到的一则案例&＃xff1a;有人采集了100张隐藏在树丛中的坦克照片&＃xff0c;以及另100张仅有树丛的照片&＃xff0c; 用神经网络训练一个识别坦克的分类器&＃xff0c;在训练和验证上模型都达到了100%的精确度&＃xff0c;&＃xff08;100%基本上是数据泄露了&＃xff09;; 原因出在100张坦克是在晴天拍摄&＃xff0c;另外100张是阴天拍摄&＃xff0c;模型似乎只关注到了天空的颜色。

本文针对keras对常用的机器视觉的可视化做了总结。

特征可视化
Grad-CAM类激活热力图

2. 可视化模型说明

本文要可视化模型为densnet121&＃xff0c;其他模型类似&＃xff0c;只是卷积层不一样&＃xff0c;目标是对于火灾的识别

from keras.applications import DenseNet169 from keras.preprocessing import image from keras.models import Model from keras.layers import Dense, GlobalAveragePooling2D from keras import backend as K# 构建不带分类器的预训练模型 base_model &＃61; DenseNet169(weights&＃61;&＃39;imagenet&＃39;, include_top&＃61;False)# 添加全局平均池化层 x &＃61; base_model.output x &＃61; GlobalAveragePooling2D()(x)# 添加一个全连接层 x &＃61; Dense(1024, activation&＃61;&＃39;relu&＃39;)(x)# 添加一个分类器&＃xff0c;假设我们有200个类 predictions &＃61; Dense(200, activation&＃61;&＃39;softmax&＃39;)(x)# 构建我们需要训练的完整模型 model &＃61; Model(inputs&＃61;base_model.input, outputs&＃61;predictions)

查看模型结构

model.summary()

3. 特征可视化

对每一层卷积核的可视化帮助我们了解算法抽取的特征情况可以通过keras中的K.function封装输入到输出的函数&＃xff0c;获取指定层的输出

# 训练好的模型为model.h5 from keras import backend as K from keras.models import load_model import tensorflow as tf# 加载模型 model_ &＃61; load_model(&＃39;./model.h5&＃39;) # 设置为测试阶段 K.set_learning_phase(0) graph &＃61; tf.get_default_graph()img_file &＃61; &＃39;./test.jpg&＃39; img &＃61; cv2.imread(img_file) img &＃61; cv2.resize(img, (224, 224)) img &＃61; img.astype(&＃39;float32&＃39;) img &＃61; img / 255.0 * 2 - 1 img &＃61; np.expand_dims(img, 0)def get_layer_feat_byname(graph, img, model_, layer_name&＃61;&＃39;conv1/relu&＃39;):with graph.as_default():layer_fn &＃61; K.function([model_.layers[0].input, K.learning_phase()], [model_.get_layer(layer_name).output])layer_output &＃61; layer_fn([img, 0])[0]return layer_outputlayer_output1 &＃61; get_layer_feat_byname(graph, img, model_, &＃39;conv1/relu&＃39;) layer_output2 &＃61; get_layer_feat_byname(graph, img, model_, &＃39;pool2_conv&＃39;) layer_output3 &＃61; get_layer_feat_byname(graph, img, model_, &＃39;pool3_conv&＃39;) layer_output4 &＃61; get_layer_feat_byname(graph, img, model_, &＃39;pool4_conv&＃39;) layer_output5 &＃61; get_layer_feat_byname(graph, img, model_, &＃39;conv5_block32_concat&＃39;)

对于densenet169&＃xff0c; 我们可以选择每个dense_block层的最后一个concat&＃xff0c;也可以选择transition_block pooling前面的卷积层做展示&＃xff0c;当然每一个卷积层都是可以做展示的&＃xff0c;卷积层名称可以在summary()可以查到。本文 conv1/relu ,pool2_conv,pool3_conv,pool4_conv和最后的conv5_block32_concat

我们看下特征的可视化例子

原图&＃xff1a;来自网络

特征可视化:依次是conv1/relu ,pool2_conv,pool3_conv,pool4_conv和最后的conv5_block32_concat

可以看出

浅层的卷积特征主要形状和纹理
层数越深&＃xff0c;特征越少&＃xff0c;也也抽象
到最后一层卷积&＃xff0c;可以看出模型主要的关注响应点&＃xff0c;可以和人为主观上做一个对照&＃xff0c;看一下模型识别到的是否目标真正的意图。
可以对输入图像做一定处理&＃xff0c;比如遮罩掉一部分&＃xff0c;看看特征的响应
如果看到过多的无用特征&＃xff0c;只有少部分特征&＃xff0c;可以考虑加下dropout&＃xff0c;看是否能提升性能

4. Grad-CAM类激活热力图

由于每一层的特征数较多&＃xff0c;只能初略观察下对目标的响应情况。而具体某个类别对应到图片的那个区域响应最大&＃xff0c;也就是对该类别的识别贡献最大&＃xff0c;没有一个直观的可视化。2016年这篇文章给出了很好的解决方案&＃xff0c;而且实现比较简单&＃xff0c;Grad-CAM: Visual Explanations from Deep Networks via Gradient-based Localization。

Grad-CAM思想来源CAM&＃xff08;Class Activation Mapping&＃xff09;&＃xff0c;区别在于计算特征的响应权重不同&＃xff0c;CAM采用GAP层后的所有权重&＃xff0c;因而CAM必须要有GAP层。而Grad-CAM采用目标类别对特征的梯度来作为响应权重&＃xff0c; 对所有网络结构都适用。

过程描述

获取最后一个卷积层
获取目标类别输出
计算目标类别对卷积特征的梯度&＃xff08;可以考虑下梯度的含义, 下降最快&＃xff0c;响应最大的&＃xff09;
同样是用K.function建立输入和输出的函数
计算特征和权重的相乘&＃xff0c;并求全局平均
计算一个relu&＃xff0c; 映射到原图大小

def output_heatmap(model, last_conv_layer, img):"""Get the heatmap for image.Args:model: keras model.last_conv_layer: name of last conv layer in the model.img: processed input image.Returns:heatmap: heatmap."""# predict the image classpreds &＃61; model.predict(img)# find the class indexindex &＃61; np.argmax(preds[0])print(&＃39;index: %s&＃39; % index)# This is the entry in the prediction vectortarget_output &＃61; model.output[:, index]# get the last conv layerlast_conv_layer &＃61; model.get_layer(last_conv_layer)# compute the gradient of the output feature map with this target classgrads &＃61; K.gradients(target_output, last_conv_layer.output)[0]# mean the gradient over a specific feature map channelpooled_grads &＃61; K.mean(grads, axis&＃61;(0, 1, 2))# this function returns the output of last_conv_layer and grads # given the input pictureiterate &＃61; K.function([model.input], [pooled_grads, last_conv_layer.output[0]])pooled_grads_value, conv_layer_output_value &＃61; iterate([img])# We multiply each channel in the feature map array# by "how important this channel is" with regard to the target classfor i in range(conv_layer_output_value.shape[-1]):conv_layer_output_value[:, :, i] *&＃61; pooled_grads_value[i]# The channel-wise mean of the resulting feature map# is our heatmap of class activationheatmap &＃61; np.mean(conv_layer_output_value, axis&＃61;-1)heatmap &＃61; cv2.resize(heatmap, (img.shape[1], img.shape[2]), cv2.INTER_LINEAR)heatmap &＃61; np.maximum(heatmap, 0)heatmap /&＃61; np.max(heatmap)print(heatmap.shape)return heatmap, index

from keras import backend as K from keras.models import load_model import tensorflow as tf import cv2# 加载模型 model_ &＃61; load_model(&＃39;./model.h5&＃39;) # 设置为测试阶段 K.set_learning_phase(0) graph &＃61; tf.get_default_graph()img_file &＃61; &＃39;./test.jpg&＃39; img &＃61; cv2.imread(img_file) img &＃61; cv2.resize(img, (224, 224)) img &＃61; img.astype(&＃39;float32&＃39;) img &＃61; img / 255.0 * 2 - 1 img &＃61; np.expand_dims(img, 0)heatmap, index &＃61; output_heatmap(model_, &＃39;conv5_block32_concat&＃39;, img)

我们来看一下效果

5. 总结

本文演示了keras在深度学习可视化的两种方式&＃xff0c;希望对你有帮助&＃xff0c;欢迎交流&＃64;mintel。

总结如下

使用summary查看layer名称
使用K.function和model.get_layer 建立模型输入和输出, 进行特征可视化
Grad-CAM简单高效的类别响应可视化&＃xff0c;图像的哪些像素决定了类型输出。关键在于类别输出对特征的梯度

作者简介&＃xff1a;wedo实验君, 数据分析师&＃xff1b;热爱生活&＃xff0c;热爱写作

赞赏作者

Python中文社区作为一个去中心化的全球技术社区&＃xff0c;以成为全球20万Python中文开发者的精神部落为愿景&＃xff0c;目前覆盖各大主流媒体和协作平台&＃xff0c;与阿里、腾讯、百度、微软、亚马逊、开源中国、CSDN等业界知名公司和技术社区建立了广泛的联系&＃xff0c;拥有来自十多个国家和地区数万名登记会员&＃xff0c;会员来自以工信部、清华大学、北京大学、北京邮电大学、中国人民银行、中科院、中金、华为、BAT、谷歌、微软等为代表的政府机关、科研单位、金融机构以及海内外知名公司&＃xff0c;全平台近20万开发者关注。

推荐阅读&＃xff1a;

一文读懂高并发情况下的常见缓存问题

用 Django 开发基于以太坊智能合约的 DApp

一文读懂 Python 分布式任务队列 celery

5 分钟解读 Python 中的链式调用

用 Python 创建一个比特币价格预警应用

▼点击成为社区会员喜欢就点个在看吧

推荐阅读

process
深入浅出TensorFlow数据读写机制

本文详细介绍TensorFlow中的数据读写操作，包括TFRecord文件的创建与读取，以及数据集（dataset）的相关概念和使用方法。 ... [详细]

蜡笔小新 2024-12-19 16:23:17
random
从零构建递归神经网络：仅用NumPy实现

尽管使用TensorFlow和PyTorch等成熟框架可以显著降低实现递归神经网络（RNN）的门槛，但对于初学者来说，理解其底层原理至关重要。本文将引导您使用NumPy从头构建一个用于自然语言处理（NLP）的RNN模型。 ... [详细]

蜡笔小新 2024-12-26 11:29:15
text
毕业设计：基于机器学习与深度学习的垃圾邮件（短信）分类算法实现

本文详细介绍了如何使用机器学习和深度学习技术对垃圾邮件和短信进行分类。内容涵盖从数据集介绍、预处理、特征提取到模型训练与评估的完整流程，并提供了具体的代码示例和实验结果。 ... [详细]

蜡笔小新 2024-12-25 17:38:50
web
深入理解Tornado模板系统

本文详细介绍了Tornado框架中模板系统的使用方法。Tornado自带的轻量级、高效且灵活的模板语言位于tornado.template模块，支持嵌入Python代码片段，帮助开发者快速构建动态网页。 ... [详细]

蜡笔小新 2024-12-27 19:22:16
text
Python 的 10 个开发技巧！太实用了

1.如何在运行状态查看源代码？查看函数的源代码，我们通常会使用IDE来完成。比如在PyCharm中，你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢？当我们想使用一个函 ... [详细]

蜡笔小新 2024-12-27 18:36:54
char
分页插件3指定到某一页

前言--页数多了以后需要指定到某一页（只做了功能，样式没有细调）html ... [详细]

蜡笔小新 2024-12-27 15:19:01
object
Akka BackoffSupervisor的深入解析与实践

本文详细介绍了Akka中的BackoffSupervisor机制，探讨其在处理持久化失败和Actor重启时的应用。通过具体示例，展示了如何配置和使用BackoffSupervisor以实现更细粒度的异常处理。 ... [详细]

蜡笔小新 2024-12-27 15:04:09
text
Python自动化处理：从Word文档提取内容并生成带水印的PDF

本文介绍如何利用Python实现从特定网站下载Word文档，去除水印并添加自定义水印，最终将文档转换为PDF格式。该方法适用于批量处理和自动化需求。 ... [详细]

蜡笔小新 2024-12-27 13:10:20
python
深入理解Python的os和sys模块

本文详细解析了Python中的os和sys模块，介绍了它们的功能、常用方法及其在实际编程中的应用。 ... [详细]

蜡笔小新 2024-12-26 22:04:19
python
寻找满足特定条件的整数N的最大和(a+b)

本文探讨了如何在给定整数N的情况下，找到两个不同的整数a和b，使得它们的和最大，并且满足特定的数学条件。 ... [详细]

蜡笔小新 2024-12-26 19:26:18
filter
卷积神经网络（CNN）基础理论与架构解析

本文介绍了卷积神经网络（CNN）的基本概念、常见结构及其各层的功能。重点讨论了LeNet-5、AlexNet、ZFNet、VGGNet和ResNet等经典模型，并详细解释了输入层、卷积层、激活层、池化层和全连接层的工作原理及优化方法。 ... [详细]

蜡笔小新 2024-12-24 18:58:11
process
优化深度神经网络在低性能硬件上的运行

尽管深度学习带来了广泛的应用前景，其训练通常需要强大的计算资源。然而，并非所有开发者都能负担得起高性能服务器或专用硬件。本文探讨了如何在有限的硬件条件下（如ARM CPU）高效运行深度神经网络，特别是通过选择合适的工具和框架来加速模型推理。 ... [详细]

蜡笔小新 2024-12-24 08:48:32
random
使用TensorFlow实现非线性回归模型

本文介绍了如何利用TensorFlow框架构建一个简单的非线性回归模型。通过生成200个随机数据点进行训练，模型能够学习并预测这些数据点的非线性关系。 ... [详细]

蜡笔小新 2024-12-20 11:54:20
text
机器学习中的相似度度量与模型优化

本文探讨了机器学习中常见的相似度度量方法，包括余弦相似度、欧氏距离和马氏距离，并详细介绍了如何通过选择合适的模型复杂度和正则化来提高模型的泛化能力。此外，文章还涵盖了模型评估的各种方法和指标，以及不同分类器的工作原理和应用场景。 ... [详细]

蜡笔小新 2024-12-26 18:10:02
main
最小路径覆盖与强连通分量的应用：国王的问题

本题探讨了在一个有向图中，如何根据特定规则将城市划分为若干个区域，使得每个区域内的城市之间能够相互到达，并且划分的区域数量最少。题目提供了时间限制和内存限制，要求在给定的城市和道路信息下，计算出最少需要划分的区域数量。 ... [详细]

蜡笔小新 2024-12-23 18:42:12

诚实的愛是最棒的_977_415_874

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章