当前位置: 开发笔记 > 编程语言 > 正文

CV2——学习笔记图像分类

作者：霞慧水灵灵_973 | 来源：互联网 | 2023-09-18 10:14

1.图像分类?2.神经网络原理?1.卷积神经网络介绍?2.利用caffe搭建深度网络做图像分类挑战：光照变化+形变。类内变化。标签、预测函数，泛化能力。如何提高泛化能力？需要用图像

1.图像分类 • 2.神经网络原理 • 1.卷积神经网络介绍 • 2.利用caffe搭建深度网络做图像分类

挑战：光照变化+形变。类内变化。

技术分享图片

标签、预测函数，泛化能力。

如何提高泛化能力？需要用图像特征来描述图像。

技术分享图片

颜色特征：直方图。

形状特征：PCA降维。

局部特征细节、纹理。

技术分享图片

SIFT特征：局部，4*4区域的16格内，每个格子内算8维梯度，拼成128维特征。用于检测匹配。

HOG：检测目标形状。用于检测、跟踪。

LBP：对区域编码，适合处理人脸，对称的均匀的。可以有效捕捉响应。

Harr：滤波器。边缘。

VLFeat - Home http://www.vlfeat.org/

SVM分类：

技术分享图片

最大化间隔：

技术分享图片

CNN特征：大量图像中学习出来的特征。Imagenet1000类。

神经网络做图像分类：

技术分享图片

CS231n Convolutional Neural Networks for Visual Recognition http://cs231n.github.io/convolutional-networks/

神经网络搭建：

技术分享图片

神经网络的基本单元：神经元

技术分享图片

激励函数：

技术分享图片

卷积层：

技术分享图片

卷积滤波的计算：

Stride = 1, pad =2,

输出的尺寸=（输入尺寸+2*pad-kernel_size）/stride + 1

技术分享图片

卷积层可视化：

卷积提取的特征为什么有效果。传统的只是表层特征，深层特征无法获得。技术分享图片

池化层(pooling layer)：平均池化、最大池化。特征亚采样。

特征表达更加紧凑，同时具有位移不变性。

技术分享图片

全连接层：全连接权重是W。

技术分享图片

损失函数：

• SIGMOID_CROSS_ENTROPY_LOSS

• SOFTMAX_LOSS

• EUCLIDEAN_LOSS

• Contrastive loss

• Triplet Loss

不同的task对应着不同的loss

交叉熵损失函数（SIGMOID_CROSS_ENTROPY_LOSS）：

Sigmoid函数把负无穷到正无穷压缩到-1~+1。应用于二分类问题。

技术分享图片

Softmax 损失函数（SOFTMAX_LOSS）：多分类问题

技术分享图片

欧式距离损失函数(EUCLIDEAN_LOSS)：

技术分享图片

对比损失函数(Contrastive loss)：用于图像分类、检索。

训练 Siamese 网络，用来计算两个图像之间的相似度,image match。输入两张图。

技术分享图片

Triplet loss：三元，输入三张图。

技术分享图片

http://blog.csdn.net/tangwei2014/article/details/46788025

训练网络、测试

技术分享图片

http://caffe.berkeleyvision.org/tutorial/forward_backward.html

Caffe 实现一个图像分类任务 • 安装教程：

• Windows环境：http://www.cnblogs.com/trantor/p/4570097.html

• Linux环境：http://www.cnblogs.com/denny402/p/5067265.html

推荐阅读

uri
UVALive 8201 - BBP 公式计算圆周率

在1995年，Simon Plouffe 发现了一种特殊的求和方法来表示某些常数。两年后，Bailey 和 Borwein 在他们的论文中发表了这一发现，这种方法被命名为 Bailey-Borwein-Plouffe (BBP) 公式。该问题要求计算圆周率 π 的第 n 个十六进制数字。 ... [详细]

蜡笔小新 2024-11-21 18:32:57
install
DedeCMS 手机端站点配置与优化指南

本文详细介绍如何安装和配置DedeCMS的移动端站点，包括新版本安装、老版本升级、模板适配以及必要的代码修改，以确保移动站点的正常运行。 ... [详细]

蜡笔小新 2024-11-22 18:44:25
config
如何将 Git 提交编辑器从 Nano 更改为 Vim

默认情况下，Git 使用 Nano 编辑器进行提交信息的编辑，但如果您更喜欢使用 Vim，可以通过简单的配置更改来实现这一变化。本文将指导您如何通过修改全局配置文件来设置 Vim 作为默认的 Git 提交编辑器。 ... [详细]

蜡笔小新 2024-11-22 14:08:35
config
在Notepad++中配置Markdown语法高亮及实时预览功能

本文详细介绍了如何在Notepad++中配置Markdown语法高亮和实时预览功能，包括必要的插件安装和设置步骤。 ... [详细]

蜡笔小新 2024-11-22 13:03:49
config
网络流24题——试题库问题

题目描述：假设一个试题库中有n道试题。每道试题都标明了所属类别。同一道题可能有多个类别属性。现要从题库中抽取m道题组成试卷。并要求试卷包含指定类型的试题。试设计一个满足要求的组卷算 ... [详细]

蜡笔小新 2024-11-22 11:33:55
random
为何Compose与Swarm之后仍有Kubernetes的诞生？

探讨在已有Compose和Swarm的情况下，Kubernetes是如何以其独特的设计理念和技术优势脱颖而出，成为容器编排领域的领航者。 ... [详细]

蜡笔小新 2024-11-22 09:26:11
java
H5技术实现经典游戏《贪吃蛇》

本文将分享一个使用HTML5技术实现的经典小游戏——《贪吃蛇》。通过H5技术，我们将探讨如何构建这款游戏的两种主要玩法：积分闯关和无尽模式。 ... [详细]

蜡笔小新 2024-11-21 20:16:59
uri
SIP基础概览

本文介绍了SIP（Session Initiation Protocol，会话发起协议）的基本概念、功能、消息格式及其实现机制。SIP是一种在IP网络上用于建立、管理和终止多媒体通信会话的应用层协议。 ... [详细]

蜡笔小新 2024-11-21 17:42:08
java
二维码的实现与应用

本文介绍了二维码的基本概念、分类及其优缺点，并详细描述了如何使用Java编程语言结合第三方库（如ZXing和qrcode.jar）来实现二维码的生成与解析。 ... [详细]

蜡笔小新 2024-11-21 17:10:15
byte
IC卡操作功能实现

本文介绍了如何通过C#语言调用动态链接库（DLL）中的函数来实现IC卡的基本操作，包括初始化设备、设置密码模式、获取设备状态等，并详细展示了将TextBox中的数据写入IC卡的具体实现方法。 ... [详细]

蜡笔小新 2024-11-21 11:02:19
byte
iOS 应用生命周期详解

本文详细介绍了iOS应用的生命周期，包括各个状态及其转换过程中的关键方法调用。 ... [详细]

蜡笔小新 2024-11-20 23:23:07
const
深入理解C++中的自定义String类实现

本文探讨了一种常见的C++面试题目——实现自己的String类。通过此过程，不仅能够检验开发者对C++基础知识的掌握程度，还能加深对其高级特性的理解。文章详细介绍了如何实现基本的功能，如构造函数、析构函数、拷贝构造函数及赋值运算符重载等。 ... [详细]

蜡笔小新 2024-11-22 19:21:22
const
CentOS 服务器自定义密码策略

随着Linux操作系统的广泛使用，确保用户账户及系统安全变得尤为重要。用户密码的复杂性直接关系到系统的整体安全性。本文将详细介绍如何在CentOS服务器上自定义密码规则，以增强系统的安全性。 ... [详细]

蜡笔小新 2024-11-22 19:15:42
java
如何在没有提交按钮的情况下提交HTML表单？

探讨了在HTML表单中使用元素代替进行表单提交的方法。 ... [详细]

蜡笔小新 2024-11-22 17:48:42
get
JavaScript 跨域解决方案详解

本文详细介绍了JavaScript在不同域之间进行数据传输或通信的技术，包括使用JSONP、修改document.domain、利用window.name以及HTML5的postMessage方法等跨域解决方案。 ... [详细]

蜡笔小新 2024-11-22 16:27:56

霞慧水灵灵_973

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章