OpenCV之神经网络(一)

作者：mobiledu2502852643 | 来源：互联网 | 2023-09-12 13:52

人工神经网络(ANN)简称神经网络(NN)，能模拟生物神经系统对物体所作出的交互反应，是由具有适应性的简单单元(称为神经元)组成的广泛并行互连网络。1神

人工神经网络(ANN) 简称神经网络(NN)&＃xff0c;能模拟生物神经系统对物体所作出的交互反应&＃xff0c;是由具有适应性的简单单元(称为神经元)组成的广泛并行互连网络。

1 神经元

1.1 M-P 神经元

如下图所示&＃xff0c;来自其它神经元的信号&＃xff0c;$x_1, x_2, ... , x_n $&＃xff0c;传递过来作为输入信号&＃xff0c;并通过带权重 ($w_1, w_2, ... , w_n$) 的连接 (connection) 继续传递&＃xff0c;

然后神经元的总输入值 $\sum w_i x_i$ 与阈值 $\theta$ 作比较&＃xff0c;最后经过激活函数$\,f\,$产生神经元的输出: $y &＃61; f\left(\,\sum \limits_{i&＃61;1}^n {w_i x_i} - \theta \right)$

1.2 激活函数 (activation function)

理想中&＃xff0c;阶跃函数可作为激活函数&＃xff0c;将输入值映射为输出值 “0” 和 “1&＃xff1b;实际中&＃xff0c;常用 Sigmoid 函数作激活函数&＃xff0c; $f(x)&＃61;\,\dfrac{1}{1&＃43;e^{-x}}$&＃xff0c;如下图所示&＃xff1a;

OpenCV 中使用的激活函数是另一种形式&＃xff0c;$f(x)&＃61;\beta \,\dfrac{1-e^{-\alpha x}}{1&＃43;e^{-\alpha x}}$

当 α &＃61; β &＃61; 1 时&＃xff0c;$f(x)&＃61;\dfrac{1-e^{-x}}{1&＃43;e^{x}}$&＃xff0c;该函数把可能在较大范围内变化的输入值&＃xff0c;“挤压” 到 (-1, 1) 的输出范围内

具体的设置函数如下&＃xff0c;param1 --> α&＃xff0c;param2 --> β

// 设置激活函数&＃xff0c;目前只支持 ANN_MLP::SIGMOID_SYM
virtual void cv::ml::ANN_MLP::setActivationFunction(int type, double param1 &＃61; 0, double param2 &＃61; 0);

2 神经网络

2.1 感知机 (perceptron)

感知机由两层神经元组成&＃xff0c;输入层接收外界输入信号&＃xff0c;而输出层则是一个 M-P 神经元。

实际上&＃xff0c;感知机可视为一个最简单的“神经网络”&＃xff0c;用它可很容易的实现逻辑与、或、非等简单运算。

2.2 层级结构

常见的神经网络&＃xff0c;可分为三层&＃xff1a;输入层、隐含层、输出层。输入层接收外界输入&＃xff0c;隐层和输出层负责对信号进行加工&＃xff0c;输出层输出最终的结果。

以下图为例&＃xff1a;每层神经元与下一层神经元全互连&＃xff0c;而同层神经元之间不连接&＃xff0c;也不存在跨层连接&＃xff0c;这样的结构称为“多层前馈神经网络”(multi-layer feedforward neural networks)

2.3 层数设置

OpenCV 中&＃xff0c;设置神经网络层数和神经元个数的函数为 setLayerSizes(InputArray _layer_sizes)&＃xff0c;则上图对应的 InputArray 可由如下代码来构成

// (a) 3层&＃xff0c;输入层神经元个数为 4&＃xff0c;隐层的为 6&＃xff0c;输出层的为 4
Mat layers_size &＃61; (Mat_<int>(1,3) <<4,6,4);// (b) 4层&＃xff0c;输入层神经元个数为 4&＃xff0c;第一个隐层的为 6&＃xff0c;第二个隐层的为 5&＃xff0c;输出层的为 4
Mat layers_size &＃61; (Mat_<int>(1,4) <<4,6,5,4);

如何设置隐层神经元的个数仍是个未决的问题&＃xff0c;实际中多采用“试错法”来调整

3 OpenCV 函数

1) 创建

static Ptr cv::ml::ANN_MLP::create(); // 创建空模型

2) 设置参数

// 设置神经网络的层数和神经元数量
virtual void cv::ml::ANN_MLP::setLayerSizes(InputArray _layer_sizes);// 设置激活函数&＃xff0c;目前只支持 ANN_MLP::SIGMOID_SYM
virtual void cv::ml::ANN_MLP::setActivationFunction(int type, double param1 &＃61; 0, double param2 &＃61; 0); // 设置训练方法&＃xff0c;默认为 ANN_MLP::RPROP&＃xff0c;较常用的是 ANN_MLP::BACKPROP
// 若设为 ANN_MLP::BACKPROP&＃xff0c;则 param1 对应 setBackpropWeightScale()中的参数,param2 对应 setBackpropMomentumScale() 中的参数
virtual void cv::ml::ANN_MLP::setTrainMethod(int method, double param1 &＃61; 0, double param2 &＃61; 0);
virtual void cv::ml::ANN_MLP::setBackpropWeightScale(double val); // 默认值为 0.1
virtual void cv::ml::ANN_MLP::setBackpropMomentumScale(double val); // 默认值为 0.1// 设置迭代终止准则&＃xff0c;默认为 TermCriteria(TermCriteria::MAX_ITER &＃43; TermCriteria::EPS, 1000, 0.01)
virtual void cv::ml::ANN_MLP::setTermCriteria(TermCriteria val);

3) 训练

// samples - 训练样本; layout - 训练样本为 “行样本” ROW_SAMPLE 或 “列样本” COL_SAMPLE; response - 对应样本数据的分类结果
virtual bool cv::ml::StatModel::train(InputArray samples,int layout,InputArray responses);

4) 预测

// samples&＃xff0c;输入的样本书数据&＃xff1b;results&＃xff0c;输出矩阵&＃xff0c;默认不输出&＃xff1b;flags&＃xff0c;标识&＃xff0c;默认为 0
virtual float cv::ml::StatModel::predict(InputArray samples, OutputArray results&＃61;noArray(),int flags&＃61;0) const;　　　　　　

4 代码示例

下面是 OpenCV 3.3 中&＃xff0c;在“支持向量机”的例程上做的修改&＃xff0c;使用 BP 神经网络&＃xff0c;实现了和 SVM 相同的分类功能。

OpenCV 中的支持向量机 (Support Vector Machine)&＃xff0c;可参见另一篇博文 OpenCV 之支持向量机 (一)

1 #include "opencv2/core/core.hpp"
2 #include "opencv2/imgproc/imgproc.hpp"
3 #include "opencv2/imgcodecs/imgcodecs.hpp"
4 #include "opencv2/highgui/highgui.hpp"
5 #include "opencv2/ml/ml.hpp"
6
7 using namespace cv;
8
9 int main()
10 {
11 // 512 x 512 零矩阵
12 int width &＃61; 512, height &＃61; 512;
13 Mat img &＃61; Mat::zeros(height, width, CV_8UC3);
14
15 // 训练样本
16 float train_data[6][2] &＃61; { { 500, 60 },{ 245, 40 },{ 480, 250 },{ 160, 380 },{400, 25},{55, 400} };
17 float labels[6] &＃61; {0,0,0,1,0,1}; // 每个样本数据对应的输出
18 Mat train_data_mat(6, 2, CV_32FC1, train_data);
19 Mat labels_mat(6, 1, CV_32FC1, labels);
20
21 // BP 模型创建和参数设置
22 Ptr bp &＃61; ml::ANN_MLP::create();
23
24 Mat layers_size &＃61; (Mat_<int>(1,3) <<2,6,1); // 2维点&＃xff0c;1维输出
25 bp->setLayerSizes(layers_size);
26
27 bp->setTrainMethod(ml::ANN_MLP::BACKPROP,0.1,0.1);
28 bp->setActivationFunction(ml::ANN_MLP::SIGMOID_SYM);
29 bp->setTermCriteria(TermCriteria(TermCriteria::MAX_ITER, 10000, /*FLT_EPSILON*/1e-6));
30
31 // 保存训练好的神经网络参数
32 bool trained &＃61; bp->train(train_data_mat,ml::ROW_SAMPLE,labels_mat);
33 if (trained) {
34 bp->save("bp_param");
35 }
36
37 // 创建训练好的神经网络
38 // Ptr bp &＃61; ml::ANN_MLP::load("bp_param");
39
40 // 显示分类的结果
41 Vec3b green(0, 255, 0), blue(255, 0, 0);
42 for (auto i&＃61;0; ii) {
43 for (auto j&＃61;0; jj) {
44 Mat sample_mat &＃61; (Mat_<float>(1, 2) << j, i);
45 Mat response_mat;
46 bp->predict(sample_mat,response_mat);
47 float response &＃61; response_mat.ptr<float>(0)[0];
48 if (response > 0.5) {
49 img.at(i, j) &＃61; green;
50 } else if (response <0.5) {
51 img.at(i, j) &＃61; blue;
52 }
53 }
54 }
55
56 // 画出训练样本数据
57 int thickness &＃61; -1;
58 int lineType &＃61; 8;
59 circle(img, Point(500, 60), 5, Scalar(255, 255, 255), thickness, lineType);
60 circle(img, Point(245, 40), 5, Scalar(255, 255, 255), thickness, lineType);
61 circle(img, Point(480, 250), 5, Scalar(255, 255, 255), thickness, lineType);
62 circle(img, Point(160, 380), 5, Scalar(0, 0, 255), thickness, lineType);
63 circle(img, Point(400, 25), 5, Scalar(255, 255, 255), thickness, lineType);
64 circle(img, Point(55, 400), 5, Scalar(0, 0, 255), thickness, lineType);
65
66 imwrite("result.png", img); // 保存训练的结果
67 imshow("BP Simple Example", img);
68
69 waitKey(0);
70 }

运行结果如下所示:

注意&＃xff1a;OpenCV 3.0 以上版本&＃xff0c;相较之前的版本&＃xff0c;其中有关机器学习的部分做了较大改动&＃xff0c;本人也是踩了一些坑才得到预期的效果。

1) 代码 #25&＃xff0c;必须在 setActivationFunction() 之前&＃xff0c;否则训练后的结果多为 nan

2) 代码 #46&＃xff0c;response_mat 为预测的结果。若输出向量为 1 列&＃xff0c;则如 #47 所示&＃xff0c;可直接取出预测结果&＃xff1b;若输出向量为 n 列&＃xff0c;则可取平均值或者最大值。

同时&＃xff0c;根据平均值或最大值&＃xff0c;代码 #48 处的阈值也要相应的改变。

float response &＃61; 0;for (auto i&＃61;0;ii) {response &＃43;&＃61; response_mat.ptr<float>(0)[i];}

3) 代码 #39&＃xff0c;若已经训练好神经网络的参数&＃xff0c;并将其保存到文件 bp_param 中。

则可将 #22 ~ #35 全部注释掉&＃xff0c;再反注释掉 #38&＃xff0c;这样&＃xff0c;直接加载训练好的神经网络&＃xff0c;便可以使用了。

参考资料

<机器学习> 周志华第5章

<统计学习方法> 李航第1章

OpenCV 3.0 Tutorials -- Neural Networks

OpenCV进阶之路&＃xff1a;神经网络识别车牌字符 ☆Ronny丶

【模式识别】OpenCV中使用神经网络 CvANN_MLP xiaowei_cqu

转:https://www.cnblogs.com/xinxue/p/5789421.html

推荐阅读

select
求助：C语言实现哈夫曼树编码与解码系统

最近遇到了一道关于哈夫曼树的编程题目，需要在下午之前完成。题目要求设计一个哈夫曼编码和解码系统，能够反复显示和处理多个项目，直到用户选择退出。希望各位大神能够提供帮助。 ... [详细]

蜡笔小新 2024-11-15 19:59:41
get
短视频app源码，Android开发底部滑出菜单

短视频app源码，Android开发底部滑出菜单首先依赖三方库implementationandroidx.appcompat:appcompat:1.2.0im ... [详细]

蜡笔小新 2024-11-15 15:35:01
join
C语言编写线程池的简单实现方法

2019独角兽企业重金招聘Python工程师标准好文章，一起分享——有时我们会需要大量线程来处理一些相互独立的任务，为了避免频繁的申请释放线程所带 ... [详细]

蜡笔小新 2024-11-14 20:11:23
const
Magician - 区间查询与合并问题

题目描述：给定一个区间，支持两种操作：1. 将位置a的值修改为b；2. 查询区间[a, b]内的子序列的最大和，其中子序列中相邻的元素必须具有不同的奇偶性。 ... [详细]

蜡笔小新 2024-11-14 19:57:14
const
普通树(每个节点可以有任意数量的子节点)级序遍历

普通树(每个节点可以有任意数量的子节点)级序遍历 ... [详细]

蜡笔小新 2024-11-14 18:53:26
const
NOI Open Judge 6049: 购书问题的动态规划解法

本文介绍了 NOI Open Judge 6049 购书问题的详细解法，代码简洁易懂，并附有详细的注释和解释。 ... [详细]

蜡笔小新 2024-11-14 13:04:13
instance
自定义 Android 圆形进度条视图，支持显示数字和中心文字

本文介绍了一种自定义的Android圆形进度条视图，支持在进度条上显示数字，并在圆心位置展示文字内容。通过自定义绘图和组件组合的方式实现，详细展示了自定义View的开发流程和关键技术点。示例代码和效果展示将在文章末尾提供。 ... [详细]

蜡笔小新 2024-11-10 13:04:42
instance
使用 ListView 浏览安卓系统中的回收站文件

使用 ListView 浏览安卓系统中的回收站文件 ... [详细]

蜡笔小新 2024-11-09 16:34:55
const
FFMpeg学习进阶：音频处理基础理论与重采样技术详解

在Android平台中，播放音频的采样率通常固定为44.1kHz，而录音的采样率则固定为8kHz。为了确保音频设备的正常工作，底层驱动必须预先设定这些固定的采样率。当上层应用提供的采样率与这些预设值不匹配时，需要通过重采样（resample）技术来调整采样率，以保证音频数据的正确处理和传输。本文将详细探讨FFMpeg在音频处理中的基础理论及重采样技术的应用。 ... [详细]

蜡笔小新 2024-11-09 13:46:55
const
C++ 编程指南：第16条——在对应的新建和删除操作中使用相同的形式

当使用 `new` 表达式（即通过 `new` 动态创建对象）时，会发生两件事：首先，内存被分配用于存储新对象；其次，该对象的构造函数被调用以初始化对象。为了确保资源管理的一致性和避免内存泄漏，建议在使用 `new` 和 `delete` 时保持形式一致。例如，如果使用 `new[]` 分配数组，则应使用 `delete[]` 来释放内存；同样，如果使用 `new` 分配单个对象，则应使用 `delete` 来释放内存。这种一致性有助于防止常见的编程错误，提高代码的健壮性和可维护性。 ... [详细]

蜡笔小新 2024-11-09 12:21:19
const
逻辑运算详解

本文详细介绍了逻辑运算符 &&、|| 和 ! 的使用方法及其在编程中的应用，包括短路逻辑运算的特性。 ... [详细]

蜡笔小新 2024-11-15 20:30:45
filter
OpenGLPBO

PBO(PixelBufferObject),将像素数据存储在显存中。优点：1、快速的像素数据传递，它采用了一种叫DMA（DirectM ... [详细]

蜡笔小新 2024-11-15 14:56:34
function
Python中调整数据分辨率的方法

本文介绍了如何在Python中使用插值方法将不同分辨率的数据统一到相同的分辨率。 ... [详细]

蜡笔小新 2024-11-14 15:10:26
foreach
包含phppdoerrorcode的词条

包含phppdoerrorcode的词条 ... [详细]

蜡笔小新 2024-11-14 12:06:14

mobiledu2502852643

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章