OpenCV基于残差网络实现人脸检测

作者：技术交流 | 来源：互联网 | 2023-05-17 18:22

在OpenCVDNN模块中基于残

OpenCV基于残差网络实现人脸检测
OpenCV3.3版本第一次把深度神经网络(DNN)模块引入到正式发布版本中，最新的OpenCV3.4中DNN模块发布了两个必杀技，一个支持Faster R-CNN的对象检测，比SSD与YOLO这些模型有更好的检测精度与小对象检测能力，另外一个是支持基于SSD+Resnet模型的人脸检测，虽然速度还达不到HAAR级联检测器的实时性，但是准确性与模型泛化能力可以说完爆HAAR级联检测器方式的人脸检测算法。作为OpenCV开发者需要人脸检测功能时候又多了一种更加可靠的选择，这里我们首先简单介绍一下什么是残差网络，然后给出其人脸检测模型在OpenCV基于摄像头实时人脸检测演示。
一：残差网络(Resnet)
最初的CNN网络LeNet与AlexNet卷积层都比较少，VGG通过小的卷积核实现了网络深度的增加取得了显著效果，但是当层数过度增加的时候就发现训练错误与测试错误都在增加，图示如下：
技术分享图片

最开始人们以为是因为梯度消失或者梯度爆炸导致的，不过随着大家的努力，认为这个不是一个过拟合问题，而是网络褪化现象，所以针对这种情况，MSRA何凯明团队提出了一种新的网络模型-Residual Networks，其主要思想是使用残差结构来训练网络，一个残差结构如下：
技术分享图片

作者认为F(x) = H(x)-x所以得到H(x) = F(x) + x这样的恒等映射，然后作者就建立34层plain网络与34层的残差网络作为对比，而最左边的VGG-19网络作为参考，整个的网络结构显示如下：
--- 图太大啦！！！
模型建立好的之后，作者在不同的数据集上进行了训练与测试，均观察到残差网络的效果要明显优于34层plain网络，而且发现基于残差结构的网络层数越深效果越好，而34层plain网络跟18层的plain网络相比有明显的褪化现象出现。对比训练的结果如下：
技术分享图片

在残差网络没有出来之前，很少有网络的层数会超过100层，但是残差网络可以达到上千层，毫无疑问何凯明团队也凭借残差网络模型在2015年的ImageNet图像分类比赛中获得了冠军，当时使用152层的残差网络。OpenCV中人脸检测的残差网络模型是基于SSD实现的，所以速度还是挺快的，而且效果是特别的好。废话不多说了，下面我就看看OpenCV中如何使用它实现人脸检测。
二：人脸检测代码实现
模型是基于Caffe网络训练生成的，所以在开始写程序之前的第一件事情就是要下载模型文件与描述文件，这个我已经下载好了，大家就不用×××了，直接去我的github地址上下载模型文件即可
https://github.com/gloomyfish1998/opencv_tutorial
下载好模型之后放在本地的一个文件夹下即可，然后就可以开始编程工作啦。
首先需要加载模型成网络：

    String modelDesc = "D:/vcprojects/images/dnn/face/deploy.prototxt";
    String modelBinary = "D:/vcprojects/images/dnn/face/res10_300x300_ssd_iter_140000.caffemodel";
    // 初始化网络
    dnn::Net net = readNetFromCaffe(modelDesc, modelBinary);
    if (net.empty())
    {
        printf("could not load net...\n");
        return -1;
    }

然后要打开本地相机或者一段视频文件，使用VideoCapture对象即可，代码如下：

// 打开摄像头
    VideoCapture capture(0);
    if (!capture.isOpened()) {
        printf("could not load camera...\n");
        return -1;
    }

打开相机成功之后就可以读写每帧图像，然后转换成网络可以接受的数据类型，代码如下：

        // 输入数据调整
        Mat inputBlob = blobFromImage(frame, inScaleFactor,
            Size(inWidth, inHeight), meanVal, false, false); 
        net.setInput(inputBlob, "data");

然后在OpenCV中通过调用net.forward实现检测，对结果提取置信分数(0~1)之间，对大于阈值(假设0.5)的提取BOX位置，就可以绘制矩形框显示了，这部分的代码如下：

// 人脸检测
        Mat detection = net.forward("detection_out"); 
        vector layersTimings;
        double freq = getTickFrequency() / 1000;
        double time = net.getPerfProfile(layersTimings) / freq;
        Mat detectionMat(detection.size[2], detection.size[3], CV_32F, detection.ptr());

        ostringstream ss;
        ss <<"FPS: " <<1000 / time <<" ; time: " <(i, 2);
            if (confidence > confidenceThreshold)
            {
                int xLeftBottom = static_cast(detectionMat.at(i, 3) * frame.cols);
                int yLeftBottom = static_cast(detectionMat.at(i, 4) * frame.rows);
                int xRightTop = static_cast(detectionMat.at(i, 5) * frame.cols);
                int yRightTop = static_cast(detectionMat.at(i, 6) * frame.rows);

                Rect object((int)xLeftBottom, (int)yLeftBottom,
                    (int)(xRightTop - xLeftBottom),
                    (int)(yRightTop - yLeftBottom));

                rectangle(frame, object, Scalar(0, 255, 0));

                ss.str("");
                ss <


最终运行显示结果如下， 脸部无遮挡，正常情况下：

脸部无遮挡，头部倾斜的情况下：

脸部有遮挡的情况下：

更多倾斜、侧脸、模糊等各种情况下：

可见残差网络模型是何等的强大，到这里是不是该点一首《凉凉》送给HAAR级联检测器了。上述demo完整源代码，可以在GITHUB上下载。
https://github.com/gloomyfish1998/opencv_tutorial
OpenCV DNN 教程学习
OpenCV基于残差网络实现人脸检测




    
        
                        android
                        asp.net
                        php
                        jsp
                        数据库
                        windows
                        html
                        js
                        css
                    
    



    
        写下你的评论吧 !
        
            
                吐个槽吧,看都看了
            
            
                
                                        会员登录 | 用户注册
                                    
                
            
        

        
    

    
        推荐阅读
        
            
                                
                    
                        function
                        基于layUI的图片上传前预览功能的2种实现方式
                    

                    
                                                
                            
                        
                                                
                        本文介绍了基于layUI的图片上传前预览功能的两种实现方式：一种是使用blob+FileReader，另一种是使用layUI自带的参数。通过选择文件后点击文件名，在页面中间弹窗内预览图片。其中，layUI自带的参数实现了图片预览功能。该功能依赖于layUI的上传模块，并使用了blob和FileReader来读取本地文件并获取图像的base64编码。点击文件名时会执行See()函数。摘要长度为169字。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-14 17:06:58
                    

                

                
                                
                    
                        list
                        Mac OS 升级到11.2.2 Eclipse打不开了，报错Failed to create the Java Virtual Machine
                    

                    
                                                
                            
                        
                                                
                        本文介绍了在Mac OS升级到11.2.2版本后，使用Eclipse打开时出现报错Failed to create the Java Virtual Machine的问题，并提供了解决方法。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-14 12:01:13
                    

                

                                
                    
                    
                
                
                                
                    
                        const
                        Hibernate基础映射
                    

                    
                                                
                        在说Hibernate映射前，我们先来了解下对象关系映射ORM。ORM的实现思想就是将关系数据库中表的数据映射成对象，以对象的形式展现。这样开发人员就可以把对数据库的操作转化为对 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-14 10:57:47
                    

                

                
                                
                    
                        php
                        SpringBoot集成前端模版（thymeleaf）的配置步骤
                    

                    
                                                
                        本文介绍了在SpringBoot中集成thymeleaf前端模版的配置步骤，包括在application.properties配置文件中添加thymeleaf的配置信息，引入thymeleaf的jar包，以及创建PageController并添加index方法。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-14 10:11:46
                    

                

                
                                
                    
                        php
                        java 线程死锁模拟
                    

                    
                                                
                        1，关于死锁的理解死锁，我们可以简单的理解为是两个线程同时使用同一资源，两个线程又得不到相应的资源而造成永无相互等待的情况。 2，模拟死锁背景介绍：我们创建一个朋友 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-13 19:12:25
                    

                

                
                                
                    
                        php
                        《数据结构》学习笔记3——串匹配算法性能评估
                    

                    
                                                
                            
                        
                                                
                        本文主要讨论串匹配算法的性能评估，包括模式匹配、字符种类数量、算法复杂度等内容。通过借助C++中的头文件和库，可以实现对串的匹配操作。其中蛮力算法的复杂度为O(m*n)，通过随机取出长度为m的子串作为模式P，在文本T中进行匹配，统计平均复杂度。对于成功和失败的匹配分别进行测试，分析其平均复杂度。详情请参考相关学习资源。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-13 16:16:05
                    

                

                
                                
                    
                        php
                        ABAP开发发送邮件程序的配置和代码整理
                    

                    
                                                
                        本文介绍了通过ABAP开发往外网发邮件的需求，并提供了配置和代码整理的资料。其中包括了配置SAP邮件服务器的步骤和ABAP写发送邮件代码的过程。通过RZ10配置参数和icm/server_port_1的设定，可以实现向Sap User和外部邮件发送邮件的功能。希望对需要的开发人员有帮助。摘要长度：184字。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-13 15:50:17
                    

                

                
                                
                    
                        php
                        工程中添加Android Dependencies
                    

                    
                                                
                        在project.properties添加#Projecttarget.targetandroid-19android.library.reference.1..Sliding ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-13 12:08:09
                    

                

                
                                
                    
                        input
                        猜字母游戏
                    

                    
                                                
                            
                        
                                                
                        猜字母游戏猜字母游戏——设计数据结构猜字母游戏——设计程序结构猜字母游戏——实现字母生成方法猜字母游戏——实现字母检测方法猜字母游戏——实现主方法1猜字母游戏——设计数据结构1.1 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-13 12:04:03
                    

                

                
                                
                    
                        php
                        PDF内容编辑的两种小方法，你知道怎么操作吗？
                    

                    
                                                
                            
                        
                                                
                        本文介绍了两种PDF内容编辑的方法：迅捷PDF编辑器和Adobe Acrobat DC。使用迅捷PDF编辑器，用户可以通过选择需要更改的文字内容并设置字体形式、大小和颜色来编辑PDF文件。而使用Adobe Acrobat DC，则可以通过在软件中点击编辑来编辑PDF文件。PDF文件的编辑可以帮助办公人员进行文件内容的修改和定制。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-12 19:37:50
                    

                

                
                                
                    
                        php
                        CentOS 6.5安装VMware Tools及共享文件夹显示问题解决方法
                    

                    
                                                
                            
                        
                                                
                        本文介绍了在CentOS 6.5上安装VMware Tools及解决共享文件夹显示问题的方法。包括清空CD/DVD使用的ISO镜像文件、创建挂载目录、改变光驱设备的读写权限等步骤。最后给出了拷贝解压VMware Tools的操作。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-12 18:18:49
                    

                

                
                                
                    
                        input
                        深入理解CSS中的margin属性及其应用场景
                    

                    
                                                
                            
                        
                                                
                        本文主要介绍了CSS中的margin属性及其应用场景，包括垂直外边距合并、padding的使用时机、行内替换元素与费替换元素的区别、margin的基线、盒子的物理大小、显示大小、逻辑大小等知识点。通过深入理解这些概念，读者可以更好地掌握margin的用法和原理。同时，文中提供了一些相关的文档和规范供读者参考。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-12 18:01:10
                    

                

                
                                
                    
                        php
                        腾讯BERT推理模型TurboTransformers的快速推理能力
                    

                    
                                                
                        本文介绍了腾讯最近开源的BERT推理模型TurboTransformers，该模型在推理速度上比PyTorch快1~4倍。TurboTransformers采用了分层设计的思想，通过简化问题和加速开发，实现了快速推理能力。同时，文章还探讨了PyTorch在中间层延迟和深度神经网络中存在的问题，并提出了合并计算的解决方案。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-12 13:48:41
                    

                

                
                                
                    
                        input
                        hdu4888 Redraw Beautiful Drawings
                    

                    
                                                
                        本文介绍了一道网络流题目hdu4888 Redraw Beautiful Drawings的解题思路。题目要求以行和列作为结点建图，并通过最大流算法判断是否有解以及是否唯一。文章详细介绍了建图和算法的过程，并强调在dfs过程中要进行回溯。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-12 11:54:35
                    

                

                
                                
                    
                        list
                        Python解析C语言结构体
                    

                    
                                                
                        本文介绍了使用Python解析C语言结构体的方法，包括定义基本类型和结构体类型的字典，并提供了一个示例代码，展示了如何解析C语言结构体。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-11 18:45:50

















    

    
        
            
            
                
                
            

            
                技术交流            

            
                这个家伙很懒，什么也没留下！            


        
    

    
    

    
    

    
        Tags | 热门标签
        
            
                                
                    php
                
                                
                    audio
                
                                
                    nodejs
                
                                
                    tags
                
                                
                    input
                
                                
                    split
                
                                
                    flutter
                
                                
                    import
                
                                
                    format
                
                                
                    const
                
                                
                    less
                
                                
                    javascript
                
                                
                    substring
                
                                
                    subset
                
                                
                    timezone
                
                                
                    list
                
                                
                    function
                
                                
                    chat
                
                                
                    shell
                
                                
                    php7
                
                                
                    plugins
                
                                
                    filter
                
                                
                    usb
                
                                
                    header
                
                                
                    metadata
                
                                
                    buffer
                
                                
                    web3
                
                                
                    cSharp
                
                                
                    callback
                
                                
                    join
                
                                
            
        
    

    
    
        
            
            
        
        RankList | 热门文章
        
            
                                
                    1AoCoder 1983 [AGC001E] BBQ Hard（组合数+dp）
                
                                
                    2如何在不编写平台特定代码的情况下将页面从任何匿名页面A切换到已知页面B
                
                                
                    3返璞归真系列｜解读 Polygon 最新进展与竞争态势
                
                                
                    4弱电机房工程详细规划设计，看看大神设计方案，学习好的思路
                
                                
                    5ZOJ3717 Balloon(2SAT)
                
                                
                    6org.hamcrest.Matchers.sameInstance()方法的使用及代码示例
                
                                
                    7AMD全新企业级CPU与APU路线图曝光
                
                                
                    8集成电路与摩尔定律的关系,摩尔定律的内容主要表述为集成电路上
                
                                
                    9node笔记(二)fs模块中
                
                                
                    10python requests cookie保存_Python接口自动化之cookie、session应用
                
                                
                    11RoadMap：如何创建产品路线图
                
                                
                    12闲鱼如何保障交易链路质量
                
                                
                    13float类型转integer_【第3章：Java基础程序设计】_Java数据类型
                
                                
                    14设置 Spring Boot 的定时任务线程池以优雅退出
                
                                
                    15如何在Python 2.7中使用带有IGNORECASE的re.sub？ - How can I use re.sub with IGNORECASE in Python 2.7?