热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

基于opencv的识别器

1问题背景生物识别技术被广泛用于政府、军队、银行、社会福利保障、电子商务、安全防务等领域。随着技术的进一步成熟和社会认同度的提高,包含在生物识别技术的人脸识别技术将应用在更多的领域




1 问题背景

生物识别技术被广泛用于政府、军队、银行、社会福利保障、电子商务、安全防务等领域。随着技术的进一步成熟和社会认同度的提高,包含在生物识别技术的人脸识别技术将应用在更多的领域,例如:
1、企业、住宅安全和管理。
2、电子护照及身份证。
3、公安、司法和刑侦。
4、自助服务。
5、信息安全。
在本次实验将完成以下内容:
1用opencv自带的Harr级联分类器进行人脸、人眼与微笑识别
2训练自己的级联分类器,训练过程参考自官网:https://docs.opencv.org/2.4/doc/user_guide/ug_traincascade.html


2 环境配置

2.1 安装opencv

activate tf2
pip install opencv-pytho

2.2 测试

安装成功后可在tf2(tensorflow2.0)环境下测试
测试截图


3 人脸检测

可以看到opencv自带的识别模型如下:

在这里插入图片描述


3.1 静态图片检测

eg.py:

# 导入opencv-python
import cv2
# 读入一张图片,引号里为图片的路径,需要你自己手动设置
img = cv2.imread('dogs.jpg')
# 导入人脸级联分类器引擎,'.xml'文件里包含训练出来的人脸特征
face_engine = cv2.CascadeClassifier('dog_cascade.xml')
# 用人脸级联分类器引擎进行人脸识别,返回的faces为人脸坐标列表,1.3是放大比例,5是重复识别次数
faces = face_engine.detectMultiScale(img,scaleFactor=1.3,minNeighbors=5)
# 对每一张脸,进行如下操作
for (x,y,w,h) in faces:
# 画出人脸框,蓝色(BGR色彩体系),画笔宽度为2
img = cv2.rectangle(img,(x,y),(x+w,y+h),(0,255,0),2)
# 在"img2"窗口中展示效果图
cv2.imshow('img2',img)
# 监听键盘上任何按键,如有按键即退出并关闭窗口,并将图片保存为output.jpg
cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.imwrite('output.jpg',img)

测试输入:
在这里插入图片描述
测试输出:
在这里插入图片描述


3.2 动态摄像头检测

import cv2
face_cascade = cv2.CascadeClassifier(cv2.data.haarcascades+'haarcascade_frontalface_default.xml')
eye_cascade = cv2.CascadeClassifier(cv2.data.haarcascades+'haarcascade_eye.xml')
smile_cascade = cv2.CascadeClassifier(cv2.data.haarcascades+'haarcascade_smile.xml')
# 调用摄像头摄像头
cap = cv2.VideoCapture(0)
while(True):
# 获取摄像头拍摄到的画面
ret, frame = cap.read()
faces = face_cascade.detectMultiScale(frame, 1.3, 2)
img = frame
for (x,y,w,h) in faces:
img = cv2.rectangle(img,(x,y),(x+w,y+h),(255,0,0),2)
face_area = img[y:y+h, x:x+w]
## 人眼检测
eyes = eye_cascade.detectMultiScale(face_area,1.3,10)
for (ex,ey,ew,eh) in eyes:
cv2.rectangle(face_area,(ex,ey),(ex+ew,ey+eh),(0,255,0),1)
## 微笑检测
smiles = smile_cascade.detectMultiScale(face_area,scaleFactor= 1.16,minNeighbors=65,minSize=(25, 25),flags=cv2.CASCADE_SCALE_IMAGE)
for (ex,ey,ew,eh) in smiles:
cv2.rectangle(face_area,(ex,ey),(ex+ew,ey+eh),(0,0,255),1)
cv2.putText(img,'Smile',(x,y-7), 3, 1.2, (0, 0, 255), 2, cv2.LINE_AA)
# 实时展示效果画面
cv2.imshow('frame2',img)
# 每5毫秒监听一次键盘动作
if cv2.waitKey(5) & 0xFF == ord('q'):
break
cap.release()
cv2.destroyAllWindows()

检测结果:
在这里插入图片描述


4 创造自己的级联分类器——dog face detection

4.1 收集样本,处理样本


收集正、负样本

关于正样本的收集,我收集了100个正样本,照片是从百度和必应下载的。关于负样本,只要不含有正样本图片即可,这里采用猫和人脸、不含狗的场景等图片,收集了300张图片。
在rename_resize_images.py程序中对照片进行批处理:重命名、尺寸缩小。按照OpenCV官方建议正样本是20像素x20像素。
正样本:
在这里插入图片描述
尺寸缩小后的正样本:
在这里插入图片描述
负样本:
在这里插入图片描述


样本处理

负样本除了灰度以外不必调整,分辨率自由。
把正样本也就是有狗狗的图片放在了pos文件夹中,把消极图片放在neg文件夹中。
然后创建正负样本目录,格式如下:
<绝对路径 1 0 0 w h > 其中w=20 h=20
在这里插入图片描述
在这里插入图片描述
使用时更改rootdir即可,即修改文件路径即可,文件路径为你的正样本保存的目录或者负样本保存的目录,以下为正样本pos.txt生成的程序:

#!/usr/bin env python
import os
rootdir = 'pos\\'
files = os.listdir(rootdir)
name = os.path.split(files[0])
with open(rootdir+'pos.txt','w+') as f:
for file in files:
name = os.path.split(file)
if name[1]=='pos.txt':
continue
print file
f.write("pos\\"+name[1]+' '+'1 0 0 20 20\n'

以下为生成负样本neg.txt的程序:

#!/usr/bin env python
import os
rootdir = 'neg\\'
files = os.listdir(rootdir)
name = os.path.split(files[0])
with open(rootdir+'neg.dat','w+') as f:
for file in files:
name = os.path.split(file)
if name[1]=='neg.txt':
continue
print file
f.write("neg\\"+name[1]+'\n')

生成正样本pos.dat 和neg.dat 后,将包含正样本的文件夹和负样本的文件夹以及pos.dat neg.dat 文件移动到opencv\build\x64\vc12\bin\ 目录。


4.2 创建向量

pop.txt 是上一步骤的正向量目录文件
num是其中的正样本数量,
w是宽h高
pos.vec是生成的正向量文件名

cd pos.txt所在目录
opencv_createsamples -info pos.txt -num 100 -w 20 -h 20 -vec pos.ve

4.3 训练分类器

opencv_createsamples各个参数的意义:
-data:指定保存训练结果的文件夹
-vec:指定正样本集
-bg:指定负样本的描述文件夹
-numPos:指定每一级参与训练的正样本的数目
-numNeg:指定每一级参与训练的负样本的数目(可大于负样本图片的总数)
-numStage:训练级数
-w:正样本宽
-h:正样本高

mkdir data
$ opencv_traincascade -data data -vec pos.vec -bg neg.txt -numPos 85 -numNeg 400 -numStage 15 -w 20 -h 20

等待运行结束,打开data就可以看见训练的分类器:
在这里插入图片描述


5 测试分类器

5.1 静态图片检测

对人脸识别的测试进行修改,替换模型为cascade.xml

import os
import cv2
# 测试图片
imgName = "dogs.jpg"
xmlFileName = "cascade.xml"
if not (os.path.exists(imgName) and os.path.exists(xmlFileName)):
print("图片或检测器文件不存在")
# 测试训练的检测器是否可用
windowName = "object detect"
img = cv2.imread(imgName)
gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
cascade = cv2.CascadeClassifier(xmlFileName)
rects = cascade.detectMultiScale(gray)
if len(rects) > 0:
print('========================检测到%d个目标===============================' % (len(rects)))
else:
print('没检测到东西')
for x, y, width, height in rects:
cv2.rectangle(img, (x, y), (x + width, y + height),(0, 255, 0),2)
# 在"img2"窗口中展示效果图
cv2.imshow('img2',img)
# 监听键盘上任何按键,如有按键即退出并关闭窗口,并将图片保存为output.jpg
cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.imwrite('output.jpg',img

测试图像:
在这里插入图片描述
测试结果:
在这里插入图片描述在这里插入图片描述


5.2 动态摄像头检测

import cv2
face_cascade = cv2.CascadeClassifier('cascade.xml')
# 调用摄像头摄像头
cap = cv2.VideoCapture(0)
while(True):
# 获取摄像头拍摄到的画面
ret, frame = cap.read()
faces = face_cascade.detectMultiScale(frame, 1.3, 5)
img = frame
for (x,y,w,h) in faces:
img = cv2.rectangle(img,(x,y),(x+w,y+h),(255,0,0),2)
# 实时展示效果画面
cv2.imshow('frame2',img)
# 每5毫秒监听一次键盘动作
if cv2.waitKey(5) & 0xFF == ord('q'):
break
# 最后,关闭所有窗口
cap.release()
cv2.destroyAllWindows()

测试结果:
在这里插入图片描述


6 出现问题及解决

过程中有出现识别不到的情况,需要调整
在这里插入图片描述

中的1.3(比例因子)


7 实验总结

通过本次实验,测试了opencv的人脸检测相关模型,并创建了自己的简单的狗脸检测的模型,从环境搭建、版本兼容性、模型搭建等问题上遇到的很多bug,但是最终得到解决。
本次实验得到的模型仅为狗狗的脸的检测,而不是辩识,即只能框出脸的位置,无法判断狗的名字,品种等信息。



推荐阅读
  • 汇总了2023年7月7日最新的网络安全新闻和技术更新,包括最新的漏洞披露、工具发布及安全事件。 ... [详细]
  • 页面预渲染适用于主要包含静态内容的页面。对于依赖大量API调用的动态页面,建议采用SSR(服务器端渲染),如Nuxt等框架。更多优化策略可参见:https://github.com/HaoChuan9421/vue-cli3-optimization ... [详细]
  • Python:新浪微博API初试
    {想在微博上抓点数据进行分析,费了一天多的时间,才终于找到点头绪,整理一下。}目录:一注册创建应用获取认证和授权二新浪微博pythonsdk下载和安装三简 ... [详细]
  • 时序数据是指按时间顺序排列的数据集。通过时间轴上的数据点连接,可以构建多维度报表,揭示数据的趋势、规律及异常情况。 ... [详细]
  • 深入解析轻量级数据库 SQL Server Express LocalDB
    本文详细介绍了 SQL Server Express LocalDB,这是一种轻量级的本地 T-SQL 数据库解决方案,特别适合开发环境使用。文章还探讨了 LocalDB 与其他轻量级数据库的对比,并提供了安装和连接 LocalDB 的步骤。 ... [详细]
  • 本文详细介绍了如何在PHP中使用Memcached进行数据缓存,包括服务器连接、数据操作、高级功能等。 ... [详细]
  • MVC框架下使用DataGrid实现时间筛选与枚举填充
    本文介绍如何在ASP.NET MVC项目中利用DataGrid组件增强搜索功能,具体包括使用jQuery UI的DatePicker插件添加时间筛选条件,并通过枚举数据填充下拉列表。 ... [详细]
  • 万事起于配置开发环境
    万事起于配置开发环境 ... [详细]
  • 作为一名CSS初学者,我在博客园中尝试通过CSS美化页面,特别是为超链接添加图标,以提升阅读体验。本文将分享如何使用CSS和字体图标库来实现这一功能。 ... [详细]
  • SQLite是一种轻量级的关系型数据库管理系统,尽管体积小巧,却能支持高达2TB的数据库容量,每个数据库以单个文件形式存储。本文将详细介绍SQLite在Android开发中的应用,包括其数据存储机制、事务处理方式及数据类型的动态特性。 ... [详细]
  • 字符、字符串和文本的处理之Char类型
    .NetFramework中处理字符和字符串的主要有以下这么几个类:(1)、System.Char类一基础字符串处理类(2)、System.String类一处理不可变的字符串(一经 ... [详细]
  • HTML download 属性详解及应用
    本文探讨了 HTML 中 download 属性的应用场景及其在不同浏览器中的实现方式,通过示例代码展示了如何利用 JavaScript 实现文件下载功能。 ... [详细]
  • 本文介绍了JSP的基本概念、常用标签及其功能,并通过示例详细说明了如何在JSP页面中使用Java代码。 ... [详细]
  • 多用户密码验证与加密登录系统
    本文介绍了一种基于多用户密码文件的加密登录方法,通过读取用户密码文件并使用简单的加密算法实现安全登录。文中详细描述了程序的设计思路及其实现过程。 ... [详细]
  • HDU 2537 键盘输入处理
    题目描述了一个名叫Pirates的男孩想要开发一款键盘输入软件,遇到了大小写字母判断的问题。本文提供了该问题的解决方案及实现方法。 ... [详细]
author-avatar
用户gum5gltoo8
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有