卷第
29
期
(2016
年
10
月
)
基于卷积神经网络的人脸识别
王嘉鑫,
邹科文,
陈义明
(
湖南农业大学
信息科学技术学院,
湖南
长沙
410128
)
摘要
:
为了了解为何卷积神经网络相比于其他神经网络有更好的特征学习能力,
文章对卷积神经网络的近几年发展趋势
以及基本结构进行介绍。进行了对于全连接的前向传播以及后向传播的推导,
该推导用于阐述神经元的权值更新以及学
习率。对卷积神经网络的调参以及参数的解析,
阐述了如何对参数训练进行调整来使得小数据集有更好的识别率。
关键词
:
深度学习;
卷积神经网络;
人脸识别;
全连接推导;
参数训练
中图分类号:
TP18
文献标识码:
A
文章编号:
1009-3044(2016)29-0187-04
深度学习是
2006
年机器学习领域的泰斗,
加拿大多伦多
大学的
G.E.Hinton
教授
[1-2]
最先提出的理论,
他和他的学生
R.R.
Salakhutdinov
在
science
上发表了一篇论文
[1]
。这篇论文主要有
两个观点:
1)
多隐层的人工神经网络拥有更为优势的特征学习
能力,
学习获得的特征对数据本身的描述更为清晰,
使得可视
化或分类更为有效;
2)
深度神经网络
(Deep
Neural
Networks,
DNN)
所产生的在训练上的难点,
可以通过
“逐层初始化”
(layer-
wise
pre-training)
来有效进行解决,
而逐层初始化使用的是无监
督学习进行实现的。
2012
年
6
月,
《纽约时报》
展露了
Google
Brain
项目,
该项目
是由斯坦福大学机器学习教授
Andrew
Ng
和大规模计算机系统
的世界顶尖专家
Jeff
Dean
共同主导,
利用
16000
个
CPU
Core
的
并行计算平台来训练
“深度神经网络”
的机器学习模型,
在图
像识别和语音识别等的领域都获得了巨大的成功。
2013
年
1
月,
在百度年会上,
百度创始人兼
CEO
李彦宏宣布成立百度研
究院
Institute
of
Deep
Learning(IDL)
,
第一个重点研究的方向就
是深度学习。
2013
年
4
月,
《
MIT
Technology
Review(
麻省理工学
院技术评论
)
》
杂志将深度学习列为
2013
年十大突破性技术
(Breakthrough
Technology)
之首。
深度神经网络是一种逐层贪婪无监督的学习方法,
这是一
种思想,
需要依赖具体的模型去实现。常见的深度学习模型有
受限玻尔兹曼机
(Restricted
Boltzmann
Machine
,
RBM)
、
深度信念
网络
[2]
(Deep
Belief
Networks
,
DBN)
、
堆栈式自动编码器
(Stacked
Auto-encoder
,
SAE)
[3]
和卷积神经网络
(Convolutional
Neural
Net⁃
works
,
CNN)
[4-5]
。
1
卷积神经网络
卷积神经网络是一种包含卷积层的神经网络,
20
世纪
60
年代,
Hubel
和
Wiesel
在研究猫的脑皮层中,
用于局部敏感和方
向选择的神经元时,
发现其特殊的网络结构可以有效降低反馈
神经网络的复杂性。受研究的启发,
模型模仿视皮层的简单细
胞和复杂细胞交互处理视觉信息的过程,
简单细胞负责响应获
得不同方向的边缘信息,
而复杂细胞则负责累积相近简单细胞
来输出结果,
这个结构被称为
Hubel-Wiesel
结构
[6]
。
CNN
包含
多个
Hubel-Wiesek
结构阶段,
每个阶段一般都包含模拟简单细
胞卷积操作和模拟复杂细胞池化操作。
CNN
主要用来获取位移、
所放以及其他形式旋转不变的二
维图像数据的显著特征,
因为图像的局部感知区域允许神经元
或者处理单元访问到最底部基础特征。由于
CNN
特征的检测
层通过训练数据来学习,
避开了显式的特征抽取,
而是在隐式
地训练数据中学习;
由于同一个特征映射面上,
神经元权值相
同。因此神经网络进行并行学习,
这是卷积神经网络的一个优
点。
卷积神经网络在语音识别和图像处理方面有得天独厚的
优势,
是由于它的局部感知和权值共享结构使其更接近现实世
界的生物神经网络,
权值共享结构降低了神经网络的复杂性,
这可以避免进行数据重建时,
特征提取与分类过程的复杂度。
2
卷积神经网络的基本结构
以卷积神经网络进行的人脸识别为例的
CNN
结构,
如图
1
,
不包括输入层,
该网络有
7
层组成,
其中包括
3
层卷积层、
2
层
采样层、
1
层全连接层和
1
层输出层。图
1
中第一个卷积层有
6
个特征映射,
每个特征映射都是
28×28
神经元阵列,
每个神经
元负责把
5×5
的区域使用卷积滤波器提取局部里的特征。
下面介绍卷积层的局部感知域、
权值共享以及采样层的池
化操作。
图
1
卷积神经网络用于人脸识别
收稿日期:
2016-08-25
基金项目:
湖南农业大学大学生创新性实验计划项目
(XCX16090)
作者简介:
王嘉鑫
(1993—)
,
男,
福建泉州人,
本科,
研究方向为
java
和机器学习;
邹科文
(
1996
—
)
,
男,
湖南娄底人,
本科,
研究方向为
java
和机器学习;
陈义明
(1969—)
,
男,
湖南益阳人,
副教授,
博士,
研究方向为人工智能。
E-mail:
eduf@dnzs.net.cn
http://www.dnzs.net.cn
Tel:+86-551-65690963
65690964
ISSN
1009-3044
Computer
Knowledge
and
Technology
电脑知识
与技术
Vol.12,
No.29,
October
2016
187
DOI
:
10.14004/j.cnki.ckt.2016.3813
网络出版时间:
2016-12-01 09:32:03
网络出版地址:
http://www.cnki.net/kcms/detail/34.1205.TP.20161201.0932.152.html