当前位置: 开发笔记 > 编程语言 > 正文

计算机视觉子方向,计算机视觉方向简介|人脸识别中的活体检测算法综述

作者：文岚 | 来源：互联网 | 2023-09-12 05:03

原标题：计算机视觉方向简介|人脸识别中的活体检测算法综述本文转载自“SIGAI人工智能学习与实践平台”(ID：SIGAICN)导言1.什么是活体检测&#

原标题&＃xff1a;计算机视觉方向简介 | 人脸识别中的活体检测算法综述

本文转载自“SIGAI人工智能学习与实践平台”(ID&＃xff1a;SIGAICN)

导言

1. 什么是活体检测&＃xff1f;

判断捕捉到的人脸是真实人脸&＃xff0c;还是伪造的人脸攻击(如&＃xff1a;彩色纸张打印人脸图&＃xff0c;电子设备屏幕中的人脸数字图像以及面具等)

2. 为什么需要活体检测&＃xff1f;

在金融支付&＃xff0c;门禁等应用场景&＃xff0c;活体检测一般是嵌套在人脸检测与人脸识别or验证中的模块&＃xff0c;用来验证是否用户真实本人

3. 活体检测对应的计算机视觉问题&＃xff1a;

就是分类问题&＃xff0c;可看成二分类(真 or 假)&＃xff1b;也可看成多分类(真人&＃xff0c;纸张攻击&＃xff0c;屏幕攻击&＃xff0c;面具攻击)

Anti-spoofing 1.0 时代

从早期 handcrafted 特征的传统方法说起&＃xff0c;目标很明确&＃xff0c;就是找到活体与非活体攻击的difference&＃xff0c;然后根据这些差异来设计特征&＃xff0c;最后送给分类器去决策。

那么问题来了&＃xff0c;活体与非活体有哪些差异&＃xff1f;

1. 颜色纹理

2. 非刚性运动变形

3. 材料 (皮肤&＃xff0c;纸质&＃xff0c;镜面)

4. 图像or视频质量

所以这段时期的文章都是很有针对性地设计特征&＃xff0c;列举几篇比较重要的&＃xff1a;

Image Distortion Analysis[1], 2015

如下图&＃xff0c;单帧输入的方法&＃xff0c;设计了镜面反射&＃43;图像质量失真&＃43;颜色等统计量特征&＃xff0c;合并后直接送SVM进行二分类。

Image Distortion Analysis[1]

Cons: 对于高清彩色打印的纸张 or 高清录制视频&＃xff0c;质量失真不严重时&＃xff0c;难区分开

Colour Texture[2], 2016

Oulu CMVS组的产物&＃xff0c;算是传统方法中的战斗机&＃xff0c;特别简洁实用&＃xff0c;Matlab代码(课题组官网有)&＃xff0c;很适合搞成C&＃43;&＃43;部署到门禁系统。

原理&＃xff1a;活体与非活体&＃xff0c;在RGB空间里比较难区分&＃xff0c;但在其他颜色空间里的纹理有明显差异

算法&＃xff1a;HSV空间人脸多级LBP特征 &＃43; YCbCr空间人脸LPQ特征 (后在17年的paper拓展成用Color SURF特征[12]&＃xff0c;性能提升了一点)

Colour Texture[2]

Pros: 算法简洁高效易部署&＃xff1b;也证明了活体与非活体在 HSV等其他空间也是discriminative&＃xff0c;故后续深度学习方法有将HSV等channel也作为输入来提升性能。

Motion mag.-HOOF &＃43; LBP-TOP[3], 2014

DMD &＃43; LBP[4], 2015

前面说的都是单帧方法&＃xff0c;这两篇文章输入的是连续多帧人脸图&＃xff1b;

主要通过捕获活体与非活体微动作之间的差异来设计特征。

一个是先通过运动放大来增强脸部微动作&＃xff0c; 然后提取方向光流直方图HOOF &＃43; 动态纹理LBP-TOP 特征&＃xff1b;一个是通过动态模式分解DMD&＃xff0c;得到最大运动能量的子空间图&＃xff0c;再分析纹理。

PS&＃xff1a;这个 motion magnification 的预处理很差劲&＃xff0c;加入了很多其他频段噪声(18年新出了一篇用 Deep learning 来搞 Motion mag[13]. 看起来效果挺好&＃xff0c;可以尝试用那个来做运动增强&＃xff0c;再来光流or DMD)

Motion mag.-HOOF &＃43; LBP-TOP[3]

DMD &＃43; LBP[4]

Cons: 基于Motion的方法&＃xff0c;对于仿人脸wrapped纸张抖动和视频攻击&＃xff0c;效果不好&＃xff1b;因为它假定了活体与非活体之间的非刚性运动有明显的区别&＃xff0c;但其实这种微动作挺难描述与学习~

Pulse &＃43; texture[5], 2016

第一个将 remote pluse 应用到活体检测中&＃xff0c;多帧输入(交代下背景&＃xff1a;在CVPR2014&＃xff0c;Xiaobai Li[14] 已经提出了从人脸视频里测量心率的方法)

算法流程&＃xff1a;

1. 通过 pluse 在频域上分布不同先区分活体 or 照片攻击 (因为照片中的人脸提取的心率分布不同)

2. 若判别1结果是活体&＃xff0c;再 cascade 一个纹理LBP 分类器&＃xff0c;来区分活体 or 屏幕攻击(因为屏幕视频中人脸心率分布与活体相近)

Pulse &＃43; texture[5]

Pros: 从学术界来说&＃xff0c;引入了心理信号这个新模态&＃xff0c;很是进步&＃xff1b;从工业界来看&＃xff0c;如果不能一步到位&＃xff0c;针对每种类型攻击&＃xff0c;也可进行 Cascade 对应的特征及分类器的部署方式

Cons: 由于 remote heart rate 的算法本来鲁棒性也一般&＃xff0c;故出来的 pulse-feature 的判别性能力很不能保证&＃xff1b;再者屏幕video里的人脸视频出来的 pulse-feature 是否也有微小区别&＃xff0c;还待验证~

Anti-spoofing 2.0 时代

其实用 Deep learning 来做活体检测&＃xff0c;从15年陆陆续续就有人在研究&＃xff0c;但由于公开数据集样本太少&＃xff0c;一直性能也超越不了传统方法&＃xff1a;

CNN-LSTM[6], 2015

多帧方法&＃xff0c;想通过 CNN-LSTM 来模拟传统方法 LBP-TOP&＃xff0c;性能堪忧~

PatchNet pretrain[7]&＃xff0c;CNN finetune, 2017

单帧方法&＃xff0c;通过人脸分块&＃xff0c;pre-train 网络&＃xff1b;然后再在 global 整个人脸图 fine-tune&＃xff0c;作用不大

Patch and Depth-Based CNNs[8], 2017

第一个考虑把人脸深度图作为活体与非活体的差异特征&＃xff0c;因为像屏幕中的人脸一般是平的&＃xff0c;而纸张中的人脸就算扭曲&＃xff0c;和真人人脸的立体分布也有差异&＃xff1b;

就算用了很多 tricks 去 fusion&＃xff0c;性能还是超越不了传统方法。

Deep Pulse and Depth[9], 2018

发表在 CVPR2018 的文章&＃xff0c;终于超越了传统方法性能。

文章[8]的同一组人&＃xff0c;设计了深度框架准端到端地去预测 Pulse统计量及 Depth map (这里说的“准”&＃xff0c;就是最后没接分类器&＃xff0c;直接通过样本 feature 的相似距离&＃xff0c;阈值决策)

在文章中明确指明&＃xff1a;

1. 过去方法把活体检测看成二分类问题&＃xff0c;直接让DNN去学习&＃xff0c;这样学出来的cues不够general 和 discriminative

2. 将二分类问题换成带目标性地特征监督问题&＃xff0c;即回归出 pulse 统计量 &＃43; 回归出 Depth map&＃xff0c;保证网络学习的就是这两种特征(哈哈&＃xff0c;不排除假设学到了 color texture 在里面&＃xff0c;黑箱网络这么聪明)。

Deep Pulse and Depth[9]

回归 Depth map&＃xff0c;跟文章[8]中一致&＃xff0c;就是通过 Landmark 然后 3DMMfitting 得到人脸3D shape&＃xff0c;然后再阈值化去背景&＃xff0c;得到 depth map 的 groundtruth&＃xff0c;最后和网络预测的 estimated depth map 有 L2 loss。

而文章亮点在于设计了 Non-rigid Registration Layer 来对齐各帧人脸的非刚性运动(如姿态&＃xff0c;表情等)&＃xff0c;然后通过RNN更好地学到 temporal pulse 信息。

Non-rigid Registration Layer[9]

为什么需要这个对齐网络呢&＃xff1f;我们来想想&＃xff0c;在做运动识别任务时&＃xff0c;只需简单把 sampling或者连续帧合并起来喂进网络就行了&＃xff0c;是假定相机是不动的&＃xff0c;对象在运动&＃xff1b;而文中需要对连续人脸帧进行pulse特征提取&＃xff0c;主要对象是人脸上对应ROI在 temporal 上的 Intensity 变化&＃xff0c;所以就需要把人脸当成是相机固定不动。

Micro-texture &＃43; SSD or binocular depth[10] , 2018

ArXiv 刚挂出不久的文章&＃xff0c;最大的贡献是把活体检测直接放到人脸检测(SSD&＃xff0c;MTCNN等) 模块里作为一个类&＃xff0c;即人脸检测出来的 bbox 里有背景&＃xff0c;真人人脸&＃xff0c;假人脸三类的置信度&＃xff0c;这样可以在早期就过滤掉一部分非活体。

所以整个系统速度非常地快&＃xff0c;很适合工业界部署~

至于后续手工设计的 SPMT feature 和 TFBD feature 比较复杂繁琐&＃xff0c;分别是表征 micro-texture 和 stereo structure of face&＃xff0c;有兴趣的同学可以去细看。

texture &＃43; SSD or binocular depth[10]

De-Spoofing[11], ECCV2018

单帧方法&＃xff0c;与Paper[8]和[9]一样&＃xff0c;是MSU同一个课题组做的。

文章的idea很有趣&＃xff0c;启发于图像去噪denoise 和图像去抖动 deblur。无论是噪声图还是模糊图&＃xff0c;都可看成是在原图上加噪声运算或者模糊运算(即下面的公式)&＃xff0c;而去噪和去抖动&＃xff0c;就是估计噪声分布和模糊核&＃xff0c;从而重构回原图。

文中把活体人脸图看成是原图

&＃xff0c;而非活体人脸图看成是加了噪声后失真的 x &＃xff0c;故 task 就变成估计 Spoof noiseN(

) &＃xff0c;然后用这个 Noise pattern feature 去分类决策。

De-spoofing process[11]

那问题来了&＃xff0c;数据集没有像素级别一一对应的 groundtruth&＃xff0c;也没有Spoof Noise模型的先验知识(如果有知道Noise模型&＃xff0c;可以用Live Face来生成Spoofing Face)&＃xff0c;那拿什么来当groundtruth&＃xff0c;怎么设计网络去估计 Spoofing noise 呢&＃xff1f;

如一般Low-level image 任务一样&＃xff0c;文中利用Encoder-decoder来得到 Spoof noise N&＃xff0c;然后通过残差重构出

&＃xff0c;这就是下图的DS Net。为了保证网络对于不同输入&＃xff0c;学出来的Noise是有效的&＃xff0c;根据先验知识设计了三个Loss来constrain&＃xff1a;

Magnitude loss(当输入是Live face时&＃xff0c;N尽量逼近0)&＃xff1b;

Repetitive loss(Spooing face的Noise图在高频段有较大的峰值)&＃xff1b;

01Map Loss(让Real Face 的 deep feature map分布尽量逼近全0&＃xff0c;而Spoofing face的 deep feature map 尽量逼近全1)

De-spoofing网络架构[11]

那网络右边的 VQ-Net 和 DQ-Net 又有什么作用呢&＃xff1f;因为没有 Live face 的 Groundtruth&＃xff0c;要保证重构出来的分布接近 Live face&＃xff0c;作者用了对抗生成网络GAN (即 VQ-Net )去约束重构生成的

与Live face分布尽量一致&＃xff1b;而用了文章[8]中的 pre-trained Depth model 来保证

的深度图与Live face的深度图尽量一致。

Pros: 通过可视化最终让大众知道了 Spoofing Noise 是长什么样子的~

Cons: 在实际场景中难部署(该模型假定Spoofing Noise是 strongly 存在的&＃xff0c;当实际场景中活体的人脸图质量并不是很高&＃xff0c;而非活体攻击的质量相对高时&＃xff0c;Spoofing noise走不通)

后记&＃xff1a;不同模态的相机输入对于活体检测的作用

1. 近红外NIR

由于NIR的光谱波段与可见光VIS不同&＃xff0c;故真实人脸及非活体载体对于近红外波段的吸收和反射强度也不同&＃xff0c;即也可通过近红外相机出来的图像来活体检测。从出来的图像来说&＃xff0c;近红外图像对屏幕攻击的区分度较大&＃xff0c;对高清彩色纸张打印的区分度较小。

从特征工程角度来说&＃xff0c;方法无非也是提取NIR图中的光照纹理特征[15]或者远程人脸心率特征[16]来进行。下图可见&＃xff0c;上面两行是真实人脸图中人脸区域与背景区域的直方图分布&＃xff0c;明显与下面两行的非活体图的分布不一致&＃xff1b;而通过与文章[5]中一样的rPPG提取方法&＃xff0c;在文章[]中说明其在NIR图像中出来的特征更加鲁棒~

NIR人脸区域与背景区域直方图[15]

2. 结构光/ToF

由于结构光及ToF能在近距离里相对准确地进行3D人脸重构&＃xff0c;即可得到人脸及背景的点云图及深度图&＃xff0c;可作为精准活体检测(而不像单目RGB或双目RGB中仍需估计深度)。不过就是成本较高&＃xff0c;看具体应用场景决定。

3. 光场 Light field

光场相机具有光学显微镜头阵列&＃xff0c;且由于光场能描述空间中任意一点向任意方向的光线强度&＃xff0c;出来的raw光场照片及不同重聚焦的照片&＃xff0c;都能用于活体检测&＃xff1a;

3.1 raw光场照片及对应的子孔径照片[17]

如下图所示&＃xff0c;对于真实人脸的脸颊边缘的微镜图像&＃xff0c;其像素应该是带边缘梯度分布&＃xff1b;而对应纸张打印或屏幕攻击&＃xff0c;其边缘像素是随机均匀分布&＃xff1a;

光场相机图

3.2 使用一次拍照的重聚焦图像[18]

原理是可以从两张重聚焦图像的差异中&＃xff0c;估计出深度信息&＃xff1b;从特征提取来说&＃xff0c;真实人脸与非活体人脸的3D人脸模型不同&＃xff0c;可提取差异图像中的亮度分布特征&＃43;聚焦区域锐利程度特征&＃43;频谱直方图特征。

至此&＃xff0c;Face anti-spoofing 的简单Survey已完毕~

毫无疑问&＃xff0c;对于学术界&＃xff0c;后续方向应该是用DL学习更精细的人脸3D特征和人脸微变化微动作(Motion Spoofing Noise?) 表征&＃xff1b;而也可探索活体检测与人脸检测及人脸识别之间更紧密的关系。

对于工业界&＃xff0c;可直接在人脸检测时候预判是否活体&＃xff1b;更可借助近红外&＃xff0c;结构光/ToF等硬件做到更精准。

Reference:

[1] Di Wen, Hu Han, Anil K. Jain. Face Spoof Detection with Image Distortion Analysis. IEEE Transactions on Information Forensics and Security, 2015

[2] Zinelabidine Boulkenafet, Jukka Komulainen, Abdenour Hadid. Face Spoofing Detection Using Colour Texture Analysis. IEEE TRANSACTIONS ON INFORMATION FORENSICS AND SECURITY, 2016

[3] Samarth Bharadwaj. Face Anti-spoofing via Motion Magnification and

Multifeature Videolet Aggregation, 2014

[4] Santosh Tirunagari, Norman Poh. Detection of Face Spoofing Using Visual Dynamics. IEEE TRANS. ON INFORMATION FORENSICS AND SECURIT, 2015

[5] Xiaobai Li, , Guoying Zhao. Generalized face anti-spoofing by detecting pulse

from face videos, 2016 23rd ICPR

[6] Zhenqi Xu. Learning Temporal Features Using LSTM-CNN Architecture for Face Anti-spoofing, 2015 3rd IAPR

[7] Gustavo Botelho de Souza, On the Learning of Deep Local Features for

Robust Face Spoofing Detection, 2017

[8] Yousef Atoum, Xiaoming Liu. Face Anti-Spoofing Using Patch and Depth-Based CNNs, 2017

[9] Yaojie Liu, Amin Jourabloo, Xiaoming Liu, Learning Deep Models for Face Anti-Spoofing: Binary or Auxiliary Supervision &＃xff0c;CVPR2018

[10] Discriminative Representation Combinations for Accurate Face Spoofing Detection&＃xff0c;2018 PR

[11] Amin Jourabloo, Face De-Spoofing: Anti-Spoofing via Noise Modeling, ECCV2018

[12]Zinelabidine Boulkenafet, Face Antispoofing Using Speeded-Up Robust Features and Fisher Vector Encoding, IEEE SIGNAL PROCESSING LETTERS, VOL. 24, NO. 2, FEBRUARY 2017

[13]Tae-Hyun Oh, Learning-based Video Motion Magnification, ECCV2018

[14]Xiaobai Li, Remote Heart Rate Measurement From Face Videos Under Realistic Situations

[15]Xudong Sun, Context Based Face Spoofing Detection Using Active Near-Infrared Images, ICPR 2016

[16]Javier Hernandez-Ortega, Time Analysis of Pulse-based Face Anti-Spoofing in Visible and NIR, CVPR2018 workshop

[17]Sooyeon Kim, Face Liveness Detection Using a Light Field Camera, 2014

[18]Xiaohua Xie, One-snapshot Face Anti-spoofing Using a Light Field Camera, 2017返回搜狐&＃xff0c;查看更多

责任编辑&＃xff1a;

推荐阅读

select
Oracle RMAN 增量备份详解：差异增量与累积增量

本文详细介绍了Oracle RMAN中的增量备份机制，重点解析了差异增量和累积增量备份的概念及其在不同Oracle版本中的实现。通过对比两种备份方式的特点，帮助读者选择合适的备份策略。 ... [详细]

蜡笔小新 2024-11-25 19:07:53
select
时间感知的一次性密码验证机制 - 获取灵活的时间戳

探讨了生成时间敏感的一次性伪随机密码的方法，旨在通过加入时间因素防止重放攻击。 ... [详细]

蜡笔小新 2024-11-26 11:39:47
schema
Spring Boot集成与使用JPA详解

本文详细介绍如何在Spring Boot项目中集成和使用JPA，涵盖JPA的基本概念、Spring Data JPA的功能以及具体的操作步骤，帮助开发者快速掌握这一强大的持久化技术。 ... [详细]

蜡笔小新 2024-11-27 17:44:54
stream
确定合适的序列化版本ID的方法

本文探讨了如何选择一个合适的序列化版本ID（serialVersionUID），包括使用生成器还是简单的整数，以及在不同情况下应如何处理序列化版本ID。 ... [详细]

蜡笔小新 2024-11-24 03:51:53
select
视觉Transformer综述

本文综述了视觉Transformer在计算机视觉领域的应用，从原始Transformer出发，详细介绍了其在图像分类、目标检测和图像分割等任务中的最新进展。文章不仅涵盖了基础的Transformer架构，还深入探讨了各类增强版Transformer模型的设计思路和技术细节。 ... [详细]

蜡笔小新 2024-11-22 19:53:16
header
WPF菜单控件前景与背景颜色设置指南

尽管在WPF中工作了一段时间，但在菜单控件的样式设置上遇到了一些基础问题，特别是关于如何正确配置前景色和背景色。 ... [详细]

蜡笔小新 2024-11-22 15:30:54
web
ABAP开发者需关注的几大关键问题

长期从事ABAP开发工作的专业人士，在面对行业新趋势时，往往需要重新审视自己的发展方向。本文探讨了几位资深专家对ABAP未来走向的看法，以及开发者应如何调整技能以适应新的技术环境。 ... [详细]

蜡笔小新 2024-11-21 18:21:06
eval
如何在 VS Code 中调试 Vue 项目

本文详细介绍了如何通过配置 Chrome 和 VS Code 来实现对 Vue 项目的高效调试。步骤包括启用 Chrome 的远程调试功能、安装 VS Code 插件以及正确配置 launch.json 文件。 ... [详细]

蜡笔小新 2024-11-27 11:52:35
chat
字符、字符串和文本的处理之Char类型

.NetFramework中处理字符和字符串的主要有以下这么几个类:(1)、System.Char类一基础字符串处理类(2)、System.String类一处理不可变的字符串(一经 ... [详细]

蜡笔小新 2024-11-26 21:04:40
import
Html.Partial vs Html.RenderPartial in ASP.NET MVC3

尽管已经查阅了相关说明，但关于Html.Partial和Html.RenderPartial在ASP.NET MVC3中的使用，我仍然感到困惑。 ... [详细]

蜡笔小新 2024-11-26 17:38:37
const
解决CM10.2编译过程中遇到的错误

本文主要解决了在编译CM10.2时出现的关于Samsung Exynos 4 HDMI HAL库中SecHdmiV4L2Utils.cpp文件的编译错误。 ... [详细]

蜡笔小新 2024-11-26 17:26:47
select
Hive中时间处理函数详解

本文详细介绍了Hive中用于处理日期和时间的各种函数，包括UNIX时间戳与日期之间的转换、日期提取以及日期计算等，帮助读者更好地理解和使用这些函数。 ... [详细]

蜡笔小新 2024-11-24 23:29:46
select
研究生入学考试经验分享

本文汇集了作者在准备研究生入学考试过程中的心得体会，包括备考策略、复习重点及应对考试的心理调适技巧，旨在为即将参加考研的学生提供实用建议。 ... [详细]

蜡笔小新 2024-11-24 19:37:34
select
Implementing and Testing Ext Ajax Calls with Promises

This article explores the process of integrating Promises into Ext Ajax calls for a more functional programming approach, along with detailed steps on testing these asynchronous operations. ... [详细]

蜡笔小新 2024-11-24 15:29:28
const
入门指南：使用FastRPC技术连接Qualcomm Hexagon DSP

本文旨在为初学者提供关于如何使用FastRPC技术连接Qualcomm Hexagon DSP的基础知识。FastRPC技术允许开发者在本地客户端实现远程调用，从而简化Hexagon DSP的开发和调试过程。 ... [详细]

蜡笔小新 2024-11-21 10:03:34

文岚

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章