当前位置: 开发笔记 > 数据库 > 正文

人脸识别之特征脸方法（Eigenface）

作者：峰子 | 来源：互联网 | 2023-01-12 13:31

一、特征脸特征脸EigenFace从思想上其实挺简单。就相当于把人脸从像素空间变换到另一个空间，在另一个空间中做相似性的计算。这么说，其实图像识别的基本思想都是一样的，首先选

一、特征脸

特征脸EigenFace从思想上其实挺简单。就相当于把人脸从像素空间变换到另一个空间，在另一个空间中做相似性的计算。这么说，其实图像识别的基本思想都是一样的，首先选择一个合适的子空间，将所有的图像变换到这个子空间上，然后再在这个子空间上衡量相似性或者进行分类学习。那为什么要变换到另一个空间呢？当然是为了更好的做识别或者分类了。那为什么变换到一个空间就好识别或者分类了呢？因为变换到另一个空间，同一个类别的图像会聚到一起，不同类别的图像会距离比较远，或者在原像素空间中不同类别的图像在分布上很难用个简单的线或者面把他们切分开，然后如果变换到另一个空间，就可以很好的把他们分开了。有时候，线性（分类器）就可以很容易的把他们分开了。那既然人类看起来同类的图像本来就是相似的，不同类的图像就不太相似，那为什么在原始的像素空间他们同类不会很近，不同类不会很远，或者他们为什么不好分开呢？因为图像各种因素的影响，包括光照、视角、背景和形状等等不同，会造成同一个目标的图像都存在很大的视觉信息上的不同。如下图所示。

世界上没有存在任何两片完全相同的叶子，虽然他们都是叶子。万千世界，同一类事物都存在共性，也存在个性，这就是这个世界多彩的原因。那怎么办呢？很自然，只要在我们想要的粒度上把同一类目标的共性找出来就好了，而且这个共性最好和我们要区分的类是不一样的。什么叫我们想要的粒度？我理解和我们的任务相关的。例如我们要区分人和车，那人的共性就是有脸、有手、有脚等等。但如果我们要区分亚洲人和非洲人，那么亚洲人的共性就是黄色皮肤等等。可以试着想象，上帝把世界万物组织成一个树状结构，树的根就是万物之源，下一层可以分成生物和非生物，再下一层将生物分为……（囧，想象不到），直到最底层，万物，你我，为树的一片普通得再普通的叶子。树越往下，粒度越小，分类越细（哈哈，自己乱扯的）。停！废话多了点，跑题了，回到刚才的问题，重头戏来了，要变换到什么空间，才具备上述这种良好类内相似、类间区分的效果？到这，我就只能say sorry了。计算机视觉领域发展了几十年，就为了这一个问题倾注了无数研究者的智慧与心血。当然了，也诞生和孕育了很多经典和有效的解答。（个人理解，上述说的实际上就是特征提取）。从一开始的颜色特征（颜色直方图）、纹理特征（Harr、LBP、HOG、SIFT等）、形状特征等到视觉表达Bag of Words，再到特征学习Deep Learning，技术的发展总能带给人希望，曙光也越来越清晰，但路还很远，是不？

扯太多了，严重离题了。上面说到，特征脸EigenFace的思想是把人脸从像素空间变换到另一个空间，在另一个空间中做相似性的计算。EigenFace选择的空间变换方法是PCA，也就是大名鼎鼎的主成分分析。它广泛的被用于预处理中以消去样本特征维度之间的相关性。当然了，这里不是说这个。EigenFace方法利用PCA得到人脸分布的主要成分，具体实现是对训练集中所有人脸图像的协方差矩阵进行本征值分解，得对对应的本征向量，这些本征向量（特征向量）就是“特征脸”。每个特征向量或者特征脸相当于捕捉或者描述人脸之间的一种变化或者特性。这就意味着每个人脸都可以表示为这些特征脸的线性组合。实际上，空间变换就等同于“搞基”，原始像素空间的基就是单位“基”，经过PCA后空间就是以每一个特征脸或者特征向量为基，在这个空间（或者坐标轴）下，每个人脸就是一个点，这个点的坐标就是这个人脸在每个特征基下的投影坐标。哦噢，说得有点绕。

下面就直接给出基于特征脸的人脸识别实现过程：

1）将训练集的每一个人脸图像都拉长一列，将他们组合在一起形成一个大矩阵A。假设每个人脸图像是MxM大小，那么拉成一列后每个人脸样本的维度就是d=MxM大小了。假设有N个人脸图像，那么样本矩阵A的维度就是dxN了。

2）将所有的N个人脸在对应维度上加起来，然后求个平均，就得到了一个“平均脸”。你把这个脸显示出来的话，还挺帅的哦。

3）将N个图像都减去那个平均脸图像，得到差值图像的数据矩阵Φ。

4）计算协方差矩阵C=ΦΦ^T。再对其进行特征值分解。就可以得到想要的特征向量（特征脸）了。

5）将训练集图像和测试集的图像都投影到这些特征向量上了，再对测试集的每个图像找到训练集中的最近邻或者k近邻啥的，进行分类即可。

算法说明白了都是不明白的，所以还是得去看具体实现。因此，可以对照下面的代码来弄清楚这些步骤。

另外，对于步骤4），涉及到求特征值分解。如果人脸的特征维度d很大，例如256x256的人脸图像，d就是65536了。那么协方差矩阵C的维度就是dxd=65536x65536。对这个大矩阵求解特征值分解是很费力的。那怎么办呢？如果人脸的样本不多，也就是N不大的话，我们可以通过求解C’=Φ^TΦ矩阵来获得同样的特征向量。可以看到这个C’=Φ^TΦ只有NxN的大小哦。如果N远远小于d的话，那么这个力气就省得很值了。那为什么求解C’=Φ^TΦ矩阵的特征向量可以获得C=ΦΦ^T的特征向量？万众瞩目时刻，数学以完美舞姿登上舞台。证明如下：

其中，e_i是C’=Φ^TΦ的第i个特征向量，v_i是C=ΦΦ^T的第i个特征向量，由证明可以看到，v_i=Φe_i。所以通过求解C’=Φ^TΦ的特征值分解得到e_i，再左乘Φ就得到C=ΦΦ^T的特征向量v_i了。也就是我们想要的特征脸。

二、Matlab实现

下面的代码主要是在著名的人脸识别数据库YaleB中进行实现。用的是裁切后的人脸数据库，可以点击CroppedYale下载。共有38个人的人脸，人脸是在不同的光照下采集的，每个人脸图像是32x32个像素。实验在每一个的人脸图像中随机取5个作为训练图像，剩下的作为测试图像。当然了，实际过程中这个过程需要重复多次，然后得到多次准确率的均值和方差才有参考意义，但下面的demo就不做这个处理了。计算相似性用的是欧氏距离，但编程实现的时候为了加速，用的是简化版，至于如何简化的，考验你的时候到了。

[cpp] view plain copy 在CODE上查看代码片

% Face recognition using eigenfaces
close all, clear, clc;
%% 20 random splits
num_trainImg = 5;
showEigenfaces = true;
%% load data
disp('loading data...');
dataDir = './CroppedYale';
datafile = 'Yale.mat';
if ~exist(datafile, 'file')
readYaleDataset(dataDir, datafile);
end
load(datafile);
%% Five images per class are randomly chosen as the training
%% dataset and remaining images are used as the test dataset
disp('get training and testing data...');
num_class = size(unique(labels), 2);
trainIdx = [];
testIdx = [];
for i=1:num_class
label = find(labels == i);
indice = randperm(numel(label));
trainIdx = [trainIdx label(indice(1:num_trainImg))];
testIdx = [testIdx label(indice(num_trainImg+1:end))];
end
%% get train and test data
train_x = double(data(:, trainIdx));
train_y = labels(trainIdx);
test_x = double(data(:, testIdx));
test_y = labels(testIdx);
%% computing eigenfaces using PCA
disp('computing eigenfaces...');
tic;
[num_dim, num_imgs] = size(train_x); %% A: #dim x #images
avg_face = mean(train_x, 2); %% computing the average face
X = bsxfun(@minus, train_x, avg_face); %% computing the difference images
%% PCA
if num_dim <= num_imgs
C = X * X';
[V, D] = eig(C);
else
C = X' * X;
[U, D] = eig(C);
V = X * U;
end
eigenfaces = V;
eigenfaces = eigenfaces ./ (ones(size(eigenfaces,1),1) * sqrt(sum(eigenfaces.*eigenfaces)));
toc;
%% visualize the average face
P = sqrt(numel(avg_face));
Q = numel(avg_face) / P;
imagesc(reshape(avg_face, P, Q)); title('Mean face');
colormap('gray');
%% visualize some eigenfaces
figure;
num_eigenfaces_show = 9;
for i = 1:num_eigenfaces_show
subplot(3, 3, i)
imagesc(reshape(eigenfaces(:, end-i+1), P, Q));
title(['Eigenfaces ' num2str(i)]);
end
colormap('gray');
%% transform all training images to eigen space (each column for each image)
disp('transform data to eigen space...');
X = bsxfun(@minus, train_x, avg_face);
T = eigenfaces' * X;
%% transform the test image to eigen space
X_t = bsxfun(@minus, test_x, avg_face);
T_t = eigenfaces' * X_t;
%% find the best match using Euclidean distance
disp('find the best match...');
AB = -2 * T_t' * T; % N x M
BB = sum(T .* T); % 1 x M
distance = bsxfun(@plus, AB, BB); % N x M
[score, index] = min(distance, [], 2); % N x 1
%% compute accuracy
matchCount = 0;
for i=1:numel(index)
predict = train_y(index(i));
if predict == test_y(i)
matchCount = matchCount + 1;
end
end
fprintf('**************************************\n');
fprintf('accuracy: %0.3f%% \n', 100 * matchCount / numel(index));
fprintf('**************************************\n');

下面是将CroppedYale的图像读入matlab的代码。

[cpp] view plain copy 在CODE上查看代码片

function readYaleDataset(dataDir, saveName)
dirs = dir(dataDir);
data = [];
labels = [];
for i = 3:numel(dirs)
imgDir = dirs(i).name;
imgDir = fullfile(dataDir, imgDir);
imgList = dir(fullfile(imgDir, '*.pgm'));
for j = 1:numel(imgList)
imgName = imgList(j).name;
if strcmp('Ambient.pgm', imgName(end-10:end))
continue;
end
im = imread(fullfile(imgDir, imgName));
if size(im, 3) ==3
im = rgb2gray(im);
end
im = imresize(im, [32 32]);
im = reshape(im, 32*32, 1);
data = [data im];
end
labels = [labels ones(1, numel(imgList)-1) * (i-2)];
end
save(saveName, 'data', 'labels');
end

三、实验结果

首先来个帅帅的平均脸：

然后来9个帅帅的特征脸：

推荐阅读

数据库
强人工智能时代，区块链的角色与前景

随着强人工智能的崛起，区块链技术在新的技术生态中扮演着怎样的角色？本文探讨了区块链与强人工智能之间的互补关系及其在未来技术发展中的重要性。 ... [详细]

蜡笔小新 2024-12-07 14:46:21
数据库
图像处理与模式识别工程师的职业路径与要求

专注于模式识别与机器学习的研究生，对于该领域内的就业方向及具体职位要求有着浓厚的兴趣。本文将探讨智能图像/视频处理工程师的岗位要求，并为相关专业的学生提供学习建议。 ... [详细]

蜡笔小新 2024-11-28 02:29:26
数据库
优化ListView性能

本文深入探讨了如何通过多种技术手段优化ListView的性能，包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]

蜡笔小新 2024-12-28 10:36:30
sql
新浪笔试题

1:有如下一段程序：packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]

蜡笔小新 2024-12-27 19:32:17
sql
云屏系统：嵌入式GUI开发的新突破

云屏系统基于嵌入式微系统msOS，旨在解决当前嵌入式彩屏GUI编程中硬件要求高、软件开发复杂、界面效果不佳等问题。该系统通过结合MCU和Android技术，利用Html5+JavaScript实现高效、易用的图形用户界面开发，使嵌入式开发人员能够专注于业务逻辑。 ... [详细]

蜡笔小新 2024-12-20 03:01:10
sql
吴恩达推出TensorFlow实践课程，Python基础即可入门，四个月掌握核心技能

量子位报道，deeplearning.ai最新发布了TensorFlow实践课程，适合希望使用TensorFlow开发AI应用的学习者。该课程涵盖机器学习模型构建、图像识别、自然语言处理及时间序列预测等多个方面。 ... [详细]

蜡笔小新 2024-12-08 17:26:10
sql
京东AI创新之路：周伯文解析京东AI战略的独特之处

2018年4月15日，京东在北京举办了人工智能创新峰会，会上首次公开了京东AI的整体布局和发展方向。此次峰会不仅展示了京东在AI领域的最新成果，还标志着京东AI团队的首次集体亮相。本文将深入探讨京东AI的发展策略及其与BAT等公司的不同之处。 ... [详细]

蜡笔小新 2024-12-06 22:57:11
sql
《计算机视觉：算法与应用》第二版初稿上线，全面更新迎接未来

经典计算机视觉教材《计算机视觉：算法与应用》迎来了其第二版，现已开放初稿下载。本书由Facebook研究科学家Richard Szeliski撰写，自2010年首版以来，一直是该领域的标准参考书。 ... [详细]

蜡笔小新 2024-11-30 20:56:47
sql
利用MATLAB实现“逢七必过”游戏规则与数字图像处理技术的应用——第4章深入解析

在《数字图像处理及应用（MATLAB）第4章》中，详细探讨了“逢七必过”游戏规则的实现方法，并结合数字图像处理技术进行了深入分析。本章通过丰富的实例和代码示例，展示了如何利用MATLAB实现这一游戏规则，并介绍了数字图像处理的基本原理和技术应用。内容涵盖了图像增强、滤波、边缘检测等多个方面，为读者提供了全面的技术支持和实践指导。 ... [详细]

蜡笔小新 2024-11-11 11:46:42
sql
深入解析OpenCV中的人脸检测算法实现

本文详细探讨了OpenCV中人脸检测算法的实现原理与代码结构。通过分析核心函数和关键步骤，揭示了OpenCV如何高效地进行人脸检测。文章不仅提供了代码示例，还深入解释了算法背后的数学模型和优化技巧，为开发者提供了全面的理解和实用的参考。 ... [详细]

蜡笔小新 2024-11-02 13:37:20
数据库
表面缺陷检测数据集综述及GitHub开源项目推荐

本文综述了表面缺陷检测领域的数据集，并推荐了多个GitHub上的开源项目。通过对现有文献和数据集的系统整理，为研究人员提供了全面的资源参考，有助于推动该领域的发展和技术进步。 ... [详细]

蜡笔小新 2024-10-29 08:22:46
数据库
面部识别技术面临关键转折点：伦理与应用的平衡挑战

面部识别技术正面临一个关键的转折点，其伦理与应用之间的平衡问题日益凸显。近日，该技术再次遭遇重大事件。本周二，由90个倡议组织组成的联盟发布了一份联合声明，呼吁全球范围内暂停使用面部识别技术，直到制定出明确的监管框架。这一举措反映了社会各界对隐私保护和技术滥用的担忧，同时也引发了关于如何在保障公共安全和维护个人隐私之间找到合理平衡的广泛讨论。 ... [详细]

蜡笔小新 2024-10-26 21:02:36
数据库
MATLAB人体行为检测与识别

人体行为检测与识别摘要人体行为检测与识别是当前研究的重点，具有很高的研究价值和广阔的应用前景。主要应用在型人机交互、运动分析、智能监控和虚拟现实也称灵境技术ÿ ... [详细]

蜡笔小新 2024-10-20 19:34:31
数据库
基于MATLAB的图像相似度分析：余弦相似度算法的实现与应用

本文探讨了利用MATLAB实现图像相似度分析的方法，重点介绍了余弦相似度算法的实现及其在实际应用中的效果。通过实验验证，该方法在图像匹配和检索任务中表现出较高的准确性和效率，为图像处理领域提供了有力的技术支持。 ... [详细]

蜡笔小新 2024-10-27 11:16:36
数据库
cs231n笔记（1）——KNN算法

图像分类：KNN算法（K—最近邻算法）一.定义定义：KNN是通过测量不同特征值之间的距离进行分类。它的的思路是ÿ ... [详细]

蜡笔小新 2024-10-25 13:32:41

峰子

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章