目录
- 0. 相关概念
- 1. 统计模式识别方法
- 主要问题:
- 具体方法
- (1) 模板匹配
- (2) 判别函数
- (3) 神经网络分类
- (4) 基于规则推理
- (5) 模糊模式识别
- (6) 支持向量机的模式识别
0. 相关概念
模式识别:对多维空间中各种模式的分布特点进行分析,对模式空间进行划分,识别各种模式的聚类情况,从而做出判断或决策。
测量空间:原始数据组成的空间。
特征空间:分类识别赖以进行的空间。
样本:特征空间中的一个模式。
映射:将多维模式空间通过数学变换到二维空间,多维空间的所有样本点都投影在该平面内。
在二维平面,不同类别的模式分布在不同的区域,区域之间有较明显的分界域。由此确定优化方向返回到原始测量空间,得出真实信息。
分类器设计问题 = 分类准则选择问题
1. 统计模式识别方法
步骤:
- 数据获取。将被识别对象数字化。
- 预处理。去除噪声,加强有用信息。
- 特征提取和选择。从对象空间映射到特征空间。🍔
- 分类决策。从特征空间再映射到决策空间。
适用情况:样本集数量有限
主要问题:
特征的选择
不同的特征空间分类表现不同
特征的优化
特征的选择
特征的组合优化
分类判别
聚类判别
具体方法
模式识别的具体方法有很多,根据不同情况,选择不同的方法
(1) 模板匹配
原理:选择已知的对象作为模板,与待测物体进行比较,从而识别目标。
优点:原理简单。
缺点:每个样品要对每个模板计算一次相似度,计算量大;要存储的模板多,导致存储量大。
临近法的原理属于模板匹配
(2) 判别函数
-
基于概率统计的分类法
基于最小错误率的贝叶斯决策
基于最小风险的贝叶斯决策
-
几何分类法/判别函数分类法
原理:通过某种变化映射出一个特征空间,找到一个判别函数把各类分开。
(3) 神经网络分类
原理:
- 若干处理单元通过一定的互连模型联结成一个网络,这个网络通过一定额定机制模仿人的神经西东的动作过程,以达到分类的目的。
- 从输入空间到输出空间的非线性映射,通过调整权重和阈值来学习或发现变量之间的关系,实现对事物的分类。
特点:大规模并行、分布式存储和处理;具有自组织、自适应和子学习能力。
适用情况:
- 同时考虑许多因素和条件的、不精确和模糊的信息处理问题。
- 非正太、非线性的问题。
优点:具有繁华处理能力;可处理复杂,推理规则不清的问题
缺点:能识别的模式太少。
(4) 基于规则推理
原理:
同时包含统计模式识别方法、句法模式识别
环节:
方法:
- 决策树。
原理:采用自顶向下的递归方式,在决策树的内部结点进行属性值的比较并根据不同属性判断从该结点向下的分支,在决策树的叶节点得到结论。 - 粗糙集理论
原理:以等价关系为基础,用上、下近似两个集合来逼近任意一个集合,该集合的边界区域被定义为上近似集和下近似集之差集,边界区域就是无法归属的个体。
适用情况:
(5) 模糊模式识别
(6) 支持向量机的模式识别
原理:在样本空间或特征空间构造出最优超平面,使得超平面与不同类样本集之间的距离最大,从而达到最大的泛化能力。
优点:结构简单;具有较好的泛化能力
适用情况:数字图像处理,寻找图像像素之间的特征差别。