热门标签 | HotTags
当前位置:  开发笔记 > 数据库 > 正文

模式识别综述

一、引言模式识别是研究如何让机器能观察环境,并从环境背景中将感兴趣的目标提取分离、分类的过程;给定一个模式,它的识别、分类包含以下两方面的任务:指导性分类及非指导性分类。所以识别问题基本等价

一、引言
模式识别是研究如何让机器能观察环境,并从环境背景中将感兴趣的目标提取分离、分类的过程;给定一个模式,它的识别、分类包含以下两方面的任务:指导性分类及非指导性分类。所以识别问题基本等价于分类、分组的问题,类(组)的概念是有设计者指定的或有算法依据数据在一定的相似性准则下建立的。模式识别应用的领域越来越广,从生物学、数据挖掘、文档分类、文档图像分析、工业自动化、多媒体数据库检索、语音识别到远程遥感等方面。而且不同的场景应用的方法还有差别,这主要由数据的类型(空间维数)、类别信息等决定;对于一个模式识别系统,其速度、准确性及花费仍然是考虑的方面。模式识别系统一般包含以下三个处理步骤:数据的采集、特性及决策;而问题域就决定了传感器、预处理技术、特性建立机制及决策模型等方面的技术。对于一个定义很好的、模式紧凑的识别问题(如小类内偏差,大类间偏差),这种情况用一个简单的决策模型就会得到较好的结果。已知的模式识别方法可分为四个大的方面:模板匹配、统计模式识别、语法及结构匹配和神经网络,下面先对这四个方面进行简单的阐述。
1、模板匹配
这时出现较早的一种方法,而且实现起来也较简单,匹配是个通用的操作,用于定义两个实体间的相似性程度,一般是采用二维模板,匹配的要素一般采用像素、曲线及形状信息,当然在定义模板及相似性函数时要考虑到实体的姿态及比例问题,这种方法一般不需要训练,实际上模板就是由训练集建立起来的。
这种方法的主要缺点是处理图像的扭曲效果不好,如图像投影的畸变教严重时。
2、统计
每个模式都是d维空间中的一个点,目标就是选择一些模式向量将不同的模式分配到不同的模式空间的区域上,对于每个类别给定的训练集,在模式空间中建立一些分割边界将不同的模式分到不同的类别中,统计方法中,这个边界是基于每个类的模式的概率分布的,这点必须预先知道或通过学习获得,学习就分参数化和非参数化的,前者对应知道其分布需要估计其分布参数,这个由样本空间可完成,而后者是采用核函数的方式进行估计,同时分割边界一般是基于一定准则建立的,如最小均方误差准则。
3、语法及结构分析
这种方法一般针对复杂模式提出的,一般将模式分为子模式一级,称为基元。这种方法其难点是基元的提取及从训练数据中提取语法、结构规则。
4、神经网络
是一种复杂的并行的非线性系统,完成复杂的计算,网络的最大特点就是从训练数据中学习到输入-输出间的复杂关系,并对数据具有适应性。网络的结构是千万种,但最常用的就是前馈结构,如多层感知器及径向基函数两种。神经网络中的隐层可完成特性的抽取及选择功能,所以适应性很强,理论上,网络模型等价于经典的统计方法,实际上统计信息就是从样本中获得。
本部分主要讨论统计模式识别的方法,从操作的一些细节上进行讨论,同时也讨论的多种方法的优缺点。
二、统计模式识别
一个模式系统一般工作在两个方面:训练和分类;统计模式识别的理论依据就是bayes理论,当然也可采用修正的bayes理论(风险估计);当然bayes理论要求类的分布情况,在已知分布情况下就可直接使用,但一般这种可能性较小,对于只是知道分布函数,但不知道参数的情况,就是估计参数的过程,而在更一般情况下,对应分布是一点信息没有,这样可采用Parzen窗核函数估计其分布或直接基于训练数据建立决策边界。实际上多层感知器就是一个非参数的过程。统计模式的一种分类方法分为指导性训练和非指导性训练;非指导性训练一般对于数据的已知信息很少,如远程的空间遥感应用,这里一般采用聚类的方法。另一种分类方法是基于决策边界是直接获得还是间接获得,前者一般是在几何空间就可完成。无论采用那种方法,训练集非常关键,主要训练的数据量要足够大而且要足够典型,这样才能保证算法的可靠性,训练集的应用上注意以下几点:训练样本的个数应该在10倍于特性数据维数;相对于训练样本,分类器的未知参数不能过多;分类器不能出现过度训练的问题。
又一个注意点就是在模式识别中并不是维数越高识别效果越好,这种现象称为维数的诅咒,这种诅咒就是随着特性增加而分类器的性能确恶化;当然对于已知类的条件概率情况下,这种诅咒是不存在的,但一般情况下这种分布是不确定知道的。
三、维数的降低
在很多情况下需要对已知的特性进行降低处理,即在低维空间进行分类,如性能的考虑。主向量分析法是一种常用的方法,这种方法剔除掉次要的特性,其模式信息由主向量(协方差矩阵的主特征向量)决定;特性抽取和特性选择是由差别的,特性抽取强调是空间的维数处理,如原始特性的变换和组合。而特性选择是指从特性空间中选择一个子空间进行分类,以便达到分类误差最小的要求。


推荐阅读
  • 知识图谱与图神经网络在金融科技中的应用探讨
    本文详细介绍了融慧金科AI Lab负责人张凯博士在2020爱分析·中国人工智能高峰论坛上的演讲,探讨了知识图谱与图神经网络模型如何在金融科技领域发挥重要作用。 ... [详细]
  • 本文档旨在帮助开发者回顾游戏开发中的人工智能技术,涵盖移动算法、群聚行为、路径规划、脚本AI、有限状态机、模糊逻辑、规则式AI、概率论与贝叶斯技术、神经网络及遗传算法等内容。 ... [详细]
  • 在Ubuntu 16.04中使用Anaconda安装TensorFlow
    本文详细介绍了如何在Ubuntu 16.04系统上通过Anaconda环境管理工具安装TensorFlow。首先,需要下载并安装Anaconda,然后配置环境变量以确保系统能够识别Anaconda命令。接着,创建一个特定的Python环境用于安装TensorFlow,并通过指定的镜像源加速安装过程。最后,通过一个简单的线性回归示例验证TensorFlow的安装是否成功。 ... [详细]
  • 智能全栈云风暴:AI引领的企业转型之路
    当提及AI,人们脑海中常浮现的是天才少年独自编写算法,瞬间点亮机器人的双眼。然而,真正的AI革命正由大型企业和机构推动,它们利用全栈全场景AI技术,实现数字化与智能化的深度转型。 ... [详细]
  • 强人工智能时代,区块链的角色与前景
    随着强人工智能的崛起,区块链技术在新的技术生态中扮演着怎样的角色?本文探讨了区块链与强人工智能之间的互补关系及其在未来技术发展中的重要性。 ... [详细]
  • 大数据时代的机器学习:人工特征工程与线性模型的局限
    本文探讨了在大数据背景下,人工特征工程与线性模型的应用及其局限性。随着数据量的激增和技术的进步,传统的特征工程方法面临挑战,文章提出了未来发展的可能方向。 ... [详细]
  • 本文详细记录了作者从7月份的提前批到9、10月份正式批的秋招经历,包括各公司的面试流程、技术问题及HR面的常见问题。通过这次秋招,作者深刻体会到了技术积累和面试准备的重要性。 ... [详细]
  • 解决getallheaders函数导致的500错误及8种服务器性能优化策略
    本文探讨了解决getallheaders函数引起的服务器500错误的方法,并介绍八种有效的服务器性能优化技术,包括内存数据库的应用、Spark RDD的使用、缓存策略的实施、SSD的引入、数据库优化、IO模型的选择、多核处理策略以及分布式部署方案。 ... [详细]
  • 大数据核心技术解析
    本文深入探讨了大数据技术的关键领域,包括数据的收集、预处理、存储管理、以及分析挖掘等方面,旨在提供一个全面的技术框架理解。 ... [详细]
  • 深入理解OAuth认证机制
    本文介绍了OAuth认证协议的核心概念及其工作原理。OAuth是一种开放标准,旨在为第三方应用提供安全的用户资源访问授权,同时确保用户的账户信息(如用户名和密码)不会暴露给第三方。 ... [详细]
  • 国内BI工具迎战国际巨头Tableau,稳步崛起
    尽管商业智能(BI)工具在中国的普及程度尚不及国际市场,但近年来,随着本土企业的持续创新和市场推广,国内主流BI工具正逐渐崭露头角。面对国际品牌如Tableau的强大竞争,国内BI工具通过不断优化产品和技术,赢得了越来越多用户的认可。 ... [详细]
  • 优化ListView性能
    本文深入探讨了如何通过多种技术手段优化ListView的性能,包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]
  • 在Word中编辑复杂的数学公式常常让人感到头疼,尤其是处理偏微分方程(PDE)等高级数学内容时。然而,最近GitHub上的一个开源项目latexify_py展示了如何利用Python轻松生成LaTeX数学公式,极大地简化了这一过程。 ... [详细]
  • 使用R语言进行Foodmart数据的关联规则分析与可视化
    本文探讨了如何利用R语言中的arules和arulesViz包对Foodmart数据集进行关联规则的挖掘与可视化。文章首先介绍了数据集的基本情况,然后逐步展示了如何进行数据预处理、规则挖掘及结果的图形化呈现。 ... [详细]
  • 【转】强大的矩阵奇异值分解(SVD)及其应用
    在工程实践中,经常要对大矩阵进行计算,除了使用分布式处理方法以外,就是通过理论方法,对矩阵降维。一下文章,我在 ... [详细]
author-avatar
月芽2502915393
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有