11.62 属性学习若干重要问题的研究及应用
作为模式识别中至为重要的一个环节,特征表示直接影响着整个智能系统的学习性能。传统的图像特征表示一般基于原始图像的低层特征,如侧重于刻画纹理信息的Local Binary Pattern(LBP)特征、侧重于方向信息的 Gabor 特征和尺度不变特征变换(Scale Invariant Feature Transform,SIFT),以及侧重于局部形状信息的方向梯度直方图(Histogramsof Oriented Gradients,HOG)特征等。随着脑科学和认知科学的发展,研究者发现人类认知目标的特点是对图像局部灰度的具体数值和变化具有高度不变性,并能从整体上归纳出该对象的典型特征而加以抽象。因此,他们开始尝试从人类认知的角度设计新的、更为抽象的特征表示。作为图像的语义建模方法,属性表示正是这一研究思路的自然成果。本文主要关注图像的语义建模方法——属性表示。
属性表示,即决定如何刻画对象或事件中哪些视觉上的特质,是实现属性学习的基础问题。现有的研究中主要存在三种类型的属性,即视觉属性(如“红色”、“圆形”和“条状”等)、部件属性(如“有翅膀”、“有耳朵”和“有嘴巴”等)和相似属性(如“类似于狗”、“比老虎小”和“不像汽车”等)。从上述分类可以看出,区别于低层特征,属性是对目标类的一种高级特征描述(如图 1 所示),往往包含一定的语义信息。同时,属性表示与低层特征有着密切联系。一方面,属性是对低层特征的抽象和概括,是对低层特征的一种语义描述;另一方面,对象的低层特征是实现属性描述的基础,没有低层特征就没有属性表示。当然,低层特征中蕴含的信息远远比属性描述更丰富,而且一个属性往往只能描述对象的某个侧面,不能反映对象的本质。例如,仅仅一个“条纹”属性通常很难反映“斑马”这一对象类的本质特点,即很难通过某些单独的属性达到“窥一斑而知全豹”的效果。即便如此,我们及其他研究者[1-3]仍认为,属性作为一种对象类别的描述方式,具有低层特征不具备的以下优点,例如可推广性、可解释性、灵活性、经济性等。正是由于应用属性描述对象的上述优势,使得属性在复杂易变的学习环境中十分有用,并被广泛应用于对象识别[4-5] 、人脸验证 [6-8] 、动作识别 [9] 、图像检索 [10-11] 、姿态估计[12-13]和零样本学习[14-17]等实际问题。
属性学习的核心思想是通过一组属性表示和训练数据建立一个映射,将数据的低层特征映射到属性表示层,并基于属性表示建立具有高精确性和高鲁棒性的学习系统。无论从机器学习理论与算法研究角度,还是从与其密切相关的实际应用角度,属性学习都具有重要的研究意义。属性学习问题涉及属性表示、特征提取、特征选择和分类器设计等众多领域,但限于篇幅及研究侧重点,本文主要探讨属性表示、属性关系学习、属性特征选择和属性分类器设计方法,通过充分挖掘和利用数据内在的结构信息及其包含的丰富中低层视觉信息,构建并发展高准确度和高鲁棒性的属性学习模型,提升机器在复杂学习场景下对目标类的基本认知能力和理解能力。为此,本文的研究工作主要包括以下四个部分。