本文主要分享【我们看的图片视频文字】,技术文章【图像处理与计算机视觉. 特征检测:提取图像中的结构信息】为【乔卿】投稿,如果你遇到图像处理与计算机视觉相关问题,本文相关知识或能到你。
基本概念:特征检测、特征描述、特征匹配
4.1感兴趣点感兴趣点检测
感兴趣点的特点:可重复检测、有判别力、局部性
模板匹配:ORB
FAST:取图像中检测点,以该点为圆心的周围的16个像素点判断检测点是否为角点, 若有连续12或9个邻域像素值都大于或都小于中心像素点(+-阈值),则认为是候选特征点。可以先判断直角点剪枝。ORB:仅将中心点与圆上的四个像素点比较,要求连续2个的像素值都大于或都小于中心像素点(+-阈值)。尺度不变:图像金字塔;旋转不变:用质心(特征点与质心形成的向量)标定方向。基于一阶梯度的Harris角点检测器 角点:两条直线的交点、轮廓的高曲率点SSD:移动后灰度值的变化,用一阶泰勒展开近似SSD,得到 ,M为自相关矩阵,求特征值。一个特征值远大于另一个为边缘,两个都很大为角点。为了高效,求响应的度量R,角点的R很大,边缘很小的负数,平坦区域接近0。 Harris角点检测器步骤: 计算图像在两个方向上的梯度Ix、Iy计算每个像素点梯度的乘积计算每个像素点梯度的乘积的累积定义每个像素点的 矩阵M计算每个像素点的角点响应R(M的特征值、迹)对响应R作阈值处理与NMS 角点相应R对于图像旋转具有不变性,不具有尺度不变性。尺度不变:引入图像金字塔
拉普拉斯高斯(LoG)算子 LoG算子:二元高斯核的二阶导数。两个卷积核合二为一: 先高斯平滑、后拉普拉斯求梯度。 尺度归一化:核函数乘以尺度因子的平方( ),用不同尺度的LoG,寻找响应的最大值。使用LoG进行斑点检测: 对图像用 多个尺度的带尺度归一的LoG算子卷积;在 尺度空间的局部极值 高斯差分(DoG)金字塔 DoG:尺度不变的检测器 DoG与LoG的关系:Dog=(k-1)LoG,LoG通过尺度因子 ,DoG通过金字塔。 DoG/SIFT特征点检测的步骤 构造高斯金字塔 平滑图像:使用高斯平滑图像,相邻金字塔的尺度因子为2倍下采样:对平滑后的图像进行下采样构造金字塔:相邻八度尺度相差2倍,同组相邻层尺度相差k倍,每一个八度S+3个 构造高斯差分金字塔检测极值点(S+2DoG图像,找S个尺度中的极值点)关键点定位(使用泰勒展开插值)去除边缘效应:定义H,H迹的平方与行列式的比值小于阈值特征描述子
特征点描述子(SIFT):梯度方向直方图
方向直方图:计算各个位置梯度的角度,画成直方图,横坐标是梯度方向,从而可以找到主方向,然后归一化
SIFT描述子:带方向的空间梯度直方图,特征点附近分成4*4个区域,角度8等分,特征维度为128维。
SIFT的不变性:旋转不变(按主方向归一化)、小的平移不变(取的梯度方向直方图)、光照不变(描述子由梯度组成)
二值描述子:BRIEF
二进制的描述子,相似性用汉明距离,计算和匹配的速度都很快,步骤为:
图像平滑在邻域内随机采样n个点对,前者大为0,前者小为1,形成二进制编码 4.2边缘:Canny边缘检测器 流程: 高斯平滑求两个方向的一阶梯度计算梯度的幅度和方向非最大值抑制(希望得到单像素边缘,而不是厚的模糊线)双阈值确定边界 高低阈值的作用:大于上界的保留,低于下界的舍弃,中间的如果与边缘点直接相连则是边缘点 4.3直线和其他参数曲线检测:Hough变换直线的极坐标形式:
Hough变换的思想:
基于投票的参数估计:对噪声鲁棒基本原理:变换到参数空间,通过检测参数空间中投票的极值点,确定出该曲线的描述参数为什么用极坐标?参数化空间(k,b)太大步骤 给定参数网格(r, ),初始化计数器为0对于图像中的每一个边缘点,符合极坐标方程的参数位置的累积计数器增加1寻找计数器中的局部最大值得到直线方程 优点: 能处理非局部性和遮挡能检测多个实例对噪声鲁棒 缺点 计算复杂度高,搜索时间随参数的数目指数增加非目标形状可能会在参数空间产生虚假的峰值参数的量化参数难以确定本文《图像处理与计算机视觉. 特征检测:提取图像中的结构信息》版权归乔卿所有,引用图像处理与计算机视觉. 特征检测:提取图像中的结构信息需遵循CC 4.0 BY-SA版权协议。