作者:lovely蓝衣13 | 来源:互联网 | 2023-10-12 14:59
数字图像处理——第1章绪论写在前面1.1图像、像素及数字图像处理1.2数字图像处理基本步骤1.3图像处理的目的、任务与特点1.3.1图像处理的目的1.3.2图像处理的任务1.3.3
数字图像处理——第1章 绪论
- 写在前面
- 1.1 图像、像素及数字图像处理
- 1.2 数字图像处理基本步骤
- 1.3 图像处理的目的、任务与特点
- 1.3.1 图像处理的目的
- 1.3.2 图像处理的任务
- 1.3.3 数字图像处理的特点
- 1.4 数字图像处理的应用
写在前面
最近开始计算机视觉的基础课程学习,从最先的数字图像处理开始,再到后面的Python 计算机视觉、机器学习等课程。写在博客记录下整个学习过程,也方便后续自己学习。这些课程都是自己边学边实践的记录笔记,如有不足之处,还请大家批评指正。 |
1.1 图像、像素及数字图像处理
数字图像:是用一个数字阵列来表达客观物体的图像,是一个离散采样点的集合,每个点具有其各自的属性。课本中定义为一个图像可定义为一个二维函数f(x,y),其中x和y是空间(平面)坐标,而在任何一对空间坐标(x,y)处的幅值f称为该点处的强度或灰度。当x,y和灰度值f是有限的离散函数时,我们称该图像为数字图像。其实在之后的图像处理中,接触的便较多的灰度图像和彩色图像。一张图片肉眼看就是一张图片,但对于计算机来说,他看到的就是矩阵,就是一大堆数字,比如一张彩色的图片,对于计算机来说,就是具有三个通道(RGB)的矩阵。图像是像素值的矩阵。
灰度图像:每个像素的亮度用一个数值来表示,通常数值范围在0到255之间,0表示黑、255表 示白,其它值表示处于黑白之间的灰度。例如下图很常见的mnist数据集。
也可使用PIL库看到其为灰度图(mode=L)且分辨率为28×28
彩色图像:可以用红、绿、蓝(R、G、B)三元组的二维矩阵来表示。通常,三元组的每个数值也是在0到255之间,之后在深度学习的图像处理过程中常常看见tensor,例如PyTorch其维度格式是[batch, channel, height, width],其中batch之后再说,channel就是三通道,代表着RGB,如下图所示。
当然也可使用PIL库看到其为彩色图(mode=RGB)且分辨率为495×315
数字图像处理:是用计算机或者数字设备对图像进行加工、分析,以达到所需要的效果技术。目前所说的图像处理通俗指数字图像处理。
1.2 数字图像处理基本步骤
如上述图所示:
图像获取是数字图像处理的第一步。通常,图像获取阶段包括图像预处理,譬如图像缩放等。
图像增强是对一幅图像进行某种操作,使其结果在特定应用中比原始图像更适合进行处理。特定一词在这里很重要,因为一开始增强技术就建立在面向问题的基础之上。例如,对于增强x射线图像十分有用的方法,对于增强电磁波谱中红外波段获取的卫星图像可能就不是最好的方法。
图像复原也是改进图像外观的一个处理领域。然而,与图像增强不同,图像增强是主观的,而图像复原是客观的。
彩色图像中的彩色也是提取图像中感兴趣区域的基础。
小波是以不同分辨率来描述图像的基础。
压缩指的是减少图像存储量或降低传输图像带宽的处理。
形态学处理涉及提取图像分量的工具,这些分量在表示和描述形状方面很有用。
分割过程将一幅图像划分为它的组成部分或目标。通常,自动分割是数字图像处理中最困难的任务之-一。成功地把目标逐-识别出来是一 个艰难的分割过程。另一方面,很弱的 且不稳定的分割算法几乎总是会导致最终失败。通常,分割越准确,识别越成功。
描述又称为特征选择,涉及提取特征,它可得到某些感兴趣的定量信息,或是区分一组目标与其他目标的基础。
识别是基于目标的描述给该目标赋予标志,例如赋予其类别。
1.3 图像处理的目的、任务与特点
1.3.1 图像处理的目的
(1).提高图像的视觉质量以提供人眼主观满意的效果。图像增强、图像的恢复、图像的集合百年换、图像的滤波等处理能够使得受污染的图像得到有效的改善。如下图为经典的去雾算法
(2).提取图像中目标的某些特征,以便于计算机分析或机器人识别。例如边缘检测,图像分割、纹理分析常用作模式识别、计算机视觉等高级处理的预处理。如下图为Mask R-CNN算法。
(3).信息的可视化。许多信息(如温度场、流速场,生物组织内部等)并非可视,但是转化为视觉形式后可以充分利用人们对可视模式快速识别的自然能力、更便于观察分析与研究。
1.3.2 图像处理的任务
图像处理的任务是获取客观世界的景象并转化为数字图像后,进行增强复原重建变换编码压缩分割等处理,从而将一幅图像转化为另一幅具有新的意义的图像。具体任务在之后的章节中都会涉及,在此先有个印象.
1.3.3 数字图像处理的特点
(1).处理信息量很大。数字图像处理的信息大多是二维信息,处理信息量很大,因此对计算机的计算速度、存储容量要求较高。此处可联想到GPU,GPU就是图形处理器,我们经常采用GPU进行一些图形计算。
(2).占用频带较宽。与语言信息相比,数字图像处理占用的频带要大几个数量级。如电视图像的带宽约5.6MHz,而语音带宽仅为4kHz左右。所以在成像、传输、存储、处理、显示等各个环节的实现上,技术难度较大,成本亦高。
(3).无法复现全部信息。由于图像是三维景物的二维投影,一幅图象本身不具备复现三维景物的全部几何信息的能力,很显然三维景物背后部分信息在二维图像画面上是反映不出来的。因此,要分析和理解三维景物必须作合适的假定或附加新的测量,例如双目图像或多视点图像。在理解三维景物时需要知识导引,这也是人工智能中正在致力解决的知识工程问题。
1.4 数字图像处理的应用
图像是人类获取和交换信息的主要来源,因此,图像处理的应用领域必然涉及到人类生活和工作的方方面面。随着人类活动范围的不断扩大,图像处理的应用领域也将随之不断扩大。下面列出几种常见的应用。
(1).航天和航空方面。数字图像处理技术在航天和航空技术方面的应用,除了JPL对月球、火星照片的处理之外,另一方面的应用是在飞机遥感和卫星遥感技术中。例如资源调查,灾害检测,资源勘察,农业规划,城市规划等。举例如常见的航拍目标检测。
(2).生物医学工程方面。数字图像处理在生物医学工程方面的应用十分广泛,而且很有成效。除了常见的CT技术之外,还有一类是对医用显微图像的处理分析,如红细胞、白细胞分类,染色体分析,癌细胞识别等。此外,在X光肺部图像增晰、超声波图像处理、心电图分析、立体定向放射治疗等医学诊断方面都广泛地应用图像处理技术。
(3).军事、公安方面。在军事方面图像处理和识别主要用于导弹的精确末制导,各种侦察照片的判读,具有图像传输、存储和显示的军事自动化指挥系统,飞机、坦克和军舰模拟训练系统等;公安业务图片的判读分析,指纹识别,人脸识别,不完整图片的复原,以及交通监控、事故分析等。目前已投入运行的高速公路不停车自动收费系统中的车辆和车牌的自动识别都是图像处理技术成功应用的例子。
(4).机器人视觉。机器视觉作为智能机器人的重要感觉器官,主要进行三维景物理解和识别,是目前处于研究之中的开放课题。机器视觉主要用于军事侦察、危险环境的自主机器人,邮政、医院和家庭服务的智能机器人,装配线工件识别、定位,太空机器人的自动操作等。