热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

数字图像处理——第一章绪论

数字图像处理——第1章绪论写在前面1.1图像、像素及数字图像处理1.2数字图像处理基本步骤1.3图像处理的目的、任务与特点1.3.1图像处理的目的1.3.2图像处理的任务1.3.3


数字图像处理——第1章 绪论

    • 写在前面
    • 1.1 图像、像素及数字图像处理
    • 1.2 数字图像处理基本步骤
    • 1.3 图像处理的目的、任务与特点
      • 1.3.1 图像处理的目的
      • 1.3.2 图像处理的任务
      • 1.3.3 数字图像处理的特点
    • 1.4 数字图像处理的应用


写在前面


最近开始计算机视觉的基础课程学习,从最先的数字图像处理开始,再到后面的Python 计算机视觉、机器学习等课程。写在博客记录下整个学习过程,也方便后续自己学习。这些课程都是自己边学边实践的记录笔记,如有不足之处,还请大家批评指正。

1.1 图像、像素及数字图像处理

数字图像:是用一个数字阵列来表达客观物体的图像,是一个离散采样点的集合,每个点具有其各自的属性。课本中定义为一个图像可定义为一个二维函数f(x,y),其中x和y是空间(平面)坐标,而在任何一对空间坐标(x,y)处的幅值f称为该点处的强度或灰度。当x,y和灰度值f是有限的离散函数时,我们称该图像为数字图像。其实在之后的图像处理中,接触的便较多的灰度图像和彩色图像。一张图片肉眼看就是一张图片,但对于计算机来说,他看到的就是矩阵,就是一大堆数字,比如一张彩色的图片,对于计算机来说,就是具有三个通道(RGB)的矩阵。图像是像素值的矩阵。

灰度图像:每个像素的亮度用一个数值来表示,通常数值范围在0到255之间,0表示黑、255表 示白,其它值表示处于黑白之间的灰度。例如下图很常见的mnist数据集。


cYDLYd.md.jpg

也可使用PIL库看到其为灰度图(mode=L)且分辨率为28×28


cUimAs.png

彩色图像:可以用红、绿、蓝(R、G、B)三元组的二维矩阵来表示。通常,三元组的每个数值也是在0到255之间,之后在深度学习的图像处理过程中常常看见tensor,例如PyTorch其维度格式是[batch, channel, height, width],其中batch之后再说,channel就是三通道,代表着RGB,如下图所示。


cYjB1s.jpg

当然也可使用PIL库看到其为彩色图(mode=RGB)且分辨率为495×315

在这里插入图片描述

数字图像处理:是用计算机或者数字设备对图像进行加工、分析,以达到所需要的效果技术。目前所说的图像处理通俗指数字图像处理。


1.2 数字图像处理基本步骤

ctSZgH.md.jpg

如上述图所示:

图像获取是数字图像处理的第一步。通常,图像获取阶段包括图像预处理,譬如图像缩放等。

图像增强是对一幅图像进行某种操作,使其结果在特定应用中比原始图像更适合进行处理。特定一词在这里很重要,因为一开始增强技术就建立在面向问题的基础之上。例如,对于增强x射线图像十分有用的方法,对于增强电磁波谱中红外波段获取的卫星图像可能就不是最好的方法。

图像复原也是改进图像外观的一个处理领域。然而,与图像增强不同,图像增强是主观的,而图像复原是客观的。

彩色图像中的彩色也是提取图像中感兴趣区域的基础。

小波是以不同分辨率来描述图像的基础。

压缩指的是减少图像存储量或降低传输图像带宽的处理。

形态学处理涉及提取图像分量的工具,这些分量在表示和描述形状方面很有用。

分割过程将一幅图像划分为它的组成部分或目标。通常,自动分割是数字图像处理中最困难的任务之-一。成功地把目标逐-识别出来是一 个艰难的分割过程。另一方面,很弱的 且不稳定的分割算法几乎总是会导致最终失败。通常,分割越准确,识别越成功。

描述又称为特征选择,涉及提取特征,它可得到某些感兴趣的定量信息,或是区分一组目标与其他目标的基础。

识别是基于目标的描述给该目标赋予标志,例如赋予其类别。


1.3 图像处理的目的、任务与特点


1.3.1 图像处理的目的

(1).提高图像的视觉质量以提供人眼主观满意的效果。图像增强、图像的恢复、图像的集合百年换、图像的滤波等处理能够使得受污染的图像得到有效的改善。如下图为经典的去雾算法

ctC4I0.jpg

(2).提取图像中目标的某些特征,以便于计算机分析或机器人识别。例如边缘检测,图像分割、纹理分析常用作模式识别、计算机视觉等高级处理的预处理。如下图为Mask R-CNN算法。

cUiHEj.jpg

(3).信息的可视化。许多信息(如温度场、流速场,生物组织内部等)并非可视,但是转化为视觉形式后可以充分利用人们对可视模式快速识别的自然能力、更便于观察分析与研究。


ctVf6f.jpg


1.3.2 图像处理的任务

图像处理的任务是获取客观世界的景象并转化为数字图像后,进行增强复原重建变换编码压缩分割等处理,从而将一幅图像转化为另一幅具有新的意义的图像。具体任务在之后的章节中都会涉及,在此先有个印象.


cNvbqI.jpg


1.3.3 数字图像处理的特点

(1).处理信息量很大。数字图像处理的信息大多是二维信息,处理信息量很大,因此对计算机的计算速度、存储容量要求较高。此处可联想到GPU,GPU就是图形处理器,我们经常采用GPU进行一些图形计算。

(2).占用频带较宽。与语言信息相比,数字图像处理占用的频带要大几个数量级。如电视图像的带宽约5.6MHz,而语音带宽仅为4kHz左右。所以在成像、传输、存储、处理、显示等各个环节的实现上,技术难度较大,成本亦高。

(3).无法复现全部信息。由于图像是三维景物的二维投影,一幅图象本身不具备复现三维景物的全部几何信息的能力,很显然三维景物背后部分信息在二维图像画面上是反映不出来的。因此,要分析和理解三维景物必须作合适的假定或附加新的测量,例如双目图像或多视点图像。在理解三维景物时需要知识导引,这也是人工智能中正在致力解决的知识工程问题。


1.4 数字图像处理的应用

图像是人类获取和交换信息的主要来源,因此,图像处理的应用领域必然涉及到人类生活和工作的方方面面。随着人类活动范围的不断扩大,图像处理的应用领域也将随之不断扩大。下面列出几种常见的应用。

(1).航天和航空方面。数字图像处理技术在航天和航空技术方面的应用,除了JPL对月球、火星照片的处理之外,另一方面的应用是在飞机遥感和卫星遥感技术中。例如资源调查,灾害检测,资源勘察,农业规划,城市规划等。举例如常见的航拍目标检测。


cUp40A.jpg

(2).生物医学工程方面。数字图像处理在生物医学工程方面的应用十分广泛,而且很有成效。除了常见的CT技术之外,还有一类是对医用显微图像的处理分析,如红细胞、白细胞分类,染色体分析,癌细胞识别等。此外,在X光肺部图像增晰、超声波图像处理、心电图分析、立体定向放射治疗等医学诊断方面都广泛地应用图像处理技术。


cUF3Gt.jpg

(3).军事、公安方面。在军事方面图像处理和识别主要用于导弹的精确末制导,各种侦察照片的判读,具有图像传输、存储和显示的军事自动化指挥系统,飞机、坦克和军舰模拟训练系统等;公安业务图片的判读分析,指纹识别,人脸识别,不完整图片的复原,以及交通监控、事故分析等。目前已投入运行的高速公路不停车自动收费系统中的车辆和车牌的自动识别都是图像处理技术成功应用的例子。

cUCPUI.jpg

(4).机器人视觉。机器视觉作为智能机器人的重要感觉器官,主要进行三维景物理解和识别,是目前处于研究之中的开放课题。机器视觉主要用于军事侦察、危险环境的自主机器人,邮政、医院和家庭服务的智能机器人,装配线工件识别、定位,太空机器人的自动操作等。


cUC7QS.jpg


推荐阅读
  • 【图像分类实战】利用DenseNet在PyTorch中实现秃头识别
    本文详细介绍了如何使用DenseNet模型在PyTorch框架下实现秃头识别。首先,文章概述了项目所需的库和全局参数设置。接着,对图像进行预处理并读取数据集。随后,构建并配置DenseNet模型,设置训练和验证流程。最后,通过测试阶段验证模型性能,并提供了完整的代码实现。本文不仅涵盖了技术细节,还提供了实用的操作指南,适合初学者和有经验的研究人员参考。 ... [详细]
  • 本文介绍了如何使用 Google Colab 的免费 GPU 资源进行深度学习应用开发。Google Colab 是一个无需配置即可使用的云端 Jupyter 笔记本环境,支持多种深度学习框架,并且提供免费的 GPU 计算资源。 ... [详细]
  • 精选10款Python框架助力并行与分布式机器学习
    随着神经网络模型的不断深化和复杂化,训练这些模型变得愈发具有挑战性,不仅需要处理大量的权重,还必须克服内存限制等问题。本文将介绍10款优秀的Python框架,帮助开发者高效地实现分布式和并行化的深度学习模型训练。 ... [详细]
  • 在Windows系统中安装TensorFlow GPU版的详细指南与常见问题解决
    在Windows系统中安装TensorFlow GPU版是许多深度学习初学者面临的挑战。本文详细介绍了安装过程中的每一个步骤,并针对常见的问题提供了有效的解决方案。通过本文的指导,读者可以顺利地完成安装并避免常见的陷阱。 ... [详细]
  • 能够感知你情绪状态的智能机器人即将问世 | 科技前沿观察
    本周科技前沿报道了多项重要进展,包括美国多所高校在机器人技术和自动驾驶领域的最新研究成果,以及硅谷大型企业在智能硬件和深度学习技术上的突破性进展。特别值得一提的是,一款能够感知用户情绪状态的智能机器人即将问世,为未来的人机交互带来了全新的可能性。 ... [详细]
  • 通过使用CIFAR-10数据集,本文详细介绍了如何快速掌握Mixup数据增强技术,并展示了该方法在图像分类任务中的显著效果。实验结果表明,Mixup能够有效提高模型的泛化能力和分类精度,为图像识别领域的研究提供了有价值的参考。 ... [详细]
  • 对于初学者而言,搭建一个高效稳定的 Python 开发环境是入门的关键一步。本文将详细介绍如何利用 Anaconda 和 Jupyter Notebook 来构建一个既易于管理又功能强大的开发环境。 ... [详细]
  • OBS Studio自动化实践:利用脚本批量生成录制场景
    本文探讨了如何利用OBS Studio进行高效录屏,并通过脚本实现场景的自动生成。适合对自动化办公感兴趣的读者。 ... [详细]
  • Python 领跑!2019年2月编程语言排名更新
    根据最新的编程语言流行指数(PYPL)排行榜,Python 在2019年2月的份额达到了26.42%,稳坐榜首位置。 ... [详细]
  • 本文源自Coursera平台吴恩达教授的深度学习课程,重点探讨了卷积神经网络(ConvNets)从二维图像处理向一维信号及三维数据处理的拓展应用。 ... [详细]
  • 自动驾驶中的9种传感器融合算法
    来源丨AI修炼之路在自动驾驶汽车中,传感器融合是融合来自多个传感器数据的过程。该步骤在机器人技术中是强制性的,因为它提供了更高的可靠性、冗余性以及最终的 ... [详细]
  • 使用 Jupyter Notebook 实现 Markdown 编写与代码运行
    Jupyter Notebook 是一个开源的基于网页的应用程序,允许用户在同一文档中编写 Markdown 文本和运行多种编程语言的代码,并实时查看运行结果。 ... [详细]
  • 本文详细介绍了 Java 网站开发的相关资源和步骤,包括常用网站、开发环境和框架选择。 ... [详细]
  • 在Conda环境中高效配置并安装PyTorch和TensorFlow GPU版的方法如下:首先,创建一个新的Conda环境以避免与基础环境发生冲突,例如使用 `conda create -n pytorch_gpu python=3.7` 命令。接着,激活该环境,确保所有依赖项都正确安装。此外,建议在安装过程中指定CUDA版本,以确保与GPU兼容性。通过这些步骤,可以确保PyTorch和TensorFlow GPU版的顺利安装和运行。 ... [详细]
  • 在Windows环境下离线安装PyTorch GPU版时,首先需确认系统配置,例如本文作者使用的是Win8、CUDA 8.0和Python 3.6.5。用户应根据自身Python和CUDA版本,在PyTorch官网查找并下载相应的.whl文件。此外,建议检查系统环境变量设置,确保CUDA路径正确配置,以避免安装过程中可能出现的兼容性问题。 ... [详细]
author-avatar
lovely蓝衣13
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有