热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

数字图像处理——第一章绪论

数字图像处理——第1章绪论写在前面1.1图像、像素及数字图像处理1.2数字图像处理基本步骤1.3图像处理的目的、任务与特点1.3.1图像处理的目的1.3.2图像处理的任务1.3.3


数字图像处理——第1章 绪论

    • 写在前面
    • 1.1 图像、像素及数字图像处理
    • 1.2 数字图像处理基本步骤
    • 1.3 图像处理的目的、任务与特点
      • 1.3.1 图像处理的目的
      • 1.3.2 图像处理的任务
      • 1.3.3 数字图像处理的特点
    • 1.4 数字图像处理的应用


写在前面


最近开始计算机视觉的基础课程学习,从最先的数字图像处理开始,再到后面的Python 计算机视觉、机器学习等课程。写在博客记录下整个学习过程,也方便后续自己学习。这些课程都是自己边学边实践的记录笔记,如有不足之处,还请大家批评指正。

1.1 图像、像素及数字图像处理

数字图像:是用一个数字阵列来表达客观物体的图像,是一个离散采样点的集合,每个点具有其各自的属性。课本中定义为一个图像可定义为一个二维函数f(x,y),其中x和y是空间(平面)坐标,而在任何一对空间坐标(x,y)处的幅值f称为该点处的强度或灰度。当x,y和灰度值f是有限的离散函数时,我们称该图像为数字图像。其实在之后的图像处理中,接触的便较多的灰度图像和彩色图像。一张图片肉眼看就是一张图片,但对于计算机来说,他看到的就是矩阵,就是一大堆数字,比如一张彩色的图片,对于计算机来说,就是具有三个通道(RGB)的矩阵。图像是像素值的矩阵。

灰度图像:每个像素的亮度用一个数值来表示,通常数值范围在0到255之间,0表示黑、255表 示白,其它值表示处于黑白之间的灰度。例如下图很常见的mnist数据集。


cYDLYd.md.jpg

也可使用PIL库看到其为灰度图(mode=L)且分辨率为28×28


cUimAs.png

彩色图像:可以用红、绿、蓝(R、G、B)三元组的二维矩阵来表示。通常,三元组的每个数值也是在0到255之间,之后在深度学习的图像处理过程中常常看见tensor,例如PyTorch其维度格式是[batch, channel, height, width],其中batch之后再说,channel就是三通道,代表着RGB,如下图所示。


cYjB1s.jpg

当然也可使用PIL库看到其为彩色图(mode=RGB)且分辨率为495×315

在这里插入图片描述

数字图像处理:是用计算机或者数字设备对图像进行加工、分析,以达到所需要的效果技术。目前所说的图像处理通俗指数字图像处理。


1.2 数字图像处理基本步骤

ctSZgH.md.jpg

如上述图所示:

图像获取是数字图像处理的第一步。通常,图像获取阶段包括图像预处理,譬如图像缩放等。

图像增强是对一幅图像进行某种操作,使其结果在特定应用中比原始图像更适合进行处理。特定一词在这里很重要,因为一开始增强技术就建立在面向问题的基础之上。例如,对于增强x射线图像十分有用的方法,对于增强电磁波谱中红外波段获取的卫星图像可能就不是最好的方法。

图像复原也是改进图像外观的一个处理领域。然而,与图像增强不同,图像增强是主观的,而图像复原是客观的。

彩色图像中的彩色也是提取图像中感兴趣区域的基础。

小波是以不同分辨率来描述图像的基础。

压缩指的是减少图像存储量或降低传输图像带宽的处理。

形态学处理涉及提取图像分量的工具,这些分量在表示和描述形状方面很有用。

分割过程将一幅图像划分为它的组成部分或目标。通常,自动分割是数字图像处理中最困难的任务之-一。成功地把目标逐-识别出来是一 个艰难的分割过程。另一方面,很弱的 且不稳定的分割算法几乎总是会导致最终失败。通常,分割越准确,识别越成功。

描述又称为特征选择,涉及提取特征,它可得到某些感兴趣的定量信息,或是区分一组目标与其他目标的基础。

识别是基于目标的描述给该目标赋予标志,例如赋予其类别。


1.3 图像处理的目的、任务与特点


1.3.1 图像处理的目的

(1).提高图像的视觉质量以提供人眼主观满意的效果。图像增强、图像的恢复、图像的集合百年换、图像的滤波等处理能够使得受污染的图像得到有效的改善。如下图为经典的去雾算法

ctC4I0.jpg

(2).提取图像中目标的某些特征,以便于计算机分析或机器人识别。例如边缘检测,图像分割、纹理分析常用作模式识别、计算机视觉等高级处理的预处理。如下图为Mask R-CNN算法。

cUiHEj.jpg

(3).信息的可视化。许多信息(如温度场、流速场,生物组织内部等)并非可视,但是转化为视觉形式后可以充分利用人们对可视模式快速识别的自然能力、更便于观察分析与研究。


ctVf6f.jpg


1.3.2 图像处理的任务

图像处理的任务是获取客观世界的景象并转化为数字图像后,进行增强复原重建变换编码压缩分割等处理,从而将一幅图像转化为另一幅具有新的意义的图像。具体任务在之后的章节中都会涉及,在此先有个印象.


cNvbqI.jpg


1.3.3 数字图像处理的特点

(1).处理信息量很大。数字图像处理的信息大多是二维信息,处理信息量很大,因此对计算机的计算速度、存储容量要求较高。此处可联想到GPU,GPU就是图形处理器,我们经常采用GPU进行一些图形计算。

(2).占用频带较宽。与语言信息相比,数字图像处理占用的频带要大几个数量级。如电视图像的带宽约5.6MHz,而语音带宽仅为4kHz左右。所以在成像、传输、存储、处理、显示等各个环节的实现上,技术难度较大,成本亦高。

(3).无法复现全部信息。由于图像是三维景物的二维投影,一幅图象本身不具备复现三维景物的全部几何信息的能力,很显然三维景物背后部分信息在二维图像画面上是反映不出来的。因此,要分析和理解三维景物必须作合适的假定或附加新的测量,例如双目图像或多视点图像。在理解三维景物时需要知识导引,这也是人工智能中正在致力解决的知识工程问题。


1.4 数字图像处理的应用

图像是人类获取和交换信息的主要来源,因此,图像处理的应用领域必然涉及到人类生活和工作的方方面面。随着人类活动范围的不断扩大,图像处理的应用领域也将随之不断扩大。下面列出几种常见的应用。

(1).航天和航空方面。数字图像处理技术在航天和航空技术方面的应用,除了JPL对月球、火星照片的处理之外,另一方面的应用是在飞机遥感和卫星遥感技术中。例如资源调查,灾害检测,资源勘察,农业规划,城市规划等。举例如常见的航拍目标检测。


cUp40A.jpg

(2).生物医学工程方面。数字图像处理在生物医学工程方面的应用十分广泛,而且很有成效。除了常见的CT技术之外,还有一类是对医用显微图像的处理分析,如红细胞、白细胞分类,染色体分析,癌细胞识别等。此外,在X光肺部图像增晰、超声波图像处理、心电图分析、立体定向放射治疗等医学诊断方面都广泛地应用图像处理技术。


cUF3Gt.jpg

(3).军事、公安方面。在军事方面图像处理和识别主要用于导弹的精确末制导,各种侦察照片的判读,具有图像传输、存储和显示的军事自动化指挥系统,飞机、坦克和军舰模拟训练系统等;公安业务图片的判读分析,指纹识别,人脸识别,不完整图片的复原,以及交通监控、事故分析等。目前已投入运行的高速公路不停车自动收费系统中的车辆和车牌的自动识别都是图像处理技术成功应用的例子。

cUCPUI.jpg

(4).机器人视觉。机器视觉作为智能机器人的重要感觉器官,主要进行三维景物理解和识别,是目前处于研究之中的开放课题。机器视觉主要用于军事侦察、危险环境的自主机器人,邮政、医院和家庭服务的智能机器人,装配线工件识别、定位,太空机器人的自动操作等。


cUC7QS.jpg


推荐阅读
  • 本文探讨了图像标签的多种分类场景及其在以图搜图技术中的应用,涵盖了从基础理论到实际项目实施的全面解析。 ... [详细]
  • 解决PyCharm中安装PyTorch深度学习d2l包的问题
    本文详细介绍了如何在PyCharm中成功安装用于PyTorch深度学习的d2l包,包括环境配置、安装步骤及常见问题的解决方案。 ... [详细]
  • 吴恩达推出TensorFlow实践课程,Python基础即可入门,四个月掌握核心技能
    量子位报道,deeplearning.ai最新发布了TensorFlow实践课程,适合希望使用TensorFlow开发AI应用的学习者。该课程涵盖机器学习模型构建、图像识别、自然语言处理及时间序列预测等多个方面。 ... [详细]
  • 强人工智能时代,区块链的角色与前景
    随着强人工智能的崛起,区块链技术在新的技术生态中扮演着怎样的角色?本文探讨了区块链与强人工智能之间的互补关系及其在未来技术发展中的重要性。 ... [详细]
  • 京东AI创新之路:周伯文解析京东AI战略的独特之处
    2018年4月15日,京东在北京举办了人工智能创新峰会,会上首次公开了京东AI的整体布局和发展方向。此次峰会不仅展示了京东在AI领域的最新成果,还标志着京东AI团队的首次集体亮相。本文将深入探讨京东AI的发展策略及其与BAT等公司的不同之处。 ... [详细]
  • 本文详细介绍了 TensorFlow 的入门实践,特别是使用 MNIST 数据集进行数字识别的项目。文章首先解析了项目文件结构,并解释了各部分的作用,随后逐步讲解了如何通过 TensorFlow 实现基本的神经网络模型。 ... [详细]
  • 尤洋:夸父AI系统——大规模并行训练的深度学习解决方案
    自从AlexNet等模型在计算机视觉领域取得突破以来,深度学习技术迅速发展。近年来,随着BERT等大型模型的广泛应用,AI模型的规模持续扩大,对硬件提出了更高的要求。本文介绍了新加坡国立大学尤洋教授团队开发的夸父AI系统,旨在解决大规模模型训练中的并行计算挑战。 ... [详细]
  • 机器学习核心概念与技术
    本文系统梳理了机器学习的关键知识点,涵盖模型评估、正则化、线性模型、支持向量机、决策树及集成学习等内容,并深入探讨了各算法的原理和应用场景。 ... [详细]
  • 随着生活节奏的加快和压力的增加,越来越多的人感到不快乐。本文探讨了现代社会中导致人们幸福感下降的各种因素,并提供了一些改善建议。 ... [详细]
  • Python中HOG图像特征提取与应用
    本文介绍如何在Python中使用HOG(Histogram of Oriented Gradients)算法进行图像特征提取,探讨其在目标检测中的应用,并详细解释实现步骤。 ... [详细]
  • 智能投顾机器人:创业者如何应对新挑战?
    随着智能投顾技术在二级市场的兴起,针对一级市场的智能投顾也逐渐崭露头角。近日,一款名为阿尔妮塔的人工智能创投机器人正式发布,它将如何改变投资人的工作方式和创业者的融资策略? ... [详细]
  • 2017年人工智能领域的十大里程碑事件回顾
    随着2018年的临近,我们一同回顾过去一年中人工智能领域的重要进展。这一年,无论是政策层面的支持,还是技术上的突破,都显示了人工智能发展的迅猛势头。以下是精选的2017年人工智能领域最具影响力的事件。 ... [详细]
  • 智慧城市建设现状及未来趋势
    随着新基建政策的推进及‘十四五’规划的实施,我国正步入以5G、人工智能等先进技术引领的智慧经济新时代。规划强调加速数字化转型,促进数字政府建设,新基建政策亦倡导城市基础设施的全面数字化。本文探讨了智慧城市的发展背景、全球及国内进展、市场规模、架构设计,以及百度、阿里、腾讯、华为等领军企业在该领域的布局策略。 ... [详细]
  • 在Ubuntu 16.04中使用Anaconda安装TensorFlow
    本文详细介绍了如何在Ubuntu 16.04系统上通过Anaconda环境管理工具安装TensorFlow。首先,需要下载并安装Anaconda,然后配置环境变量以确保系统能够识别Anaconda命令。接着,创建一个特定的Python环境用于安装TensorFlow,并通过指定的镜像源加速安装过程。最后,通过一个简单的线性回归示例验证TensorFlow的安装是否成功。 ... [详细]
  • 图像分类算法的优化策略与实践
    本文探讨了《Bag of Tricks for Image Classification with Convolutional Neural Networks》论文中的多项技术,旨在通过具体实例和实验验证,提高卷积神经网络在图像分类任务中的性能。文章详细介绍了从模型训练加速、网络结构调整到训练参数优化等多个方面的改进方法。 ... [详细]
author-avatar
lovely蓝衣13
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有