数字图像处理——第一章绪论

作者：lovely蓝衣13 | 来源：互联网 | 2023-10-12 14:59

数字图像处理——第1章绪论写在前面1.1图像、像素及数字图像处理1.2数字图像处理基本步骤1.3图像处理的目的、任务与特点1.3.1图像处理的目的1.3.2图像处理的任务1.3.3

数字图像处理——第1章绪论

- 写在前面
- 1.1 图像、像素及数字图像处理
- 1.2 数字图像处理基本步骤
- 1.3 图像处理的目的、任务与特点
- - 1.3.1 图像处理的目的
  - 1.3.2 图像处理的任务
  - 1.3.3 数字图像处理的特点
- 1.4 数字图像处理的应用

写在前面

最近开始计算机视觉的基础课程学习，从最先的数字图像处理开始，再到后面的Python 计算机视觉、机器学习等课程。写在博客记录下整个学习过程，也方便后续自己学习。这些课程都是自己边学边实践的记录笔记，如有不足之处，还请大家批评指正。

1.1 图像、像素及数字图像处理

数字图像：是用一个数字阵列来表达客观物体的图像，是一个离散采样点的集合，每个点具有其各自的属性。课本中定义为一个图像可定义为一个二维函数f(x,y),其中x和y是空间（平面）坐标，而在任何一对空间坐标（x,y）处的幅值f称为该点处的强度或灰度。当x,y和灰度值f是有限的离散函数时，我们称该图像为数字图像。其实在之后的图像处理中，接触的便较多的灰度图像和彩色图像。一张图片肉眼看就是一张图片，但对于计算机来说，他看到的就是矩阵，就是一大堆数字，比如一张彩色的图片，对于计算机来说，就是具有三个通道（RGB）的矩阵。图像是像素值的矩阵。

灰度图像：每个像素的亮度用一个数值来表示，通常数值范围在0到255之间，0表示黑、255表示白，其它值表示处于黑白之间的灰度。例如下图很常见的mnist数据集。

也可使用PIL库看到其为灰度图（mode=L）且分辨率为28×28

彩色图像：可以用红、绿、蓝（R、G、B）三元组的二维矩阵来表示。通常，三元组的每个数值也是在0到255之间，之后在深度学习的图像处理过程中常常看见tensor，例如PyTorch其维度格式是[batch, channel, height, width]，其中batch之后再说，channel就是三通道，代表着RGB，如下图所示。

当然也可使用PIL库看到其为彩色图（mode=RGB）且分辨率为495×315

在这里插入图片描述

数字图像处理：是用计算机或者数字设备对图像进行加工、分析，以达到所需要的效果技术。目前所说的图像处理通俗指数字图像处理。

1.2 数字图像处理基本步骤

ctSZgH.md.jpg

如上述图所示：

图像获取是数字图像处理的第一步。通常，图像获取阶段包括图像预处理，譬如图像缩放等。

图像增强是对一幅图像进行某种操作，使其结果在特定应用中比原始图像更适合进行处理。特定一词在这里很重要，因为一开始增强技术就建立在面向问题的基础之上。例如，对于增强x射线图像十分有用的方法，对于增强电磁波谱中红外波段获取的卫星图像可能就不是最好的方法。

图像复原也是改进图像外观的一个处理领域。然而，与图像增强不同，图像增强是主观的，而图像复原是客观的。

彩色图像中的彩色也是提取图像中感兴趣区域的基础。

小波是以不同分辨率来描述图像的基础。

压缩指的是减少图像存储量或降低传输图像带宽的处理。

形态学处理涉及提取图像分量的工具，这些分量在表示和描述形状方面很有用。

分割过程将一幅图像划分为它的组成部分或目标。通常，自动分割是数字图像处理中最困难的任务之-一。成功地把目标逐-识别出来是一个艰难的分割过程。另一方面，很弱的且不稳定的分割算法几乎总是会导致最终失败。通常，分割越准确，识别越成功。

描述又称为特征选择，涉及提取特征，它可得到某些感兴趣的定量信息，或是区分一组目标与其他目标的基础。

识别是基于目标的描述给该目标赋予标志，例如赋予其类别。

1.3 图像处理的目的、任务与特点

1.3.1 图像处理的目的

(1).提高图像的视觉质量以提供人眼主观满意的效果。图像增强、图像的恢复、图像的集合百年换、图像的滤波等处理能够使得受污染的图像得到有效的改善。如下图为经典的去雾算法

(2).提取图像中目标的某些特征，以便于计算机分析或机器人识别。例如边缘检测，图像分割、纹理分析常用作模式识别、计算机视觉等高级处理的预处理。如下图为Mask R-CNN算法。

(3).信息的可视化。许多信息（如温度场、流速场，生物组织内部等）并非可视，但是转化为视觉形式后可以充分利用人们对可视模式快速识别的自然能力、更便于观察分析与研究。

1.3.2 图像处理的任务

图像处理的任务是获取客观世界的景象并转化为数字图像后，进行增强复原重建变换编码压缩分割等处理，从而将一幅图像转化为另一幅具有新的意义的图像。具体任务在之后的章节中都会涉及，在此先有个印象.

1.3.3 数字图像处理的特点

(1).处理信息量很大。数字图像处理的信息大多是二维信息，处理信息量很大，因此对计算机的计算速度、存储容量要求较高。此处可联想到GPU，GPU就是图形处理器，我们经常采用GPU进行一些图形计算。

(2).占用频带较宽。与语言信息相比，数字图像处理占用的频带要大几个数量级。如电视图像的带宽约5.6MHz，而语音带宽仅为4kHz左右。所以在成像、传输、存储、处理、显示等各个环节的实现上，技术难度较大，成本亦高。

(3).无法复现全部信息。由于图像是三维景物的二维投影，一幅图象本身不具备复现三维景物的全部几何信息的能力，很显然三维景物背后部分信息在二维图像画面上是反映不出来的。因此，要分析和理解三维景物必须作合适的假定或附加新的测量，例如双目图像或多视点图像。在理解三维景物时需要知识导引，这也是人工智能中正在致力解决的知识工程问题。

1.4 数字图像处理的应用

图像是人类获取和交换信息的主要来源，因此，图像处理的应用领域必然涉及到人类生活和工作的方方面面。随着人类活动范围的不断扩大，图像处理的应用领域也将随之不断扩大。下面列出几种常见的应用。

(1).航天和航空方面。数字图像处理技术在航天和航空技术方面的应用，除了JPL对月球、火星照片的处理之外，另一方面的应用是在飞机遥感和卫星遥感技术中。例如资源调查，灾害检测，资源勘察，农业规划，城市规划等。举例如常见的航拍目标检测。

(2).生物医学工程方面。数字图像处理在生物医学工程方面的应用十分广泛，而且很有成效。除了常见的CT技术之外，还有一类是对医用显微图像的处理分析，如红细胞、白细胞分类，染色体分析，癌细胞识别等。此外，在X光肺部图像增晰、超声波图像处理、心电图分析、立体定向放射治疗等医学诊断方面都广泛地应用图像处理技术。

(3).军事、公安方面。在军事方面图像处理和识别主要用于导弹的精确末制导，各种侦察照片的判读，具有图像传输、存储和显示的军事自动化指挥系统，飞机、坦克和军舰模拟训练系统等；公安业务图片的判读分析，指纹识别，人脸识别，不完整图片的复原，以及交通监控、事故分析等。目前已投入运行的高速公路不停车自动收费系统中的车辆和车牌的自动识别都是图像处理技术成功应用的例子。

(4).机器人视觉。机器视觉作为智能机器人的重要感觉器官，主要进行三维景物理解和识别，是目前处于研究之中的开放课题。机器视觉主要用于军事侦察、危险环境的自主机器人，邮政、医院和家庭服务的智能机器人，装配线工件识别、定位，太空机器人的自动操作等。

推荐阅读

人工智能
图像标签与以图搜图技术的应用与实践

本文探讨了图像标签的多种分类场景及其在以图搜图技术中的应用，涵盖了从基础理论到实际项目实施的全面解析。 ... [详细]

蜡笔小新 2024-12-07 14:28:06
人工智能
尤洋：夸父AI系统——大规模并行训练的深度学习解决方案

自从AlexNet等模型在计算机视觉领域取得突破以来，深度学习技术迅速发展。近年来，随着BERT等大型模型的广泛应用，AI模型的规模持续扩大，对硬件提出了更高的要求。本文介绍了新加坡国立大学尤洋教授团队开发的夸父AI系统，旨在解决大规模模型训练中的并行计算挑战。 ... [详细]

蜡笔小新 2024-11-25 19:02:33
perl
Coursera ML 机器学习

2019独角兽企业重金招聘Python工程师标准线性回归算法计算过程CostFunction梯度下降算法多变量回归![选择特征](https:static.oschina.n ... [详细]

蜡笔小新 2024-12-22 16:09:09
perl
解决PyCharm中安装PyTorch深度学习d2l包的问题

本文详细介绍了如何在PyCharm中成功安装用于PyTorch深度学习的d2l包，包括环境配置、安装步骤及常见问题的解决方案。 ... [详细]

蜡笔小新 2024-12-19 14:19:22
perl
新手指南：在Windows 10上搭建深度学习与PyTorch开发环境

本文详细记录了一名新手在Windows 10操作系统上搭建深度学习环境的过程，包括安装必要的软件和配置环境变量等步骤，旨在帮助同样初入该领域的读者避免常见的错误。 ... [详细]

蜡笔小新 2024-12-17 03:14:23
web
2017年人工智能领域的十大里程碑事件回顾

随着2018年的临近，我们一同回顾过去一年中人工智能领域的重要进展。这一年，无论是政策层面的支持，还是技术上的突破，都显示了人工智能发展的迅猛势头。以下是精选的2017年人工智能领域最具影响力的事件。 ... [详细]

蜡笔小新 2024-12-16 17:59:16
web
浪潮AI服务器NF5488A5在MLPerf基准测试中刷新多项纪录

近日，国际权威AI基准测试平台MLPerf发布了最新的推理测试结果，浪潮AI服务器NF5488A5在此次测试中创造了18项性能纪录，显著提升了数据中心AI推理性能。 ... [详细]

蜡笔小新 2024-12-12 13:57:17
web
图像分类算法的优化策略与实践

本文探讨了《Bag of Tricks for Image Classification with Convolutional Neural Networks》论文中的多项技术，旨在通过具体实例和实验验证，提高卷积神经网络在图像分类任务中的性能。文章详细介绍了从模型训练加速、网络结构调整到训练参数优化等多个方面的改进方法。 ... [详细]

蜡笔小新 2024-12-09 16:01:40
web
吴恩达推出TensorFlow实践课程，Python基础即可入门，四个月掌握核心技能

量子位报道，deeplearning.ai最新发布了TensorFlow实践课程，适合希望使用TensorFlow开发AI应用的学习者。该课程涵盖机器学习模型构建、图像识别、自然语言处理及时间序列预测等多个方面。 ... [详细]

蜡笔小新 2024-12-08 17:26:10
web
强人工智能时代，区块链的角色与前景

随着强人工智能的崛起，区块链技术在新的技术生态中扮演着怎样的角色？本文探讨了区块链与强人工智能之间的互补关系及其在未来技术发展中的重要性。 ... [详细]

蜡笔小新 2024-12-07 14:46:21
web
京东AI创新之路：周伯文解析京东AI战略的独特之处

2018年4月15日，京东在北京举办了人工智能创新峰会，会上首次公开了京东AI的整体布局和发展方向。此次峰会不仅展示了京东在AI领域的最新成果，还标志着京东AI团队的首次集体亮相。本文将深入探讨京东AI的发展策略及其与BAT等公司的不同之处。 ... [详细]

蜡笔小新 2024-12-06 22:57:11
web
如何用GPU服务器运行Python

如何用GPU服务器运行Python-目录前言一、服务器登录1.1下载安装putty1.2putty远程登录 1.3查看GPU、显卡常用命令1.4Linux常用命令二、 ... [详细]

蜡笔小新 2024-12-06 11:54:09
web
TensorFlow 入门：MNIST 数据集实战

本文详细介绍了 TensorFlow 的入门实践，特别是使用 MNIST 数据集进行数字识别的项目。文章首先解析了项目文件结构，并解释了各部分的作用，随后逐步讲解了如何通过 TensorFlow 实现基本的神经网络模型。 ... [详细]

蜡笔小新 2024-12-05 13:06:15
web
机器学习核心概念与技术

本文系统梳理了机器学习的关键知识点，涵盖模型评估、正则化、线性模型、支持向量机、决策树及集成学习等内容，并深入探讨了各算法的原理和应用场景。 ... [详细]

蜡笔小新 2024-12-22 09:15:30
web
双路径GAN实现侧脸到正面人脸图像的高保真合成

由中科院自动化所、中科院大学及南昌大学联合研究提出了一种新颖的双路径生成对抗网络（TP-GAN），该技术能通过单一侧面照片生成逼真的正面人脸图像，显著提升了不同姿态下的人脸识别效果。 ... [详细]

蜡笔小新 2024-12-20 17:34:05