热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

十四、变换编码:1、矩阵运算、正交变换、离散余弦变换基本概念

一、矩阵(Matrix)矩阵的定义由m*n个数字按照m行、n列排列成的数表称为矩阵如变换系数的基本单位即为4*4的矩阵矩阵在多个领域中起重要作用多媒体

一、矩阵(Matrix)


  • 矩阵的定义
    • 由m * n个数字按照m行、n列排列成的数表称为矩阵
    • 如变换系数的基本单位即为4 * 4的矩阵
  • 矩阵在多个领域中起重要作用
    • 多媒体信息处理
    • 机器学习/人工智能等

二、矩阵的运算


  • 矩阵可以参加运算
    • 同型矩阵可以进行加减运算:(同型:行列相等,相同位置进行加减
    • 矩阵可以与数相乘
    • 满足相应条件的矩阵可以进行相乘运算
  • 矩阵与向量
    • 只有一行或一列的矩阵又称向量
    • 行向量或列向量:一般我们使用的是列向量
      在这里插入图片描述
  • 矩阵的线性乘法:
    • 矩阵与矩阵相乘会略显复杂,需要满足必要条件,即矩阵1的宽必须等于矩阵2的高方可相乘。乘积矩阵的高和宽分别为矩阵1的高和矩阵2的宽,如下图表示:
      在这里插入图片描述

三、向量和矩阵的线性变换

向量的线性变换定义为:向量y的每一个元素都是向量x中元素的线性组合,则y是x的线性变换。假设有向量[x1, x2, x3]和向量[y1, y2, y3],两个向量满足以下关系:

y1 = a11 * x1 + a12 * x2 + a13 * x3
y2 = a21 * x1 + a22 * x2 + a23 * x3
y3 = a31 * x1 + a32 * x2 + a33 * x3

那么我们称向量[y1, y2, y3]可以被向量[x1, x2, x3]线性表示,以公式形式则表示为y=A·x。其含义可表示为矩阵与向量相乘:
在这里插入图片描述
矩阵A即为该线性变换的矩阵。

将向量的变换推广,矩阵可以视为由向量构成,因此线性线性变换同样适用于矩阵的变换:
在这里插入图片描述


四、向量的正交性


  • 向量的内积
    • 即两个向量对应元素成绩的总和(向量需是相同长度)
    • 例:(1 2)*(3 4)=1 * 3 + 2 * 4=11
      在这里插入图片描述
  • 而向量的正交,等价于两个向量的内积为0。即:
    在这里插入图片描述
  • 正交向量,两个向量是垂直的

五、正交矩阵和正交向量

由于矩阵可视为由多个列向量构成,那么多个两两正交的向量可以构成正交矩阵。一个矩阵是正交矩阵需要满足的条件有:


  • 行数和列数相等,即正交矩阵都为方阵;
  • 每一个列向量均为单位向量,即长度均为1;
  • 各列向量两两正交;
  • 例:
    在这里插入图片描述

前面提到,每一个矩阵都可以与一个线性变换对应。那么如果一个线性变换对应的变换矩阵是正交矩阵,那么该变换就是一个正交变换。正交变换的显著特点之一是,向量经过正交变换后长度不会发生变化。


六、离散余弦变换


  • 离散余弦变换 (Discrete Cosine Transform, DCT)类似于一种实数类型的离散傅里叶变换(DFT)

  • 对于图像数据,DCT具有很好的能量集中特性,通常主要能量部分集中于低频部分

  • 一维数据的离散余弦变换表示为:
    在这里插入图片描述

  • 一维离散余弦逆变换为:
    在这里插入图片描述

  • 由于DCT具有类似于DFT的特性,DCT也可以实现如信息能量集中的功能。对于图像数据,DCT可以有效将大部分的能量集中与直流和低频部分,这也成为视频压缩中变换编码的理论基础之一。

  • 离散余弦变换的应用场景:

  • 视频:MPEG-1/MPEG-2;

  • 图像:JPEG

在H.264及更新的视频压缩标准中,采用的是DCT的优化改进版——整数变换。相对于浮点类型的离散余弦变换,整数变换有效降低了变换操作的运算复杂度,提升了编解码器的运行效率。
在这里插入图片描述
越亮的部分能量越集中,而越暗的部分通常表示的信息越少


七、图像的空间域与频率域


  • 图像的空间域表示
    • 在空间域,图像表示为连续紧密排列的像素点
    • 每个像素点的地位相同;某些像素点的缺失表现为图像在空间上的不完整;
  • 图像的频率域表示
    • 在频率域,图像表示为信息在不同频率上的分量值
    • 每个频率分量的地位不同,低频分量通常对视觉效果影响更大(低频缺失图像面目全非,高频缺失只是边缘不清晰,所以为了提升图像的压缩比可以允许信息在比较高频的分量有一定的损失,对整体的观看效果影响不会很大)

八、书籍推荐

在这里插入图片描述


推荐阅读
  • 毕业设计:基于机器学习与深度学习的垃圾邮件(短信)分类算法实现
    本文详细介绍了如何使用机器学习和深度学习技术对垃圾邮件和短信进行分类。内容涵盖从数据集介绍、预处理、特征提取到模型训练与评估的完整流程,并提供了具体的代码示例和实验结果。 ... [详细]
  • 华为智慧屏:超越屏幕尺寸的智能进化
    继全球发布后,华为智慧屏于9月26日在上海正式亮相,推出65英寸和75英寸版本。该产品不仅在屏幕尺寸上有所突破,更在性能和智能化方面实现了显著提升。 ... [详细]
  • Python中HOG图像特征提取与应用
    本文介绍如何在Python中使用HOG(Histogram of Oriented Gradients)算法进行图像特征提取,探讨其在目标检测中的应用,并详细解释实现步骤。 ... [详细]
  • Python 工具推荐 | PyHubWeekly 第二十一期:提升命令行体验的五大工具
    本期 PyHubWeekly 为大家精选了 GitHub 上五个优秀的 Python 工具,涵盖金融数据可视化、终端美化、国际化支持、图像增强和远程 Shell 环境配置。欢迎关注并参与项目。 ... [详细]
  • 本文旨在探讨如何利用决策树算法实现对男女性别的分类。通过引入信息熵和信息增益的概念,结合具体的数据集,详细介绍了决策树的构建过程,并展示了其在实际应用中的效果。 ... [详细]
  • 2017年苹果全球开发者大会即将开幕,预计iOS将迎来重大更新,同时Siri智能音箱有望首次亮相,AI技术成为大会焦点。 ... [详细]
  • 全能终端工具推荐:高效、免费、易用
    介绍一款备受好评的全能型终端工具——MobaXterm,它不仅功能强大,而且完全免费,适合各类用户使用。 ... [详细]
  • 2017年人工智能领域的十大里程碑事件回顾
    随着2018年的临近,我们一同回顾过去一年中人工智能领域的重要进展。这一年,无论是政策层面的支持,还是技术上的突破,都显示了人工智能发展的迅猛势头。以下是精选的2017年人工智能领域最具影响力的事件。 ... [详细]
  • 智慧城市建设现状及未来趋势
    随着新基建政策的推进及‘十四五’规划的实施,我国正步入以5G、人工智能等先进技术引领的智慧经济新时代。规划强调加速数字化转型,促进数字政府建设,新基建政策亦倡导城市基础设施的全面数字化。本文探讨了智慧城市的发展背景、全球及国内进展、市场规模、架构设计,以及百度、阿里、腾讯、华为等领军企业在该领域的布局策略。 ... [详细]
  • 随着技术的发展,黑客开始利用AI技术在暗网中创建用户的‘数字孪生’,这一现象引起了安全专家的高度关注。 ... [详细]
  • 本文介绍了如何利用GDAL库在C#中创建一个带有地理参考信息的GeoTIFF文件,包括定义地理变换参数和坐标系统等关键步骤。 ... [详细]
  • 帝国CMS多图上传插件详解及使用指南
    本文介绍了一款用于帝国CMS的多图上传插件,该插件通过Flash技术实现批量图片上传功能,显著提升了多图上传效率。文章详细说明了插件的安装、配置和使用方法。 ... [详细]
  • Win11扩展卷无法使用?解决扩展卷灰色问题的指南
    本文详细介绍了在Windows 11中遇到扩展卷灰色无法使用时的解决方案,帮助用户快速恢复磁盘扩展功能。 ... [详细]
  • 本文由蕤内撰写,明亮公司出品,探讨了日本零售业在数字化转型中的现状与挑战。文章基于与两位在日本的投资人的深入对话,分析了日本零售业为何仍然依赖传统的POS机系统,以及中日两国在品牌建设和数字化营销上的差异。 ... [详细]
  • HTML5实现逼真树叶飘落动画详解
    本文详细介绍了如何利用HTML5技术创建一个逼真的树叶飘落动画,包括HTML、CSS和JavaScript的代码实现及优化技巧。 ... [详细]
author-avatar
白开水
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有