YUV像素格式转换

作者：gerardlong | 来源：互联网 | 2023-08-10 19:57

本文像素格式转换用到的库是FFmpeg的libswscale，将YUV像素格式数据转换成RGB像素格式数据。一、使用的相关函数说明：1、获取像素

本文像素格式转换用到的库是 FFmpeg 的 libswscale，将 YUV 像素格式数据转换成 RGB 像素格式数据。

一、使用的相关函数说明：

1、获取像素格式转换上下文函数：

struct SwsContext *sws_getContext(int srcW, int srcH, enum AVPixelFormat srcFormat, int dstW, int dstH, enum AVPixelFormat dstFormat, int flags, SwsFilter *srcFilter, SwsFilter *dstFilter, const double *param);

参数说明：

srcW, srcH, srcFormat：原始宽高和原始像素格式（我们这里原始像素格式是yuv420p）；
dstW, dstH, dstFormat：目标宽高和目标像素格式（我们这里原始像素格式是rgb24），不仅可以转换像素格式，也可以转换宽高；
flag：指定使用何种算法，例如快速线性、差值和矩阵等等，不同的算法性能也不同，快速线性算法性能相对较高。只针对尺寸的变换。

/* values for the flags, the stuff on the command line is different */ #define SWS_FAST_BILINEAR 1 #define SWS_BILINEAR 2 #define SWS_BICUBIC 4 #define SWS_X 8 #define SWS_POINT 0x10 #define SWS_AREA 0x20 #define SWS_BICUBLIN 0x40 #define SWS_GAUSS 0x80 #define SWS_SINC 0x100 #define SWS_LANCZOS 0x200 #define SWS_SPLINE 0x400

srcFilter, stFilter：这两个参数是做过滤器用的，可以传 nullptr；
param：和 flag 算法相关，也可以传 nullptr；

返回值：成功返回转换格式上下文指针，失败返回 NULL；

注意：使用完格式转换上下文最后不要忘记调用函数 void sws_freeContext(struct SwsContext *swsContext) 释放上下文；有人可能会有疑问，调用的是 sws_getContext 函数，函数名里并没有 create 或者 alloc 字眼，也需要释放吗？我们可以参考一下源码：

发现源码当中调用了 sws_alloc_set_opts，所以最后是需要释放上下文的。我们也可以使用以下函数来创建上下文：

struct SwsContext *sws_alloc_context(void); int av_opt_set(void *obj, const char *name, const char *val, int search_flags);

2、转换函数：

int sws_scale(struct SwsContext *c, const uint8_t *const srcSlice[], const int srcStride[], int srcSliceY, int srcSliceH, uint8_t *const dst[], const int dstStride[]);

参数说明：

struct SwsContext *c：像素格式转换上下文；
const uint8_t *const srcSlice[]：输入的数据，silice可以理解为一帧；
const int srcStride[]：输入数据的每一个平面的每一行的大小（linesize），而不是每一个平面的总大小；
int srcSliceY：从哪个位置开始处理，直接传0即可；
int srcSliceH：图像的高度；
uint8_t *const dst[]：输出的数据；
const int dstStride[]：输出数据的每一个平面的每一行的大小；

注意：sws_scale 函数不会为传入的输入数据和输出数据创建堆空间

3、创建输入输出缓冲区：

#include int av_image_alloc(uint8_t *pointers[4], int linesizes[4], int w, int h, enum AVPixelFormat pix_fmt, int align);

参数说明：

(uint8_t *pointers[4]：缓冲区数组（除了 Y、U 和 V 三个分量，可能会有透明度分量，所以数组 size 为 4）；
int linesizes[4]：每个平面的每一行的大小数组；
int w, int h, enum AVPixelFormat pix_fmt：图片的宽、高和像素格式；
int align：是否对齐，一般传1；

创建的缓冲区数组指向堆空间，最后我们需要使用函数 av_pfree 释放它；不确定缓冲区是否需要释放的话，可以参考函数注释或者源码；源码内部是有调用 av_malloc 函数的，所以需要我们去释放。

二、示例代码：

示例代码中 inData 输入缓冲区分成了四块，每一块指向一个分量，为了兼容透明分量，指针数组size为4，以YUV420P为例，inData的第1个元素指向 Y 分量，第2个元素指向 U 分量，第3个元素指向 V 分量，一帧的 YUV 数据是连续的，如图：

在音频中没有行的概念 linesize 就是一个平面的大小，但是在视频中是有行的概念的，inStrides中存储的是一帧数据每一行中 Y、U 和 V 分量的长度，以 YUV420P 为例，Y 的长度是一帧的宽度，U 的长度是一帧的宽度的一半，V 的长度也是一帧的宽度的一半。outData 和 outStrides 是同样的道理。

#include "ffmpegutils.h" #include #include extern "C" { #include #include #include } FFmpegUtils::FFmpegUtils() { } //void FFmpegUtils::convretRawVideo(RawVideoFile &in, RawVideoFile &out) void FFmpegUtils::convretRawVideo(RawVideoFrame &in, RawVideoFrame &out) { int ret = 0; // 转换格式上下文 SwsContext *ctx = nullptr; // 输入输出缓冲区 // inData 和 outData 指向一帧的数据 uint8_t *inData[4], *outData[4]; // 每个平面一行的大小 int inStrides[4], outStrides[4]; // 每一帧图片的大小 int inFrameSize, outFrameSize; /* QFile inFile(in.filename); QFile outFile(out.filename); */ ret = av_image_alloc(inData, inStrides, in.width, in.height, in.format, 1); if (ret

推荐阅读

const
在 QQmlPropertyMap 的派生类中无法调用槽函数或 Q_INVOKABLE 方法？

在尝试对 QQmlPropertyMap 类进行测试驱动开发时，发现其派生类中无法正常调用槽函数或 Q_INVOKABLE 方法。这可能是由于 QQmlPropertyMap 的内部实现机制导致的，需要进一步研究以找到解决方案。 ... [详细]

蜡笔小新 2024-11-11 15:34:22
const
单片微机原理P3：80C51外部拓展系统

　　外部拓展其实是个相对来说很好玩的章节，可以真正开始用单片机写程序了，比较重要的是外部存储器拓展，81C55拓展，矩阵键盘，动态显示，DAC和ADC。0.IO接口电路概念与存 ... [详细]

蜡笔小新 2024-11-12 19:51:29
const
洛谷 P1531 我讨厌它 —— 线段树实现

本文介绍如何使用线段树解决洛谷 P1531 我讨厌它问题，重点在于单点更新和区间查询最大值。 ... [详细]

蜡笔小新 2024-11-12 21:27:38
export
c/c++常用代码doc,ppt,xls文件格式转PDF格式[转]

[转]doc,ppt,xls文件格式转PDF格式http:blog.csdn.netlee353086articledetails7920355确实好用。需要注意的是#import ... [详细]

蜡笔小新 2024-11-12 16:19:40
export
Unity中简易广告牌着色器的实现

本文详细介绍了如何在Unity中实现一个简单的广告牌着色器，帮助开发者更好地理解和应用这一技术。 ... [详细]

蜡笔小新 2024-11-12 14:50:43
copy
PHP 对象生命周期与内存管理

本文详细介绍了 PHP 中对象的生命周期、内存管理和魔术方法的使用，包括对象的自动销毁、析构函数的作用以及各种魔术方法的具体应用场景。 ... [详细]

蜡笔小新 2024-11-12 13:35:26
split
开发日志：高效图片压缩与上传技术解析

开发日志：高效图片压缩与上传技术解析 ... [详细]

蜡笔小新 2024-11-11 19:33:51
const
[BZOJ2654] Tree 问题：二分查找与 Kruskal 算法结合的优化解决方案

题目《BZOJ2654: Tree》的时间限制为30秒，内存限制为512MB。该问题通过结合二分查找和Kruskal算法，提供了一种高效的优化解决方案。具体而言，利用二分查找缩小解的范围，再通过Kruskal算法构建最小生成树，从而在复杂度上实现了显著的优化。此方法不仅提高了算法的效率，还确保了在大规模数据集上的稳定性能。 ... [详细]

蜡笔小新 2024-11-11 18:19:28
default
2.2 组件间父子通信机制详解

2.2 组件间父子通信机制详解 ... [详细]

蜡笔小新 2024-11-11 14:58:09
default
利用栈实现四则运算表达式的高效求值方法

本文提出了一种基于栈结构的高效四则运算表达式求值方法。该方法能够处理包含加、减、乘、除运算符以及十进制整数和小括号的算术表达式。通过定义和实现栈的基本操作，如入栈、出栈和判空等，算法能够准确地解析并计算输入的表达式，最终输出其计算结果。此方法不仅提高了计算效率，还增强了对复杂表达式的处理能力。 ... [详细]

蜡笔小新 2024-11-11 14:00:53
utf-8
网站访问全流程解析

本文详细介绍了从用户在浏览器中输入一个域名（如www.yy.com）到页面完全展示的整个过程，包括DNS解析、TCP连接、请求响应等多个步骤。 ... [详细]

蜡笔小新 2024-11-12 18:13:16
java
字节流(InputStream和OutputStream)，字节流读写文件，字节流的缓冲区，字节缓冲流

字节流抽象类InputStream和OutputStream是字节流的顶级父类所有的字节输入流都继承自InputStream，所有的输出流都继承子OutputStreamInput ... [详细]

蜡笔小新 2024-11-12 14:07:25
copy
开机自启动的几种方式

0x01快速自启动目录快速启动目录自启动方式源于Windows中的一个目录，这个目录一般叫启动或者Startup。位于该目录下的PE文件会在开机后进行自启动 ... [详细]

蜡笔小新 2024-11-12 11:16:30
copy
详解 Qt 串口通信程序全程图文（4）

Qt串口通信程序全程图文是本文介绍的内容，本文一开始先讲解对程序的改进，在文章最后将要讲解一些重要问题。1、在窗口中加入一些组合框ComboBox&# ... [详细]

蜡笔小新 2024-11-12 00:05:00
const
Codeforces竞赛解析：Educational Round 84（Div. 2评级），题目A：奇数和问题

Codeforces竞赛解析：Educational Round 84（Div. 2评级），题目A：奇数和问题 ... [详细]

蜡笔小新 2024-11-11 14:02:18

gerardlong

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章