libav制作视频

2019独角兽企业重金招聘Python工程师标准>>>

https://github.com/shaobin0604/ffmpeg_tutorial

https://github.com/mpenkov/ffmpeg-tutorial

http://dranger.com/ffmpeg/

http://en.wikipedia.org/wiki/YUV

http://en.wikipedia.org/wiki/.mpg

代码&＃xff1a;

git clone git&＃64;github.com:liyonghelpme2/libavTest.git

libav 是一系列编码解码音频图像视频的库。

ubuntu 上 apt-get source libav 得到源码。

基本模块包含&＃xff1a; libavcodec libavformat libavutil libavdevice 等。

安装好这些模块之后&＃xff0c; 在 /usr/share/doc/libavcodec-dev/ 文件夹下有一个例子&＃xff0c;

在源代码文件夹中有一个avplay.c 的例子&＃xff0c;

参考这两个例子以及一些tutorials 和源代码&＃xff0c;写一个将 RGB 值转化成视频程序。

主要参考 /usr/share/doc/libavcodec-dev/ 下的例子&＃xff1a;

在其中有一个 video_encode_example 的函数&＃xff0c; 该函数将程序生成的一段数据构造一个视频&＃xff0c; 可以将该函数拷到新文件中&＃xff0c; 同时写一个main函数&＃xff0c;

在main函数中首先注册所有的 codec 解码编码器&＃xff0c; 接着调用video_encode_example 函数生成一个mpg 视频。

#include

av_register_all();

video_encode_example();

gcc xxx.c -lavcodec -lavformat

这个程序使用MPEG1VIDEO 编码解码器将 YUV 空间的帧转化成一个MPEG1 标准的视频&＃xff0c; YUV 和熟悉的RGB 颜色空间之间通过一个矩阵进行转化&＃xff0c; 关于YUV 参考http://en.wikipedia.org/wiki/YUV

一个MPEG文件可能包含多个流stream 音频&＃xff0c; 视频&＃xff0c; 字幕等。每个流包含多个帧frame&＃xff0c;有关键帧&＃xff0c;向后预测帧向前预测帧等。参考MPEG http://en.wikipedia.org/wiki/.mpg

将程序中生成的一帧帧图像压入视频中基本过程&＃xff1a;

分配编码解码器&＃xff1a;

分配codec 编码解码器分配codec的上下文&＃xff08;编码解码的过程是一个执行状态机的过程&＃xff0c;上下文中会保存当前编码解码的状态&＃xff09;AVCodec AVCodecContext

avcodec_alloc_context3

设定上下文中的格式信息&＃xff0c;包括视频的宽度高度&＃xff0c; bitrate, 帧率&＃xff0c;每帧的像素格式等&＃xff1b;

设定好上下文之后&＃xff0c;可以在该上下文环境下&＃xff0c;打开编码解码器&＃xff0c;开始编码解码工作&＃xff1b;avcodec_open

接着逐帧生成视频&＃xff1a;

分配帧结构和帧数据缓冲区用于放每一帧的YUV数据 AVFrame avcodec_alloc_frame picture_buf &＃61; malloc()

分配输出video 文件的缓冲区&＃xff0c;out_buf &＃61; malloc(), 这个buffer 需要足够空间用于容纳一帧 outbuf_size 缓冲的大小

生成 40帧&＃xff1a;每一帧压入视频中avcodec_encode_video, 接者将生成的数据写入到文件中&＃xff0c; 循环压入下一帧。mpeg格式中多个帧之间是存在一定关系的&＃xff0c;因此压入某一帧生成的数据量是不一定的&＃xff0c;但是当前生成的数据是独立的&＃xff0c;可以写入文件中。&＃xff08;个人理解&＃xff09;

生成每一帧的YUV&＃xff0c;对于RGB值比较好理解&＃xff0c;例如要生成红色的就是255 0 0 需要转化成对应的 YUV值&＃xff0c; 在 libavutil 的colorspace头文件中有 RGB_TO_Y_CCIR 等函数用于转化代码用于从RGB 空间转化到 YUV空间。

其中YUV 空间的 Y 空间宽度高度是屏幕宽度高度&＃xff0c;而UV 空间每个点的值是2*2矩阵点的平均值&＃xff0c;因此数据宽度&＃xff0c;高度只有Y的1半。而这3个通道的数据是放在3个不同的plane中的&＃xff0c;可以参考avpicture_fill 函数的实现&＃xff0c;这个函数实现了&＃xff0c;设置每种类型图片buffer的填充。

在pixdesc.c 文件中的AVPixFmtDescriptor 中描述了每种帧格式缓冲区数据的放置方法&＃xff0c;主要结构是AVPixFmtDescriptor

可以参考上方代码&＃xff0c;制作显示红绿蓝条的视频