当前位置: 开发笔记 > 编程语言 > 正文

【FFmpeg(2016)】SwrContext重采样结构体

作者：mobiledu2502856097 | 来源：互联网 | 2023-07-02 20:41

【前言】在看这篇文章前，我推荐你先看看我的另外两篇文章：【FFmpeg(2016)】视频文件分离器(demuxing)——H264&PCM【FFmpeg

【前言】

在看这篇文章前，我推荐你先看看我的另外两篇文章：

【FFmpeg(2016)】视频文件分离器(demuxing)——H264&PCM

【FFmpeg(2016)】PCM编码AAC

本文章主要介绍SwrContext的用处和使用方法，到底什么是重采样，为什么需要重采样，希望你耐心看完。

重采样，也就是对已得到的数据进行重新的采样；比如，原先的PCM音频数据是2 个声道，44100采样率，32bit 单精度型(sample format采样格式)。

那么通过重采样，我们改变它的声道数、采样率和采样格式。

对于改变声道数和采样率，在这里不着重探讨，主要理解 sample format.

【FFmpeg数据结构】

官方对sample format进行了定义，如下：

enum AVSampleFormat {
    AV_SAMPLE_FMT_NOnE= -1,
    AV_SAMPLE_FMT_U8,          /// 
 
 枚举类型带P的代表非平面类型，带P的代表平面类型。 
  
 
 
 【FFmpeg平面的概念】 
 
 
 所谓平面与非平面是针对在编解码的时候，数据存储的方式来判定的，那怎么判断呢？ 
 
 
 比如，我有一个PCM文件是这样的(L代表左声道，R代表右声道)： 
 L(一个采样点)R(一个采样点)LRLRLRLRLRLRLRLR........................................ 
 注意，是一个采样点，如果音频sample format 是AV_SAMPLE_FMT_FLT,那就说明一个采样点是32位。 
 
 
 我用ffplay播放这个音频时： 
 
 
 
 
 图.1 
 
 
 -f f32le 代表这个文件sample format 是32bit 的，也就是AV_SAMPLE_FMT_FLT， 
 -ar 是采样率 
 -ac 是声道数 
 
 
 上面说到我这个PCM文件，对于FFmpeg来说，是AV_SAMPLE_FMT_FLT格式的，它的存储方式就是： 
 L(一个采样点)R(一个采样点)LRLRLRLRLRLRLRLR........................................
 
 也就是说，对于FFmpeg来说，这个PCM文件是非平面的。 
 
 
 
 
 【planar“平面”概念】 
 
 
 我以我这篇文章的代码为例： 
 【FFmpeg(2016)】PCM编码AAC
 
 
 
 如果我直接： 
  
 FILE *fp = fopen("a.pcm", "rb");
fread(....);
 
 
 
  
 从L(一个采样点)R(一个采样点)LRLRLRLRLRLRLRLR.....................格式的PCM文件读取一帧，那么AVFrame结构体的data成员状态如下：data是存储着准备要被编码的音频数据,data是一个二维指针 
 
 
 图.2 
 如果直接对这样的data数组进行AAC编码，你会发现得到的AAC文件播放完成变声了，还很嚓。 
 到底是什么问题？ 
 这就涉及到planar的概念了 
 自FFmpeg提及平面概念后，要求的就是每个data指针指向各自声道的数据，也就说，要这样： 
 
 
 图. 3 
 此时，就是所谓的平面，二维数组的第一维存储了左声道，第二维存储了右声道。 
 如果对这样的data进行AAC编码，那么得到的数据就是正确的。 
 这里还有另外一个问题，data里的一个一维数组应该多长，这就要看AVCodecContext的成员frame_size，它代表每读取一帧时读取的采样个数，默认是1024.这种情况下，进行AAC编码前的数据存储情况应该是： 
 
 
 
 
 图 .4 
 
 
 
 
 【代码】使用SwrContext，输入文件为L(一个采样点)R(一个采样点)LRLRLRLRLRLRLRLR.....................格式的PCM文件 
 思想是：读入PCM时，data情况是图.2，此时使用SwrContext将其转换成图.4, 然后在进行AAC编码 (注意，图2总共也是8192字节) 
  
 extern "C"
{
#include "libavformat/avformat.h"
#include "libavutil/avutil.h"
#include "libavcodec/avcodec.h"
#include "libswresample/swresample.h"
#include "libavutil/frame.h"
#include "libavutil/samplefmt.h"
#include "libavformat/avformat.h"
#include "libavcodec/avcodec.h"
}

#pragma comment(lib, "avcodec.lib")
#pragma comment(lib, "avdevice.lib")
#pragma comment(lib, "avformat.lib")
#pragma comment(lib, "avutil.lib")
#pragma comment(lib, "swscale.lib")
#pragma comment(lib, "swresample.lib")


/* PCM转AAC */
int main()
{
	/* ADTS头 */
	char *padts = (char *)malloc(sizeof(char) * 7);
	int profile = 2;	//AAC LC
	int freqIdx = 4;  //44.1KHz
	int chanCfg = 2;  //MPEG-4 Audio Channel Configuration. 1 Channel front-center,channel_layout.h
	padts[0] = (char)0xFF; // 11111111     = syncword
	padts[1] = (char)0xF1; // 1111 1 00 1  = syncword MPEG-2 Layer CRC
	padts[2] = (char)(((profile - 1) <<6) + (freqIdx <<2) + (chanCfg >> 2));
	padts[6] = (char)0xFC;

	SwrContext *swr_ctx = NULL;
	AVCodecContext *pCodecCtx = NULL;
	AVCodec *pCodec = NULL;
	AVFrame *pFrame;
	AVPacket pkt;
	AVCodecID codec_id = AV_CODEC_ID_AAC;

	FILE *fp_in;
	FILE *fp_out;
	char filename_in[] = "audio.pcm";
	char filename_out[] = "audio.aac";

	uint8_t **convert_data;			//存储转换后的数据，再编码AAC
	int i, ret, got_output;
	uint8_t* frame_buf;
	int size = 0;
	int y_size;
	int framecnt = 0;
	int framenum = 100000;


	avcodec_register_all();

	pCodec = avcodec_find_encoder(codec_id);
	if (!pCodec) {
		printf("Codec not found\n");
		return -1;
	}

	pCodecCtx = avcodec_alloc_context3(pCodec);
	if (!pCodecCtx) {
		printf("Could not allocate video codec context\n");
		return -1;
	}

	pCodecCtx->codec_id = codec_id;
	pCodecCtx->codec_type = AVMEDIA_TYPE_AUDIO;
	pCodecCtx->sample_fmt = AV_SAMPLE_FMT_FLTP;
	pCodecCtx->sample_rate = 44100;
	pCodecCtx->channel_layout = AV_CH_LAYOUT_STEREO;
	pCodecCtx->channels = av_get_channel_layout_nb_channels(pCodecCtx->channel_layout);



	qDebug() <<"pCodecCtx->bit_rate ----------------> " <bit_rate;
	qDebug() <<"pCodecCtx->bit_rate ----------------> " <bit_rate;
	qDebug() <channel_layout);


	if ((ret = avcodec_open2(pCodecCtx, pCodec, NULL)) <0) {
		qDebug() <<"avcodec_open2 error ----> " <nb_samples = pCodecCtx->frame_size;	//1024
	pFrame->format = pCodecCtx->sample_fmt;
	pFrame->channels = 2;
	qDebug() <<"frame_size(set pFrame->nb_samples) -------------> " <frame_size;


	/* 由AV_SAMPLE_FMT_FLT转为AV_SAMPLE_FMT_FLTP */
	swr_ctx = swr_alloc_set_opts(
		NULL,
		av_get_default_channel_layout(pCodecCtx->channels),
		pCodecCtx->sample_fmt,				    //在编码前，我希望的采样格式
		pCodecCtx->sample_rate,
		av_get_default_channel_layout(pCodecCtx->channels),
		AV_SAMPLE_FMT_FLT,					    //PCM源文件的采样格式
		pCodecCtx->sample_rate,
		0, NULL);

	swr_init(swr_ctx);
	/* 分配空间 */
	convert_data = (uint8_t**)calloc(pCodecCtx->channels,
		sizeof(*convert_data));
	av_samples_alloc(convert_data, NULL,
		pCodecCtx->channels, pCodecCtx->frame_size,
		pCodecCtx->sample_fmt, 0);



	size = av_samples_get_buffer_size(NULL, pCodecCtx->channels, pCodecCtx->frame_size, pCodecCtx->sample_fmt, 0);
	
	frame_buf = (uint8_t *)av_malloc(size);
	/* 此时data[0],data[1]分别指向frame_buf数组起始、中间地址 */
	ret = avcodec_fill_audio_frame(pFrame, pCodecCtx->channels, pCodecCtx->sample_fmt, (const uint8_t*)frame_buf, size, 0);
	
	if (ret <0)
	{
		qDebug() <<"avcodec_fill_audio_frame error ";
		return 0;
	}

	//Input raw data
	fp_in = fopen(filename_in, "rb");
	if (!fp_in) {
		printf("Could not open %s\n", filename_in);
		return -1;
	}

	//Output bitstream
	fp_out = fopen(filename_out, "wb");
	if (!fp_out) {
		printf("Could not open %s\n", filename_out);
		return -1;
	}

	//Encode
	for (i = 0; i frame_size,
			(const uint8_t**)pFrame->data, pCodecCtx->frame_size);

		/* 将转换后的数据复制给pFrame */
		int length = pCodecCtx->frame_size * av_get_bytes_per_sample(pCodecCtx->sample_fmt);
		for (int k = 0; k <2; ++k)
		for (int j = 0; j data[k][j] = convert_data[k][j];
		}

		pFrame->pts = i;

		qDebug() <<"frame->nb_samples -----> " <nb_samples;
		qDebug() <<"size ------------------> " <linesize[0] ----> " <linesize[0];



		ret = avcodec_encode_audio2(pCodecCtx, &pkt, pFrame, &got_output);

		if (ret <0) {
			qDebug() <<"error encoding";
			return -1;
		}

		if (pkt.data == NULL)
		{
			av_free_packet(&pkt);
			continue;
		}

		qDebug() <<"got_ouput = " < 11));
			padts[4] = (char)(((7 + pkt.size) & 0x7FF) >> 3);
			padts[5] = (char)((((7 + pkt.size) & 7) <<5) + 0x1F);
			fwrite(padts, 7, 1, fp_out);
			fwrite(pkt.data, 1, pkt.size, fp_out);

			av_free_packet(&pkt);
		}
	}
	//Flush Encoder
	for (got_output = 1; got_output; i++) {
		ret = avcodec_encode_audio2(pCodecCtx, &pkt, NULL, &got_output);
		if (ret <0) {
			printf("Error encoding frame\n");
			return -1;
		}
		if (got_output) {
			printf("Flush Encoder: Succeed to encode 1 frame!\tsize:%5d\n", pkt.size);
			padts[3] = (char)(((chanCfg & 3) <<6) + ((7 + pkt.size) >> 11));
			padts[4] = (char)(((7 + pkt.size) & 0x7FF) >> 3);
			padts[5] = (char)((((7 + pkt.size) & 7) <<5) + 0x1F);

			fwrite(padts, 7, 1, fp_out);
			fwrite(pkt.data, 1, pkt.size, fp_out);
			av_free_packet(&pkt);
		}
	}

	fclose(fp_out);
	avcodec_close(pCodecCtx);
	av_free(pCodecCtx);
	av_freep(&pFrame->data[0]);
	av_frame_free(&pFrame);

	av_freep(&convert_data[0]);	
	free(convert_data);			
	//////////////////////////////////////////////////////////////////////////////////

	return 0;
}
 
 
 
 
 
  
 上面swr_convert函数执行后，convert_data情况是图.4 
 
 
 AVFrame情况是图.2，所以接下来我将convert_data直接复制给data。 
 
 
 此时编码出来的AAC就是正确的了。

推荐阅读

get
FFMpeg学习进阶：音频处理基础理论与重采样技术详解

在Android平台中，播放音频的采样率通常固定为44.1kHz，而录音的采样率则固定为8kHz。为了确保音频设备的正常工作，底层驱动必须预先设定这些固定的采样率。当上层应用提供的采样率与这些预设值不匹配时，需要通过重采样（resample）技术来调整采样率，以保证音频数据的正确处理和传输。本文将详细探讨FFMpeg在音频处理中的基础理论及重采样技术的应用。 ... [详细]

蜡笔小新 2024-11-09 13:46:55
join
使用Python爬取妙笔阁小说信息并保存为TXT和CSV格式

本文介绍了如何使用Python爬取妙笔阁小说网仙侠系列中所有小说的信息，并将其保存为TXT和CSV格式。主要内容包括如何构造请求头以避免被网站封禁，以及如何利用XPath解析HTML并提取所需信息。 ... [详细]

蜡笔小新 2024-11-14 19:54:58
join
Spark 弹性分布式数据集详解

本文详细介绍了 Spark 中的弹性分布式数据集（RDD）及其常见的操作方法，包括 union、intersection、cartesian、subtract、join、cogroup 等转换操作，以及 count、collect、reduce、take、foreach、first、saveAsTextFile 等行动操作。 ... [详细]

蜡笔小新 2024-11-14 15:44:57
join
Python基础：使用NLTK和Python构建机器学习应用

本文节选自《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书的第1章第1.2节，作者Nitin Hardeniya。本文将带领读者快速了解Python的基础知识，为后续的机器学习应用打下坚实的基础。 ... [详细]

蜡笔小新 2024-11-13 21:23:34
get
HDFS API

Hadoop的文件操作位于包org.apache.hadoop.fs里面，能够进行新建、删除、修改等操作。比较重要的几个类：(1)Configurati ... [详细]

蜡笔小新 2024-11-13 17:31:50
bit
详解 Qt 串口通信程序全程图文（4）

Qt串口通信程序全程图文是本文介绍的内容，本文一开始先讲解对程序的改进，在文章最后将要讲解一些重要问题。1、在窗口中加入一些组合框ComboBox&# ... [详细]

蜡笔小新 2024-11-12 00:05:00
get
Cocos2d-x学习笔记：基础概念解析与内存管理机制深入探讨

在《Cocos2d-x学习笔记：基础概念解析与内存管理机制深入探讨》中，详细介绍了Cocos2d-x的基础概念，并深入分析了其内存管理机制。特别是针对Boost库引入的智能指针管理方法进行了详细的讲解，例如在处理鱼的运动过程中，可以通过编写自定义函数来动态计算角度变化，利用CallFunc回调机制实现高效的游戏逻辑控制。此外，文章还探讨了如何通过智能指针优化资源管理和避免内存泄漏，为开发者提供了实用的编程技巧和最佳实践。 ... [详细]

蜡笔小新 2024-11-11 14:49:31
python
您的数据库配置是否安全？DBSAT工具助您一臂之力！

本文探讨了Oracle提供的免费工具DBSAT，该工具能够有效协助用户检测和优化数据库配置的安全性。通过全面的分析和报告，DBSAT帮助用户识别潜在的安全漏洞，并提供针对性的改进建议，确保数据库系统的稳定性和安全性。 ... [详细]

蜡笔小新 2024-11-11 14:44:47
web
WordPress Duplicator 0.4.4 版本存在跨站脚本攻击漏洞分析

在对WordPress Duplicator插件0.4.4版本的安全评估中，发现其存在跨站脚本（XSS）攻击漏洞。此漏洞可能被利用进行恶意操作，建议用户及时更新至最新版本以确保系统安全。测试方法仅限于安全研究和教学目的，使用时需自行承担风险。漏洞编号：HTB23162。 ... [详细]

蜡笔小新 2024-11-10 13:16:43
get
Linux网络配置详解：Firewalld与Netfilter机制解析及iptables应用

在Linux系统中，网络配置是至关重要的任务之一。本文详细解析了Firewalld和Netfilter机制，并探讨了iptables的应用。通过使用`ip addr show`命令来查看网卡IP地址（需要安装`iproute`包），当网卡未分配IP地址或处于关闭状态时，可以通过`ip link set`命令进行配置和激活。此外，文章还介绍了如何利用Firewalld和iptables实现网络流量控制和安全策略管理，为系统管理员提供了实用的操作指南。 ... [详细]

蜡笔小新 2024-11-09 12:37:55
web
CSS3 @font-face 字体应用技术解析与实践

在Web前端开发中，HTML教程和CSS3的结合使得网页设计更加多样化。长期以来，Web设计师受限于“web-safe”字体的选择。然而，CSS3中的`@font-face`规则允许从服务器端加载自定义字体，极大地丰富了网页的视觉效果。通过这一技术，设计师可以自由选择和使用各种字体，提升用户体验和页面美观度。本文将深入解析`@font-face`的实现原理，并提供实际应用案例，帮助开发者更好地掌握这一强大工具。 ... [详细]

蜡笔小新 2024-11-07 19:12:26
web
为 HelloWorld 项目添加视图组件

在本文中，我们将为 HelloWorld 项目添加视图组件，以确保控制器返回的视图路径能够正确映射到指定页面。这一步骤将为后续的测试和开发奠定基础。首先，我们将介绍如何配置视图解析器，以便 SpringMVC 能够识别并渲染相应的视图文件。 ... [详细]

蜡笔小新 2024-11-07 10:52:57
list
Git Stash 使用指南及解决 Git Stash Pop 冲突的方法

使用 `git stash` 可以将当前未提交的修改保存到一个临时存储区，以便在后续恢复工作目录时使用。例如，在处理中间状态时，可以通过 `git stash` 命令将当前的所有未提交更改推送到一个新的储藏中，从而保持工作目录的整洁。此外，本文还将详细介绍如何解决 `git stash pop` 时可能出现的冲突问题，帮助用户高效地管理代码变更。 ... [详细]

蜡笔小新 2024-11-06 16:56:21
web
利用PHP SDK高效接入新浪微博热搜榜单功能

利用PHP SDK高效接入新浪微博热搜榜单功能 ... [详细]

蜡笔小新 2024-11-03 17:08:38
get
PHP中元素的计量单位是什么？

PHP中元素的计量单位是什么？ ... [详细]

蜡笔小新 2024-11-01 15:06:51

mobiledu2502856097

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章