热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

从MP4头信息中提取sps和pps数据

一、MP4格式基本概念MP4格式对应标准MPEG-4标准(ISOIEC14496)二、MP4封装格式核心概念1MP4封装格式对应标准为ISO

一、MP4格式基本概念

MP4格式对应标准MPEG-4标准(ISO/IEC14496)

 


二、MP4封装格式核心概念

1  MP4封装格式对应标准为 ISO/IEC 14496-12(信息技术 视听对象编码的第12部分: ISO 基本媒体文件格式/Information technology Coding of audio-visual objects Part 12: ISO base media file format)

 附-- 标准免费下载: Freely Available Standards    http://standards.iso.org/ittf/PubliclyAvailableStandards/index.html

 

2  MP4封装格式是基于QuickTime容器格式定义,媒体描述与媒体数据分开,目前被广泛应用于封装h.264视频和ACC音频,是高清视频/HDV的代表。


 

 MP4文件中所有数据都封装在box中(对应QuickTime中的atom),即MP4文件是由若干个box组成,每个box有长度和类型,每个box中还可以包含另外的子box(称container box)。

 一个MP4文件首先会有且只有一个“ftyp”类型的box,作为MP4格式的标志并包含关于文件的一些信息;之后会有且只有一个“moov”类型的box(Movie Box),它是一种container box,子box包含了媒体的metadata信息;MP4文件的媒体数据包含在“mdat”类型的box(Midia Data Box)中,该类型的box也是container box,可以有多个,也可以没有(当媒体数据全部引用其他文件时),媒体数据的结构由metadata进行描述。


 

4   MP4中box存储方式为大端模式。一般,标准的box开头会有四个字节的box size。




好的,铺垫做好了,下面直接进入正题!

近期本人在用自己的开发板对ffmpeg解码做一些改进,目标是将ffmpeg的解码部分交给硬件编解码单元VPU(Video Processing Unit)去做,而ffmpeg用来读取文件,并解析文件,以加快解码速度,并释放CPU资源(事实上单核ARM cotexA9解码1920x1088的视频,根本解不动啊...)。

这里补充两个概念:
解析:即解封装,封装格式有很多种,常见的如avi、mp4、rmvb等等。
解码:将压缩的多媒体数据格式还原,视频数据压缩格式也有很多,目前比较流行的有H.264、mpeg2、mpeg4等等。

使用VPU进行解码的时候,交给VPU的数据必须是严格的H.264数据,否则VPU是不认的。本以为ffmpeg的解析工作可以和VPU的解码完美配合,但事与愿违,ffmpeg解析后的一个packet(即一个视频帧)的格式为4byte的box大小+帧数据,而真正的H.264的数据为4byte的头(00 00 00 01)+帧数据。因此,每一帧的数据在丢给VPU之前,需要将头部的4bit用00 00 00 01替换。下图为ffmpeg提取的packet数据(我打印出来每个packet的前5位,和packet size)。


可以看到,每一个packet的前4byte是帧大小(mp4是大端存储),如第一组数据:0x14efa = 85754,即出去前4byte后的大小。

在使用VPU进行H.264解码的时候,还需要sps和pps数据,第一帧的数据头应当包含sps和pps。(至于这两个参数是干什么的,这里就不赘述了,网上的资料很多)。好的,下面来说如何找出sps和pps:
1、找到avcC,在mp4的包头中,包含了avcC这4个字母的asic码,对应的十六进制数分别是61 76 63 43。因此,需要在mp4包头中找出avcC。下图为用altraedit查看的mp4的包头数据。

可以看到,61 76 63 43对应了avcC。至于前面的mp4包头信息,可以参考mp4官方文档给出的解释,这里不再解释。

2、根据下表所示的信息,找出对应的sps和pps位:



因此,对应上表,可以得出如下信息:

avcC 61 76 63 43
版本号 1
AVCProfileIndication 64
profile_compatibility 0
AVCLevelIndication 29
reserved(6bit)+NALU长度(2bit) ff
reserver(3bit)+sps个数(5bit) E1
sps长度 00 0B
sps内容 67 64 00 29 AC CE C0 78 02 26 40
pps个数 01
pps长度 00 04
pps内容 68 EA 5B 83


好的,到此为止就在mp4的包头中找到了sps和pps数据,可以根据此方法写出你的code啦,很简单吧!







推荐阅读
  • 如何将TS文件转换为M3U8直播流:HLS与M3U8格式详解
    在视频传输领域,MP4虽然常见,但在直播场景中直接使用MP4格式存在诸多问题。例如,MP4文件的头部信息(如ftyp、moov)较大,导致初始加载时间较长,影响用户体验。相比之下,HLS(HTTP Live Streaming)协议及其M3U8格式更具优势。HLS通过将视频切分成多个小片段,并生成一个M3U8播放列表文件,实现低延迟和高稳定性。本文详细介绍了如何将TS文件转换为M3U8直播流,包括技术原理和具体操作步骤,帮助读者更好地理解和应用这一技术。 ... [详细]
  • 深入解析C语言中结构体的内存对齐机制及其优化方法
    为了提高CPU访问效率,C语言中的结构体成员在内存中遵循特定的对齐规则。本文详细解析了这些对齐机制,并探讨了如何通过合理的布局和编译器选项来优化结构体的内存使用,从而提升程序性能。 ... [详细]
  • 本文探讨了如何通过编程手段在Linux系统中禁用硬件预取功能。基于Intel® Core™微架构的应用性能优化需求,文章详细介绍了相关配置方法和代码实现,旨在帮助开发人员有效控制硬件预取行为,提升应用程序的运行效率。 ... [详细]
  • 在Linux系统中,通过命令行查询计算机硬件配置是一项重要的技能。本文介绍了多种实用的命令和技巧,帮助用户高效地获取硬件信息。例如,可以通过 `cat /proc/cpuinfo | grep "physical id"` 命令来查看物理CPU的数量。此外,文章还涵盖了其他关键硬件组件的查询方法,如内存、磁盘和网络设备等。这些命令不仅适用于系统管理员,也适合普通用户了解自己的系统配置。 ... [详细]
  • 本指南介绍了如何在ASP.NET Web应用程序中利用C#和JavaScript实现基于指纹识别的登录系统。通过集成指纹识别技术,用户无需输入传统的登录ID即可完成身份验证,从而提升用户体验和安全性。我们将详细探讨如何配置和部署这一功能,确保系统的稳定性和可靠性。 ... [详细]
  • Web开发框架概览:Java与JavaScript技术及框架综述
    Web开发涉及服务器端和客户端的协同工作。在服务器端,Java是一种优秀的编程语言,适用于构建各种功能模块,如通过Servlet实现特定服务。客户端则主要依赖HTML进行内容展示,同时借助JavaScript增强交互性和动态效果。此外,现代Web开发还广泛使用各种框架和库,如Spring Boot、React和Vue.js,以提高开发效率和应用性能。 ... [详细]
  • 利用ZFS和Gluster实现分布式存储系统的高效迁移与应用
    本文探讨了在Ubuntu 18.04系统中利用ZFS和Gluster文件系统实现分布式存储系统的高效迁移与应用。通过详细的技术分析和实践案例,展示了这两种文件系统在数据迁移、高可用性和性能优化方面的优势,为分布式存储系统的部署和管理提供了宝贵的参考。 ... [详细]
  • 在 Linux 环境下,多线程编程是实现高效并发处理的重要技术。本文通过具体的实战案例,详细分析了多线程编程的关键技术和常见问题。文章首先介绍了多线程的基本概念和创建方法,然后通过实例代码展示了如何使用 pthreads 库进行线程同步和通信。此外,还探讨了多线程程序中的性能优化技巧和调试方法,为开发者提供了宝贵的实践经验。 ... [详细]
  • 在Android平台上,视频监控系统的优化与应用具有重要意义。尽管已有相关示例(如http:www.open-open.comlibviewopen1346400423609.html)展示了基本的监控功能实现,但若要提升系统的稳定性和性能,仍需进行深入研究和优化。本文探讨了如何通过改进算法、优化网络传输和增强用户界面来提高Android视频监控系统的整体效能,以满足更复杂的应用需求。 ... [详细]
  • Python全局解释器锁(GIL)机制详解
    在Python中,线程是操作系统级别的原生线程。为了确保多线程环境下的内存安全,Python虚拟机引入了全局解释器锁(Global Interpreter Lock,简称GIL)。GIL是一种互斥锁,用于保护对解释器状态的访问,防止多个线程同时执行字节码。尽管GIL有助于简化内存管理,但它也限制了多核处理器上多线程程序的并行性能。本文将深入探讨GIL的工作原理及其对Python多线程编程的影响。 ... [详细]
  • 本文介绍了如何在iOS平台上使用GLSL着色器将YV12格式的视频帧数据转换为RGB格式,并展示了转换后的图像效果。通过详细的技术实现步骤和代码示例,读者可以轻松掌握这一过程,适用于需要进行视频处理的应用开发。 ... [详细]
  • 显卡选择时需要考虑与CPU和主板的兼容性吗?
    在选择显卡时,确实需要考虑其与CPU和主板的兼容性。虽然现代电脑通常配备高性能显卡,不再像过去那样依赖CPU和主板的集成显卡功能,但确保这些组件之间的良好配合仍然至关重要。这不仅能够提升系统的整体性能,还能避免潜在的兼容性问题,确保系统的稳定运行。 ... [详细]
  • 深入解析Linux内核中的进程上下文切换机制
    在现代操作系统中,进程作为核心概念之一,负责管理和分配系统资源,如CPU和内存。深入了解Linux内核中的进程上下文切换机制,需要首先明确进程与程序的区别。进程是一个动态的执行流,而程序则是静态的数据和指令集合。进程上下文切换涉及保存当前进程的状态信息,并加载下一个进程的状态,以实现多任务处理。这一过程不仅影响系统的性能,还关系到资源的有效利用。通过分析Linux内核中的具体实现,可以更好地理解其背后的原理和技术细节。 ... [详细]
  • 本文深入探讨了WinRing0及其源代码实现,详细解析了如何通过获取Ring0权限在应用程序中直接执行需要Ring0权限的CPU指令。此外,文章还提供了实例截图和核心代码示例,帮助读者更好地理解和应用这一技术。 ... [详细]
  • 2012年9月12日优酷土豆校园招聘笔试题目解析与备考指南
    2012年9月12日,优酷土豆校园招聘笔试题目解析与备考指南。在选择题部分,有一道题目涉及中国人的血型分布情况,具体为A型30%、B型20%、O型40%、AB型10%。若需确保在随机选取的样本中,至少有一人为B型血的概率不低于90%,则需要选取的最少人数是多少?该问题不仅考察了概率统计的基本知识,还要求考生具备一定的逻辑推理能力。 ... [详细]
author-avatar
mobiledu2502875007
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有