热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

为CameraXImageAnalysis进行YUV到RGB的转换

为,camerax,imageanalysis,进行,yuv,

CameraX 是一个旨在帮助开发者简化相机应用开发工作的 Jetpack 支持库。它支持多种诸如 ImageCapture、Preview 和 ImageAnalysis 这种可以和 ML Kit 或 TensorFlow Lite 无缝结合的使用场景。这为文本识别、图像标记等应用的开发提供了可能,甚至还可以支持使用开发者自己训练的 TensorFlow Lite 模型进行物体的识别和检测。然而,在 CameraX 和这些库之间进行图像格式转换的工作还是比较费时费力的。本文我们会介绍最近为 CameraX ImageAnalysis 带来的新功能,支持从 YUV 到 RGB 的转换,我们会介绍一些背景知识,为什么会引入该功能,并会以少量的示例代码来介绍如何使用它。

背景

CameraX 使用 YUV420_888 来生成图像,该格式有 8 位的 Luma(Y)、Chroma(U, V) 和 Paddings(P) 三个通道。YUV 是一种通用且灵活的格式,它支持不同的设备上的 OEM 变体,这就覆盖了很多 ImageAnalysis 的使用场景。然而很多应用依然依赖 RGB 格式。在我们的开发者社区,YUV 到 RGB 的转换是呼声最高的功能之一,因为 RGB 格式流行且易于使用,且有时需要在 TensorFlow Lite 模型中使用。让我们先来看看 YUV 和 RGB 格式。

YUV_420_888 格式

YUV 格式也可以被称为 "YCbCr",它包括平面 (planar,如 I420)、半平面 (semi-planar,如 NV21/NV12) 和打包 (packed,如 UYVY) 格式。YUV_420_888 是一种通用的 YCbCr 格式,它能够表示任何 4:2:0 色度二次采样的平面或半平面缓冲区 (但不完全交错),每个颜色样本有 8 位。且能够保证 Y 平面不会与 U/V 平面交错 (且像素步长始终为 1),以及 U/V 平面总是具有相同的行步长和像素步长。

RGBA_8888 格式

RGBA_8888 是一种标准的具有红、绿、蓝和 alpha 通道的 RGB 格式,每个通道有 8 位。主要的转换对象是 RGB 颜色空间,RGB 因为色差变化较少,相对来说比较简单。

API 实现

我们评估了三种将 YUV 转换为 RGB 的方法:

  1. 使用 Java/Kotlin
  2. 使用 Renderscript 渲染脚本
  3. 原生方案 (使用 C/C++ 和 NDK)

使用 Java/Kotlin 来实现对图片的处理需要长时间的计算,并面临着垃圾回收带来的压力。而 Renderscript 是面向计算密集型任务 (比如从 YUV 转换为 RGB 格式) 的一个候选方案,然而从 Android 12 开始,这种方法已经被 废弃 了。

考虑到之后的扩展性和兼容性,我们决定使用原生方案 (libyuv + NDK)。Libyuv 是一个开源项目,它包含了对 YUV 的缩放、转换和旋转功能。综合所有因素,宏观上来看,CameraX 颜色转换的 pipeline 如下图:

为了向后兼容,我们依然使用 ImageProxy 作为输出。ImageProxy 是 media.image 的一个封装类,它是 Android framework 中提供的一个图片缓冲。Java/Kotlin 层可以从 Surface 中通过 dequeueInputImage() 获得一个输入的 Image,然后使用 ImageReader 和 ImageWriter 将 Image 数据写入其中,从而得到一个转换后的 Image。由于 ImageWriter 是在 API 23 中添加的,我们使用 ANativeWindow 以及其缓冲区来产生 RGBA 格式的输出图像,以支持更多的 API 级别。

对于输入数据,我们在 CameraX 内部支持 YUV_420_888 格式的不同变体 (I420,NV12,NV21 等)。对于输出数据,我们现在支持 RGBA 格式,但将来会扩展到更多其他的 RGB 格式。

由于我们使用 libyuv 作为新的依赖库,我们的库大小增加了大约 50 KB

API 使用

从 CameraX 1.1.0-alpha08 版本开始,应用可以通过在 ImageAnalysis 配置中使用 setOutputImageFormat 来选择 YUV_420_888 或者 RGBA_8888 的图片输出格式。

一旦选择了 RGBA_8888,输出的图片格式将会是 PixelFormat.RGBA_8888,它只有一个带有填充的图像平面 (逐个 R,G,B,A 的像素)。原则上 Android framework 支持的图像缓冲区格式是 PixelFormat 和 ImageFormat 的子集。

相比之下,如果选择了 YUV_420_888,输出的图片格式将是 ImageFormat.YUV_420_888,它有 3 个独立的图像平面 (Y,U,V)。

性能

我们做了一些性能测试,并与在不同的 Android 版本和设备上使用 Renderscript 的结果进行了比较。总体上来说,在不同分辨率和 Android 系统版本上,使用 libyuv 的 pipeline 要优于使用 Renderscript 的实现。

总结

我们在 CameraX ImageAnalysis pipeline 中支持了 YUV 到 RGB 的转换。用户现在可以简单地为一个 ImageAnalysis 用例选择一个输出格式 (YUV_420_888 或 RGBA_8888),并用于其他库之中。而这仅仅是一个开始,我们还计划在 CameraX ImageAnalysis pipeline 中增加更多的图像处理功能,并将其扩展到其他的用例中 (例如 ImageCapture 或 Preview 等)。如果您有任何功能上的需求,请联系我们。

YUV 到 RGB 转换的示例代码可以在 GitHub 中查看。若需了解更多关于 CameraX 的消息,请参考 官方文档。若要了解关于 CameraX 的最新进展,您可以加入 CameraX 讨论区。另外,您的反馈对我们来说十分具有价值,欢迎随时在 CameraX 讨论区留言或在官方的 Issue Tracker 中给我们反馈。

相关引用

  • CameraX 发布说明
  • 开始使用 CameraX
  • CameraX Github 用例
  • YUV 格式 Wiki

欢迎您 点击这里 向我们提交反馈,或分享您喜欢的内容、发现的问题。您的反馈对我们非常重要,感谢您的支持!


推荐阅读
  • 本文详细介绍了 Java 网站开发的相关资源和步骤,包括常用网站、开发环境和框架选择。 ... [详细]
  • 本文将介绍如何在混合开发(Hybrid)应用中实现Native与HTML5的交互,包括基本概念、学习目标以及具体的实现步骤。 ... [详细]
  • 普通树(每个节点可以有任意数量的子节点)级序遍历 ... [详细]
  • 2020年9月15日,Oracle正式发布了最新的JDK 15版本。本次更新带来了许多新特性,包括隐藏类、EdDSA签名算法、模式匹配、记录类、封闭类和文本块等。 ... [详细]
  • 本文详细介绍了 HTML 中 a 标签的 href 属性的多种用法,包括实现超链接、锚点以及调用 JavaScript 方法。通过具体的示例和解释,帮助开发者更好地理解和应用这些技术。 ... [详细]
  • 如何高效查看Java API和源码
    在Java学习过程中,查看API文档和源码是提高编程能力的重要手段。本文将详细介绍如何使用各种工具和方法高效地查看Java API和源码。 ... [详细]
  • 近期,微信公众平台上的HTML5游戏引起了广泛讨论,预示着HTML5游戏将迎来新的发展机遇。磊友科技的赵霏,作为一名HTML5技术的倡导者,分享了他在微信平台上开发HTML5游戏的经验和见解。 ... [详细]
  • javax.mail.search.BodyTerm.matchPart()方法的使用及代码示例 ... [详细]
  • Flutter 2.* 路由管理详解
    本文详细介绍了 Flutter 2.* 中的路由管理机制,包括路由的基本概念、MaterialPageRoute 的使用、Navigator 的操作方法、路由传值、命名路由及其注册、路由钩子等。 ... [详细]
  • 解决Only fullscreen opaque activities can request orientation错误的方法
    本文介绍了在使用PictureSelectorLight第三方框架时遇到的Only fullscreen opaque activities can request orientation错误,并提供了一种有效的解决方案。 ... [详细]
  • Linux 数据流重定向详解
    本文详细介绍了 Linux 系统中的数据流重定向技术,包括标准输出(stdout)、标准错误输出(stderr)和标准输入(stdin)的重定向方法,以及其在实际应用中的具体示例。 ... [详细]
  • 本文介绍了Java编程语言的基础知识,包括其历史背景、主要特性以及如何安装和配置JDK。此外,还详细讲解了如何编写和运行第一个Java程序,并简要介绍了Eclipse集成开发环境的安装和使用。 ... [详细]
  • 如果应用程序经常播放密集、急促而又短暂的音效(如游戏音效)那么使用MediaPlayer显得有些不太适合了。因为MediaPlayer存在如下缺点:1)延时时间较长,且资源占用率高 ... [详细]
  • JUC(三):深入解析AQS
    本文详细介绍了Java并发工具包中的核心类AQS(AbstractQueuedSynchronizer),包括其基本概念、数据结构、源码分析及核心方法的实现。 ... [详细]
  • 零拷贝技术是提高I/O性能的重要手段,常用于Java NIO、Netty、Kafka等框架中。本文将详细解析零拷贝技术的原理及其应用。 ... [详细]
author-avatar
福州-台江_616
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有