LinuxGraphics周刊（第6期）

作者：nn371417415 | 来源：互联网 | 2023-09-16 20:48

导读：dma-buf:vmap新增对IO-Memory的支持drmgem:vmap新增对IOmemory的支持drmgem:全面启用GEMobjectfunction

导读&＃xff1a;

dma-buf: vmap 新增对 I/O-Memory 的支持
drm/gem: vmap 新增对 I/O memory 的支持
drm/gem: 全面启用 GEM object functions
drm/ttm: 删除 TTM_PL_FLAG_NO_EVICT&＃xff0c;新增 ttm_bo_pin()/ttm_bo_unpin()
interfaces: bugfix for use-after-free in mapper 2.0
SurfaceFlinger: 采用绝对时间来设置 VSP timer
GPU Memory: 新增 libgpumem 用于 BPF 调试
Android vulkan 升级到 1.2.158
Taiwins 0.2 发布&＃xff0c;支持 Lua 脚本

DRM

1. dma-buf: vmap 新增对 I/O-Memory 的支持

之前曾在周刊第1期中报道过关于为 GEM vmap 添加 I/O memory 的支持的提交&＃xff0c;该提交是以 drm prime 为基础进行修改的&＃xff0c;不过该 patch 并没有立即被合入&＃xff0c;而是重新提交了基于更底层的 dma-buf 修改的 patch&＃xff0c;并最终于9月25日 merge 到 drm-misc 分支&＃xff0c;预计将被合入到 linux-5.11 rc1 版本中。以下是该 patch 的背景&＃xff1a;

众所周知&＃xff0c;CPU 在 kernel space 是通过虚拟地址&＃xff08;virtual address&＃xff09;来访问物理内存的。同样的&＃xff0c;如果 CPU 想访问一块 dma buffer 的物理内存&＃xff0c;也需要先将该 dma buffer 映射到 kernel 的虚拟地址空间中才能正常访问&＃xff0c;而这个映射的操作则由 dma_buf_vmap() 接口来实现。无论该 dma buffer 在物理上是连续的还是离散的&＃xff0c;经过 dma_buf_vmap() 后的虚拟地址一定是连续的&＃xff0c;这样 CPU 就可以像访问普通内存一样来访问 dma buffer。如果你还不了解 dmabuf 的 vmap 接口&＃xff0c;建议回顾一下本人的《dma-buf 系列之 kmap / vmap》

CPU 访问 dma buffer 的应用场景在 DRM 驱动中非常普遍&＃xff0c;如 fbdev console 以及 tinydrm&＃xff0c;都会涉及到在驱动中动态修改 framebuffer 内容。由于 CPU 将这块 vmap() 后的内存当作普通内存来访问&＃xff0c;因此它使用的操作指令则是通用的 load/store 指令。设想一下&＃xff0c;当 vmap 的物理内存来自于 I/O 端口&＃xff08;如外设寄存器&＃xff09;时&＃xff0c;会发生什么样的情况&＃xff1f;如果是 ARM 平台则不会出现什么异常&＃xff0c;因为 ARM 架构中 IO 地址空间是和内存空间统一编址的&＃xff0c;所以访问 IO 寄存器和访问普通内存没有什么区别。但是在 SPARC 平台上就会导致 kernel panic&＃xff0c;原因是 SPARC 架构中 I/O 地址空间是独立编址的&＃xff0c;不能使用普通的 load/store 访存指令来访问 IO 内存&＃xff0c;而需要使用专门的 I/O 操作指令才能正常访问 I/O 端口上的内容。

为了解决上述平台兼容性问题&＃xff0c;Thomas Zimmermann&＃xff08;drm-misc maintainer, SUSE&＃xff09;向社区提交了一组 patch&＃xff0c;新增了 dma_buf_map 结构体&＃xff0c;用于专门区分 vmap() 后的地址是位于 IO Memory 还是 System Memory 上。dma_buf_map 具体定义如下&＃xff1a;

struct dma_buf_map {union {void __iomem *vaddr_iomem;void *vaddr;};bool is_iomem; };

该结构体作为 dma_buf_vmap() 的返回值&＃xff0c;通过 is_iomem 来告诉调用者当前 memory 的类型&＃xff0c;这样驱动程序就可以针对不同的 memory 类型&＃xff0c;使用不同的访存接口&＃xff08;如 memcpy() 还是 memcpy_toio()&＃xff09;来操作内存&＃xff0c;避免 kernel panic 的发生。需要注意的是&＃xff0c;该结构体虽然名字中包含“dma buf” 关键字&＃xff0c;但是该结构体并不依赖于 dma-buf 驱动&＃xff0c;它有自己独立的 dma-buf-map.h 头文件&＃xff0c;任何想要区分 IO / System memory 的驱动都可以引用该头文件&＃xff0c;而无需开启任何 dma-buf 相关的宏定义。关于该结构体的命名&＃xff0c;邮件列表中也有不少反对意见&＃xff0c;而 Thomas 解释之所以给它取名带 “dma buf” 关键字&＃xff0c;是因为目前只有 dma-buf 驱动才会用到这个结构体&＃xff0c;如果后面还有其他驱动也需要用到该结构体&＃xff0c;可以到时候再修改&＃xff0c;毕竟就现阶段而言&＃xff0c;尽早合入该 patch 能加快其他依赖驱动的合入进程。

&＃xff08;其实我个人觉得这个结构体名字取的真的很不好&＃xff0c;因为它容易和函数 dma_buf_mmap() 混淆&＃xff09;

详情&＃xff1a;[v3,0/4] dma-buf: Flag vmap’ed memory as system or I/O memory

2. drm/gem: vmap 新增对 I/O memory 的支持

基于上面的 dma-buf-map patch&＃xff0c;Thomas 将上次关于 GEM I/O memory mapping 的 patch rebase 到了 dma-buf-map 基础上&＃xff0c;并对 drm 中凡是和 vmap 相关的接口进行了修改&＃xff0c;包括 cma、shmem、vram、ttm、prime、client 以及 drm_gem_object_funcs。除此之外&＃xff0c;他还对 drm_fb_helper.c 做了大量修改&＃xff0c;并新增了 dma_buf_map_memcpy_to() 和 dma_buf_map_incr() 两个辅助函数来简化 fbdev 驱动访问显存的代码编写。该 patch 将在 linux-5.11 merge window 开启时被合入。

详情&＃xff1a;[PATCH v5 00/10] Support GEM object mappings from I/O memory

3. drm/gem: 全面启用 GEM object functions

两个月前曾在周刊第1期中介绍过关于“彻底废弃 drm_driver 中的 prime callbacks&＃xff0c;全面启用 GEM Object functions”的消息。drm_gem_object_funcs 从 kernel-4.19 开始被引入&＃xff0c;该结构体定义如下&＃xff08;linux-5.10-rc1&＃xff09;:

struct drm_gem_object_funcs {void (*free)(struct drm_gem_object *obj);int (*open)(struct drm_gem_object *obj, struct drm_file *file);void (*close)(struct drm_gem_object *obj, struct drm_file *file);void (*print_info)(struct drm_printer *p, unsigned int indent,const struct drm_gem_object *obj);struct dma_buf *(*export)(struct drm_gem_object *obj, int flags);int (*pin)(struct drm_gem_object *obj);void (*unpin)(struct drm_gem_object *obj);struct sg_table *(*get_sg_table)(struct drm_gem_object *obj);void *(*vmap)(struct drm_gem_object *obj);void (*vunmap)(struct drm_gem_object *obj, void *vaddr);int (*mmap)(struct drm_gem_object *obj, struct vm_area_struct *vma); };

可以看到&＃xff0c;该结构体几乎覆盖了所有 dma-buf export 的接口&＃xff0c;因此它可以完全取代 drm_driver 结构体中的 prime export 接口。Thomas Zimmermann&＃xff08; drm-misc Maintainer, SUSE&＃xff09;总共提交了 22 笔 patch&＃xff0c;其中第 1~ 21 笔 patch 是专门用来清理各个 drm 设备驱动的&＃xff0c;将 drm_driver 中的 prime export 接口挪到 drm_gem_object_funcs 中去。第 22 笔 patch 则是彻底删除 drm_driver 中与 prime export 相关的 callbacks。该 patch 已于9月25日合入到 drm-misc-next 分支&＃xff0c;接下来准备合入 linux-5.11 主线。

详情&＃xff1a;[PATCH v2 00/21] Convert all remaining drivers to GEM object functions

4. drm/ttm: 删除 TTM_PL_FLAG_NO_EVICT&＃xff0c;新增 ttm_bo_pin()/ttm_bo_unpin()

TTM&＃xff08;Translation Table Manager&＃xff09;是 DRM 驱动中的一种显存管理机制&＃xff0c;和 GEM 是同一个级别的概念&＃xff0c;它主要适用于带独立显存的显卡驱动&＃xff0c;因此在移动平台很少看到它的身影。因为 ttm 主要适用于带独立显卡的应用场景&＃xff0c;因此在分配显存的时候就会涉及到具体显存分配的位置&＃xff0c;进一步说就是在 VRAM 中分配还是在系统的 RAM 中分配。为了告诉 ttm 驱动具体应该在什么样的介质上分配 buffer&＃xff0c;drm 框架引入了 ttm placement flag&＃xff0c;如 TTM_PL_FLAG_SYSTEM 代表在系统 memory 中分配 buffer&＃xff0c;TTM_PL_FLAG_VRAM 在 VRAM 中分配 buffer。而当 VRAM 中空间不足时&＃xff0c;驱动则会将那些使用频率并不高但是又不能立即释放的 buffer 迁移&＃xff08;驱逐/evict&＃xff09;到 System Memory 中&＃xff0c;以此来为新的 buffer 提供可用的空间&＃xff08;有点类似于 kernel 中的 CMA 机制&＃xff09;。而 TTM_PL_FLAG_NO_EVICT 则是告诉驱动当前分配的 buffer 不能进行迁移&＃xff0c;一旦分配了就固定在当前介质中了&＃xff08;即pin住了&＃xff09;。随着时间的推移&＃xff0c;开发人员发现 TTM_PL_FLAG_NO_EVICT 这个 flag 越来越不好用&＃xff0c;因为该 flag 将 buffer 限定死了&＃xff0c;有时候我们希望某块 buffer 当我们要使用它时&＃xff0c;就将他固定&＃xff08;pin&＃xff09;在 VRAM 中&＃xff0c;当我们中途不想用时&＃xff0c;就把它 unpin 掉&＃xff0c;这样后续就可以对它进行迁移操作&＃xff0c;提高 VRAM 的利用率。所以后来各个厂商开始通过 pin_count 引用计数来对某个 buffer 实现 pin/unpin 操作&＃xff0c;而不再使用原生的 TTM_PL_FLAG_NO_EVICT flag。Christian König 提交的这组 patch 则顺应了各大厂商的意愿&＃xff0c;将 vendor 实现的 pin_count 挪到了 ttm 框架中&＃xff0c;通过 ttm_bo_pin() 和 ttm_bo_unpin() 函数来操作 pin_count 引用计数&＃xff0c;同时删除了 TTM_PL_FLAG_NO_EVICT flag 和 ttm_bo_create() 函数。该 patch 也将被合入到 Linux-5.11 中。

详情&＃xff1a;[PATCH 01/11] drm/ttm: add ttm_bo_pin() ttm_bo_unpin() v2

AOSP

1. ueventd: support DMA-BUF heaps

DMA-BUF Heaps 是用来替代 ION 的多媒体内存分配器&＃xff0c;而在周刊第3期中也曾报道过 kernel mainline 已经彻底删除了 ION 驱动&＃xff0c;而 Google 也将在 AndroidS 中正式启用 DMA-BUF Heaps 来作为 ION 的备选方案。

如下提交在 rootdir/ueventd.rc 中新增了 dma_heap 节点访问权限&＃xff1a;

/dev/dma_heap/system 0666 system system

详情&＃xff1a;aosp/core[master]: Setup ueventd to support DMA-BUF heaps

2. interfaces: bugfix for use-after-free in mapper 2.0

在谷歌官方的mapper2.0 hal实现中&＃xff0c;通过importBuffer()导入的 native_handle_t 都是保存在 mBufferHandles 集合中的&＃xff0c;当应用程序不再需要这个 native_handle_t 时&＃xff0c;则通过 freeBuffer() 来释放这个handle所对应的进程资源&＃xff0c;最终擦除该 native_handle_t 在 mBufferHandles 中的位置。由于应用程序 importBuffer() 和 freeBuffer() 可能在两个不同的线程中执行&＃xff0c;所以在对 mBufferHandles 进行 add/erase 操作时都是用锁保护起来的&＃xff0c;以防出现竞争。但最近开发人员发现在 Mapper 2.0 中还是出现了竞争的问题&＃xff0c;因为在 freeBuffer() 的实现中&＃xff0c; 是先调用底层的 mHal->freeBuffer() 然后再执行 mBufferHandles.erase() 操作&＃xff0c;由于互斥锁只保护了 erase 操作&＃xff0c;没有保护 mHal->freeBuffer()&＃xff0c;这就有可能导致一个线程刚刚执行完 mHal->freeBuffer()&＃xff0c;正好另一个线程又在执行 importBuffer() 操作&＃xff0c;于是出错。解决方法则是将 mHal->freeBuffer() 和 mBufferHandles.erase() 操作放在同一把锁里保护起来&＃xff0c;这样就能避免多线程的竞争问题。

详情&＃xff1a;aosp/interfaces[master]: graphics: fix use-after-free in mapper 2.0 passthrough

3. SurfaceFlinger: 采用绝对时间来设置 VSP timer

VSyncPredictor&＃xff08;VSP&＃xff09;是 Android11 新引的一个 Vsync 预测器&＃xff0c;它内部有一个 timer 模块&＃xff0c;基于 timerfd 来实现的。timerfd 是 Linux 为用户程序提供的一个定时器接口。这个接口基于文件描述符&＃xff0c;通过文件描述符的可读事件进行超时通知&＃xff0c;因此可以配合 select/poll/epoll 等使用。该 patch 的重点是在 timerfd_settime() 函数上&＃xff0c;这个函数接收一个 flag 参数&＃xff0c;当 flag 为 TFD_TIMER_ABSTIME 时代表设置的是绝对时间&＃xff0c;当 flag 为0时代表设置的时间为相对时间。VSP timer 将 timerfd_settime() 封装在了 Timer::alarmIn() 函数中&＃xff0c;使用的 flag 都是0&＃xff08;即相对时间&＃xff09;&＃xff0c;本意是调用 alarmIn(5) 就会在5ms后唤醒定时器&＃xff0c;正常情况下没有什么问题的。但是一旦在 alarmIn() 中 timerfd_settime() 之前发生了线程抢占&＃xff0c;那么这个 alarmIn() 设置的 timer 就会往后推迟&＃xff0c;导致 timer 不准确。因此需要将 timerfd_settime() 的 flag 修改成 TFD_TIMER_ABSTIME&＃xff0c;这样采用绝对时间就能避免因线程调度而导致的 timer 不准确的问题发生。

详情&＃xff1a;aosp/native[master]: SurfaceFlinger: use TFD_TIMER_ABSTIME for VSP timer

4. AChoreographer: 删除多余的 requestLatestConfig() 操作

AChoreographer 原本就是从 DisplayManager 那边获取刷新率&＃xff08;refresh rate&＃xff09;的&＃xff0c;因此没必要通过 requestLatestConfig() 接口从 SurfaceFlinger 那边获取。 AChoreographer 只需要将最新的 refresh rate 封装成一个 event&＃xff0c;然后发送给 looper 线程即可。该 Patch 能够确保 AChoreographer 的回调函数的执行是和 DisplayManager 完全同步的。

详情&＃xff1a;aosp/native[master]: Fix refresh rate callback fan-out for choreographer

5. GPU Memory: 新增 libgpumem 用于 BPF 调试

为了增加 GPU 调试手段&＃xff0c;Google 在 frameworks/native/services/gpuservice/bpfprogs 下新增 gpu_mem.c 文件&＃xff0c;用于生成 BPF 调试程序 gpu_mem.o。同时在 frameworks/native/services/gpuservice 下新增了 libgpumem 模块&＃xff0c;用于和 BPF 下的 gpu_mem.o 程序通信。当 BPF 加载 gpu_mem.o 文件后&＃xff0c;会生成如下调试节点&＃xff1a;

/system/etc/bpf/gpu_mem.o
/sys/fs/bpf/map_gpu_mem_gpu_mem_total_map
/sys/fs/bpf/prog_gpu_mem_tracepoint_gpu_mem_gpu_mem_total

通过 libgpumem.so&＃xff0c;我们可以抓取当前时刻系统所有进程的 GPU Memory 使用情况&＃xff0c;同时也可以直接使用 “adb shell dumpsys gpu --gpumem” 命令来动态打印 gpu memory 的信息&＃xff0c;非常方便。

详情&＃xff1a;aosp/native[master]: GPU Memory: implement libgpumem to interact with bpf

6. vulkan: 升级 API 版本到 1.2.158

Android 目前的 libvulkan API 版本已升级到 1.2.158&＃xff0c;新增如下 API&＃xff0c;Extension 无新增。

vkCmdBeginRenderPass2 vkCmdDrawIndexedIndirectCount vkCmdDrawIndirectCount vkCmdEndRenderPass2 vkCmdNextSubpass2 vkCreateRenderPass2 vkGetBufferDeviceAddress vkGetBufferOpaqueCaptureAddress vkGetSemaphoreCounterValue vkResetQueryPool vkSignalSemaphore vkWaitSemaphores

详情&＃xff1a;aosp/native[master]: Vulkan: update generated framework according to vulkan-headers

Wayland

Taiwins 0.2 发布&＃xff0c;支持 Lua 脚本

之前曾在我的星球中介绍过 Taiwins 这个新项目&＃xff08;https://t.zsxq.com/R3vJyJM&＃xff09;&＃xff0c;Taiwins 是一个开源的、模块化的 Wayland Compositor&＃xff0c;由 Xichen.Zhou 创建。该项目最初基于 libweston 库开发&＃xff0c;可实现平铺式窗口和浮动窗口&＃xff0c;编写 client 程序代码量少&＃xff0c;易于上手。此次 Taiwins 0.2 版本发布&＃xff0c;将底层基础库从原来的 libweston 转移到了 wlroots 库&＃xff0c;除了支持 Lua 脚本外&＃xff0c;还带来了如下新 feature&＃xff1a;

dynamic window management.
extensible and easy configuration through lua.
very efficient GL renderer, updates only the damages.
a widget system and you can create widgets through lua as well.
built-in shell and application launcher.
configurable theme.
emacs-like key sequence based binding system.
built-in profiler and rendering debugger.

官网&＃xff1a;https://taiwins.org/index.html
github: https://github.com/taiwins/taiwins

详情&＃xff1a;Taiwins 0.2 is out

推荐阅读

string
TypeScript: 泛型的力量与价值

本文探讨了 TypeScript 中泛型的重要性和应用场景，通过多个实例详细解析了泛型如何提升代码的复用性和类型安全性。 ... [详细]

蜡笔小新 2024-11-15 12:12:42
uri
兆芯X86 CPU架构的演进与现状（国产CPU系列）

本文详细介绍了兆芯X86 CPU架构的发展历程，从公司成立背景到关键技术授权，再到具体芯片架构的演进，全面解析了兆芯在国产CPU领域的贡献与挑战。 ... [详细]

蜡笔小新 2024-11-14 15:04:34
list
JavaScript中的事件处理机制

事件是程序各部分之间的一种通信方式，也是异步编程的一种实现形式。本文将详细介绍EventTarget接口及其相关方法，以及如何使用监听函数处理事件。 ... [详细]

蜡笔小新 2024-11-15 04:27:01
string
普通树(每个节点可以有任意数量的子节点)级序遍历

普通树(每个节点可以有任意数量的子节点)级序遍历 ... [详细]

蜡笔小新 2024-11-14 18:53:26
数组
PHP 5.5.31 和 PHP 5.6.17 安全更新发布

PHP 5.5.31 和 PHP 5.6.17 已正式发布，主要包含多个安全修复。强烈建议所有用户尽快升级至最新版本以确保系统安全。 ... [详细]

蜡笔小新 2024-11-14 17:40:40
数组
需要知道一个“本地到屏幕坐标”的函数 - Need to know a “Local to screen Coordinate” function

Iwouldliketohaveatooltopdisplayedonatextboxunderacertainsituation.我希望在特定情况下在文本框中显示工具栏 ... [详细]

蜡笔小新 2024-11-14 13:03:06
main
最详尽的4K技术科普

什么是4K？4K是一个分辨率的范畴，即40962160的像素分辨率，一般用于专业设备居多，目前家庭用的设备，如 ... [详细]

蜡笔小新 2024-11-12 18:25:39
sum
深切明白ES6笔记（三）函数

重要知识点有：函数参数默许值、盈余参数、扩大运算符、new.target属性、块级函数、箭头函数以及尾挪用优化《深切明白ES6》笔记目次函数的默许参数在ES5中，我们给函数传参数， ... [详细]

蜡笔小新 2024-11-12 14:57:05
string
Java高并发与多线程（二）：线程的实现方式详解

本文将深入探讨Java中线程的三种主要实现方式，包括继承Thread类、实现Runnable接口和实现Callable接口，并分析它们之间的异同及其应用场景。 ... [详细]

蜡笔小新 2024-11-12 14:31:23
string
检查在所有可能的“？”替换中，给定的二进制字符串中是否出现子字符串“10”带 1 或 0

检查在所有可能的“？”替换中，给定的二进制字符串中是否出现子字符串“10”带 1 或 0 ... [详细]

蜡笔小新 2024-11-12 11:35:01
string
开发中遇到的一些常见问题及解决方案

本文总结了一些开发中常见的问题及其解决方案，包括特性过滤器的使用、NuGet程序集版本冲突、线程存储、溢出检查、ThreadPool的最大线程数设置、Redis使用中的问题以及Task.Result和Task.GetAwaiter().GetResult()的区别。 ... [详细]

蜡笔小新 2024-11-12 08:20:05
cmd
在Windows系统中安装TensorFlow GPU版的详细指南与常见问题解决

在Windows系统中安装TensorFlow GPU版是许多深度学习初学者面临的挑战。本文详细介绍了安装过程中的每一个步骤，并针对常见的问题提供了有效的解决方案。通过本文的指导，读者可以顺利地完成安装并避免常见的陷阱。 ... [详细]

蜡笔小新 2024-11-11 19:02:49
sum
【图像分类实战】利用DenseNet在PyTorch中实现秃头识别

本文详细介绍了如何使用DenseNet模型在PyTorch框架下实现秃头识别。首先，文章概述了项目所需的库和全局参数设置。接着，对图像进行预处理并读取数据集。随后，构建并配置DenseNet模型，设置训练和验证流程。最后，通过测试阶段验证模型性能，并提供了完整的代码实现。本文不仅涵盖了技术细节，还提供了实用的操作指南，适合初学者和有经验的研究人员参考。 ... [详细]

蜡笔小新 2024-11-06 15:21:35
sum
摩尔线程新款国产显卡曝光：8GB显存，性能超越GTX 660，售价预计超千元

摩尔线程新款国产显卡曝光：8GB显存，性能超越GTX 660，售价预计超千元 ... [详细]

蜡笔小新 2024-11-06 13:43:43
list
能够感知你情绪状态的智能机器人即将问世 | 科技前沿观察

本周科技前沿报道了多项重要进展，包括美国多所高校在机器人技术和自动驾驶领域的最新研究成果，以及硅谷大型企业在智能硬件和深度学习技术上的突破性进展。特别值得一提的是，一款能够感知用户情绪状态的智能机器人即将问世，为未来的人机交互带来了全新的可能性。 ... [详细]

蜡笔小新 2024-11-05 20:45:31

nn371417415

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章