MOSEC议题解读|ATaleofTwoMallocs

作者：LookUp77 | 来源：互联网 | 2023-10-11 13:40

议题概要dlmalloc和jemalloc是Android用户空间使用的两个内存管理器，议题详细分析了两种malloc的实现，深入分配和释放的算法，数据结构的相关细节，讲解中还附带提供了几个堆内存

议题概要

dlmalloc和jemalloc是Android用户空间使用的两个内存管理器，议题详细分析了两种malloc的实现，深入分配和释放的算法，数据结构的相关细节，讲解中还附带提供了几个堆内存可视化的调试器插件。最后会介绍如何利用堆分配器控制内存布局，并以堆缓冲区溢出为例讲解具体应用。

作者介绍

三叉戟（Pegasus）让以色列的NSO Group一战成名，Shmarya Rubenstein正是该组织成员之一。他研究的领域上至应用软件和固件的代码，下至芯片、PCB级别的硬件实现，精熟于嵌入式设备的安全分析。具有十二年专业领域的逆向分析经验。

议题解析

dlmalloc

经历了数十年的迭代更新，目前仍然广泛活跃在历史舞台的漏洞几乎都是堆内存中出现的漏洞(OOB，UAF)。想要在目标进程中利用这些漏洞时，不免都要和内存分配器打交道。

Android对libc的实现里（bionic）一开始采用了dlmalloc（诞生于1987，于2012停止更新），是一套非常成熟的解决方案。

dlmalloc通过segment和chunk管理内存，一块segment当中包含若干块chunk，当有比如malloc(0x300)的内存申请时，top chunk会划分出一块新内存：

不同大小的chunk可以连续排布，chunk中要包含metadata用于说明该chunk以及上一个chunk的大小，还有这两个chunk是否被使用：

当被free的chunk临近有已经被free的chunk时，两个chunk会合并。除了这些基本的管理方式，dlmalloc还使用bin来管理内存。相同大小且被free的chunk会以双链表形式存放在bin当中。bin中的内存遵循FIFO原则，下一次malloc时会优先从bin中取内存，选择大小不小于申请内存的一块返回。一共有32个small bins和32个tree bins，tree bins用于管理大内存，采用bitwise digital tree结构存储。dlmalloc的小内存分配原则总结如下：

计算对象大小

从small bin中找大小和目标相同的chunk返回

最近一次被释放的内存块是否合适

从small bin中找不小于目标的chunk返回

从tree bin中找大小不小于目标的chunk返回

如果仍然没有才从top chunk中划分新内存，或者创建新的segment

dlmalloc分配大内存时和上述流程相似，但要简单一些，直接从tree bin开始往下执行。当请求分配的内存大于64k时，malloc会调用mmap分配内存。

为了适应多线程，dlmalloc只是简单地在malloc开始和结束的位置加了一个lock，对多线程的应用性能影响还是比较大的。

jemalloc

Android目前已经开始转为使用jemalloc管理内存，相比dlmalloc，它的设计更利于多线程的运行环境。jemalloc在2014年五月，也就是Android 5.0开始引入，随后被设置为默认的分配选项。不过时至今日，Android 5和6的设备中仍能同时看到dlmalloc和jemalloc两者并存。

jemalloc管理内存时要复杂一些，最大的管理单元是arena，一共有两个，分别带有一个lock。不同线程尝试分配内存时，会平均分配至两个arena，只有在相同的arena中分配内存时才需要获取lock。arena中实际管理内存的是chunk和region，Android 7之前chunk为256k，之后32位系统改为512k，64位系统改为2MB。

每个chunk中会包含若干个run，run里面的region大小完全相同，而run的metadata会存放在chunk的header当中，这样region里只存放数据本身，不再有内存属性说明，malloc实际返回的是region的地址：

jemalloc也用bin来管理内存，共有39个bins。不同于dlmalloc的分配方法，jemalloc分配的内存完全来取自于bin。bin的metadata存放于arena的header中，39个bin还会存放当前正在使用的run。所有带有空闲region的run和闲置的chunk信息会被放置在红黑树结构当中，这样寻找空闲内存的复杂度可以控制在o(log(n))：

除此之外，为了优化多线程性能，jemalloc还采用了LIFO结构的tcache，存放近期被释放的region，每个线程的每个bin都对应一个tcache。存放在tcache中的内存并不会设置free标记位，并且由于tache附着于线程本身，使得大部分情况下从tcache分配内存时完全无需lock。

当tcache中存放的内存块用尽时会触发prefill，此时jemalloc会lock当前arena，并从当前run中取出一定数量的region存入tcache，使得它总有存量。

当tcache存满时（small bin是8，larger bin是20）会触发flush，tcache中存放的region才会被真正标记为释放。被释放的region才能被其他线程再次申请。

另外jemalloc本身也有GC，即有一个全局的计数器记录申请和释放，达到阈（读yu，四声）值时会触发一次特殊的释放，目标bin里tcaches中四分之三的region会被释放。下次GC时会轮到下一个bin。这是另一种真正释放region的方法。总结一下jemalloc的分配原则：

计算申请内存大小

从当前线程的tcache中找到合适的bin

如果tcache为空，就从当前的run中prefill一些region进来

如果当前run耗尽，就从低地址开始找到第一个非空run

如果现有run里没有足够的内存就分配一个新run

如果chunk里没有空间了就分配一个新chunk，同时分配新run并prefill一些region到tcache

对比两种内存管理方式如下：目前系统中大概30%使用dlmalloc，70%是jemalloc。

Exploitation

在一个漏洞利用的过程中，通常会基于这些前置的基础知识操纵堆内存。使得其按照我们预定的方式排布，如让特定的两个对象相邻，或者让一个对象重用另一个被释放的对象的内存，这些技巧统称为堆风水。

为了更好控制堆的状态，能够随时查看内存的分布情况是很有帮助的。下面三个工具非常好用，一个是去年INFILTRATE大会上Cencus的pyrsistence，另外一个是作者自己写的shade，最后就是NCC Group发布的libdlmalloc。以作者自己的工具为例，基于GDB的插件可以实时显示目标内存附近的区块状态。

不知道是不是开源的情况下反而更没有人去研究原理和可视化工具，Windows上反而很多年前就已经有各种堆内存可视化脚本了，几乎是每个调试器的标配功能。

Android可以说是目前主流系统中附加各类缓解措施最多的系统了，地址随机化，SELinux，进程沙盒等都让漏洞利用过程无比痛苦。下面以溢出为例，看看上述关于堆分配的知识能推导出哪些实际使用技巧。

堆溢出

在一个漏洞利用过程中，一般先要获取一些gadget，然后利用这些gadget扩大战果。gadget包括相对地址读/写、任意地址读/写，任意执行等。比如一个常见构造gadget的方法，让越界写的对象和一个带有数据指针+长度的对象相邻：

这样越界写后，临接对象就会成为一个读或写的gadget，这取决于临接对象能够提供哪些操作让我们使用。这一手应该早已经是脚本环境中漏洞利用的家常便饭了。实际在找这类gadget时可以直接在代码中找含有malloc，new，reallocs，std:：vector，std::string的对象。如果能够访问到他们的方法，就可能是一个潜在的gadget。

jemalloc分配内存的情况下，临接对象的选择条件更为苛刻，必须和溢出的对象大小对齐后相同，这样才有可能位于同一个run当中。

另外一个技巧是placeholder，即提前分配大量和目标对象大小相同的占位对象，然后释放他们勇于填充漏洞对象和gadget，这样很大几率会出现临接的情况，确保溢出行为有效：

如果能提前分配足够多的对象将已有内存占满，后面placeholder将有更大几率分配在临接连续的内存当中。

在分配目标内存和gadget等过程中，很有可能引入噪音，即未预期的对象也因此分配并占了一精心排布的内存。对于这些噪音，一个很好的去除方法是预先分配足够的小内存块。每次引入噪音前先释放一些小内存块，确保噪音被这些内存块收纳。

由于dlmalloc内存chunk中有metadata，溢出时应该把这些字段的大小也纳入考虑范围，而jemalloc的metadata存放在region之外所以不用考虑。

另外，有可能本来用于临接的对象和溢出对象由不同的thread创建，对于dlmalloc来说这没有什么影响，但jemalloc就比较棘手，不同的tcache很难保证二者临接。遇到这种情况最好的办法是触发flush或者GC，让目标区块转移到同一个线程当中。

还有一个问题是padding，jemalloc分配的对象由于region大小固定，region很可能比对象实际要大，这样溢出时就要考虑把中间没有用到的内存也覆盖掉。

最后的一个可能导致问题的是两个对象所属arena不同，不过这个问题很好解决，可以先创建比如30个线程，相邻的线程应该位于刚好不同的arena当中。然后每隔一个线程释放掉自身。由于平衡的诉求，接下来创建的15个线程都会位于相同的arena当中。

总结

在漏洞利用的学习过程中，可能一个漏洞案例只能学到一手技巧，即便看了很多例子，方法却大同小异。Shmarya Rubenstein把这些技巧集中展现，虽然有些抽象，但抽出来的才最像。Android堆分配原理弄清楚了，无论以后遇到什么利用场景都能自行找到解决方法，而不是广撒网似的找其他利用案例去揣度。

这些内存分配方面的技巧相当可贵，近来越来越多人分享时只提及讲案例本身，而且专挑奇案特例，且关键步骤一笔带过，留给听众的最多只是特例的解决方法，回过神发现自己遇到的问题与此稍有不同就无从下手。与之相比，Shmarya Rubenstein的分享应该回让想要深耕漏洞利用的研究人员大呼过瘾。

温馨提示：安全客近期会陆续发布更多MOSEC干货议题解读，敬请关注~

推荐阅读

default
CentOS 中 SWAP 分区的创建与管理

本文详细介绍了在 CentOS 系统中如何创建和管理 SWAP 分区，包括临时创建交换文件、永久性增加交换空间的方法，以及如何手动释放内存缓存。 ... [详细]

蜡笔小新 2024-11-21 19:01:54
ip
如何在Linux启动时自动运行Python程序

本文介绍了一种方法，通过在Linux启动时运行一个Python程序，该程序可以在PMOD OLED上显示PYNQ板的IP地址。 ... [详细]

蜡笔小新 2024-11-18 21:09:00
bit
oracle 对硬件环境要求,Oracle 10G数据库软硬件环境的要求

oracle 对硬件环境要求,Oracle 10G数据库软硬件环境的要求 ... [详细]

蜡笔小新 2024-11-18 15:17:57
io
大华股份2013届校园招聘软件算法类试题D卷

一、填空题（共17题，每题3分，总共51分）1.设有inta5,*b,**c,执行语句c&b,b&a后，**c的值为________答：5 ... [详细]

蜡笔小新 2024-11-17 11:01:27
header
深入探讨C++中的GCD函数与队列

在iOS开发中，多线程技术的应用非常广泛，能够高效地执行多个调度任务。本文将重点介绍GCD（Grand Central Dispatch）在多线程开发中的应用，包括其函数和队列的实现细节。 ... [详细]

蜡笔小新 2024-11-16 14:59:50
header
Pentaho Kettle 中 RowMetaInterface.writeMeta 方法详解与代码示例

本文详细介绍了 Pentaho Kettle 中 RowMetaInterface.writeMeta 方法的使用，并提供了多个代码示例，帮助开发者更好地理解和应用该方法。 ... [详细]

蜡笔小新 2024-11-13 16:21:25
java
Java高并发与多线程（二）：线程的实现方式详解

本文将深入探讨Java中线程的三种主要实现方式，包括继承Thread类、实现Runnable接口和实现Callable接口，并分析它们之间的异同及其应用场景。 ... [详细]

蜡笔小新 2024-11-12 14:31:23
ip
深入解析 Kubernetes 亲和性调度机制及其优化策略

在 Kubernetes 中，Pod 的调度通常由集群的自动调度策略决定，这些策略主要关注资源充足性和负载均衡。然而，在某些场景下，用户可能需要更精细地控制 Pod 的调度行为，例如将特定的服务（如 GitLab）部署到特定节点上，以提高性能或满足特定需求。本文深入解析了 Kubernetes 的亲和性调度机制，并探讨了多种优化策略，帮助用户实现更高效、更灵活的资源管理。 ... [详细]

蜡笔小新 2024-11-05 17:27:07
bit
无向图中的最小环问题

本问题涉及在给定的无向图中寻找一个至少包含三个节点的环，该环上的节点不重复，并且环上所有边的长度之和最小。目标是找到并输出这个最小环的具体方案。 ... [详细]

蜡笔小新 2024-11-21 15:01:34
ip
洛谷 P4009 汽车加油行驶问题解析

探讨了经典算法题目——汽车加油行驶问题，通过网络流和费用流的视角，深入解析了该问题的解决方案。本文将详细阐述如何利用最短路径算法解决这一问题，并提供详细的代码实现。 ... [详细]

蜡笔小新 2024-11-21 14:21:38
ip
深入解析WebP图片格式及其应用

随着互联网技术的发展，无论是PC端还是移动端，图片数据流量占据了很大比重。尤其在高分辨率屏幕普及的背景下，如何在保证图片质量的同时减少文件大小，成为了亟待解决的问题。本文将详细介绍Google推出的WebP图片格式，探讨其在实际项目中的应用及优化策略。 ... [详细]

蜡笔小新 2024-11-20 16:31:47
ip
HDU 2028: 扩展最小公倍数问题

本题要求计算一组正整数的最小公倍数（LCM）。输入包括多组测试数据，每组数据首先给出一个正整数n，随后是n个正整数。 ... [详细]

蜡笔小新 2024-11-20 15:52:47
bit
protobuf 使用心得：解析与编码陷阱

本文记录了一次在广告系统中使用protobuf进行数据交换时遇到的问题及其解决过程。通过这次经历，我们将探讨protobuf的特性和编码机制，帮助开发者避免类似的陷阱。 ... [详细]

蜡笔小新 2024-11-20 14:35:41
java
循环双链表中指定位置的元素插入方法

本文详细介绍了如何在循环双链表的指定位置插入新元素的方法，包括必要的步骤和代码示例。 ... [详细]

蜡笔小新 2024-11-20 06:48:26
runtime
Spring Boot 实战（一）：基础的CRUD操作详解

在《Spring Boot 实战（一）》中，详细介绍了基础的CRUD操作，涵盖创建、读取、更新和删除等核心功能，适合初学者快速掌握Spring Boot框架的应用开发技巧。 ... [详细]

蜡笔小新 2024-10-31 21:03:29

LookUp77

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章