ASM的tree api对匿名线程的hook操作详解_Android

作者：大帅哥鹏飞lyll | 来源：互联网 | 2023-09-08 14:06

这篇文章主要为大家介绍了ASM的tree api对匿名线程的hook操作详解，有需要的朋友可以借鉴参考下，希望能够有所帮助，祝大家多

背景

看完本章，你将会学习到用ASM的tree api进行对匿名线程的hook操作，同时也能够了解到asm相关的操作和背景知识介绍！对于ASM插桩来说，可能很多人都不陌生了，但是大多数可能都停留在core api上，对于现在市面上的一些插桩库，其实很多都用tree api进行编写了，因为tree api的简单与明了的特性，也越来越成为许多开源库的选择。（ASM有两套api类型，分别是core 和 tree）

ASM介绍

ASM其实就是一个可以编译字节码的工具，比如说我们日常开发会引入很多的类库对不对，又或者说我们的项目太大了，想修改某个点的时候，统一修改容易出错（比如隐私合规问题等），这个时候如果能有一个工具对生成后的class文件进行编辑的话，就非常方便我们进行后续的工作了。

本章主要介绍tree api，下文所说的ASM都是指tree api的操作哦，对于core api的介绍可以查看笔者曾经写过的文章Spider。

class文件

我们常说的class文件，其实从二进制的角度出发，无非是分成以下几个部分：

可以看到，一个class文件其实就是由上图中的多个部分组成，而ASM，就是把这些结构进行了更进一步的抽象，对于class文件，其实就是抽象成asm中的class node类

对于一个class文件来说，通过以下就可以进行唯一性识别，分别是：version（版本），access（作用域，比如private等修饰符），name（名称），signature（泛型签名），superName（父类），interfaces（实现的接口），fields（当前的属性），methoss（当前的方法）。所以如果想要修改一个class，我们修改对应的classNode即可

fields

属性，也是类非常重要的一部分，在字节码中，是如此定义的

对于一个属性，ASM将其抽象为FieldNode

对于一个属性field来说，通过以下就可以进行唯一性识别：access（作用域，跟class结构一样，比如private修饰），name（属性名称），desc（签名），signature（泛型签名），value（当前对应的数值）

methods

相比于属性，我们的方法结构更为复杂

相比于属性的单一，一个方法可能由多条指令组成而，一个方法的成功执行，也涉及到局部变量表跟操作数栈的配合。ASM中把方法抽象成这样一个定义 方法 = 方法头+方法体

方法头：即标识一个方法的基本属性，包括：access（作用域），name（方法名），desc（方法签名），signature（泛型签名），exceptions（方法可以抛出的异常）

方法体：相比于方法头，方法体的概念其实就比较简单了，其实方法体就是方法的各条指令的集合，主要包括instrutions（方法的指令集），tryCatchBlocks（异常的节点集），maxStack（操作数栈的最大深度），maxLocals（本地变量表的最大长度）

可以看到，方法其中的InsnList对象，是特指方法的指令集的抽象，这里继续讲解

InsnList

public class InsnList implements Iterable { private int size; private AbstractInsnNode firstInsn; private AbstractInsnNode lastInsn; AbstractInsnNode[] cache; ...

可以看到，主要的对象就是firstInsn，与lastInsn，代表着方法指令集的头指令与尾指令，每一个指令其实都被抽象成了AbstractInsnNode的子类，AbstractInsnNode定义了一条指令最基础的信息，我们可以看看这个类的子类

这里我们再看看我们最常用的methodInsnNode

public class MethodInsnNode extends AbstractInsnNode { /** * The internal name of the method's owner class (see {@link * org.objectweb.asm.Type#getInternalName()}). * *

For methods of arrays, e.g., {@code clone()}, the array type descriptor. */ public String owner; /** The method's name. */ public String name; /** The method's descriptor (see {@link org.objectweb.asm.Type}). */ public String desc; /** Whether the method's owner class if an interface. */ public boolean itf;

这个就是一个普通方法指令最根本的定义了，owner（方法调用者），name（方法名称），desc（方法签名）等等，他们都有着相似的结构，这个也是我们接下来会实战的重点。

Signature

嗯！我们最后介绍一下这个神奇的东西！不知道大家在看介绍的时候，有没有一脸疑惑，这个我解释为泛型签名，这个跟desc（函数签名）参数有什么区别呢？当然，这个不仅仅在函数上有出现，在属性，类的结构上都有出现！是不是非常神奇！

其实Signature属性是在JDK 1.5发布后增加到了Class文件规范之中,它是一个可选的定长属性, 可以出现于类、属性表和方法表结构的属性表中。我们想想看，jdk1.5究竟是发生什么了！其实就是对泛型的支持，那么1.5版本之前的sdk怎么办，是不是也要进行兼容了！所以java标准组就想到了一个折中的方法，就是泛型擦除，泛型信息编译(类型变量、参数化类型)之后都通通被擦除掉，以此来进行对前者的兼容。那么这又导致了一个问题，擦除的泛型信息有时候正是我们所需要的，所以Signature就出现了，把这些泛型信息存储在这里，以提供运行时反射等类型信息的获取！实际上可以看到，我们大部分的方法或者属性这个值都为null，只有存在泛型定义的时候，泛型的信息才会被存储在Signature里面

实战部分

好啦！有了理论基础，我们也该去实战一下，才不是口水文！以我们线程优化为例子，在工作项目中，或者在老项目中，可能存在大多数不规范的线程创建操作，比如直接new Thread等等，这样生成的线程名就会被赋予默认的名字，我们这里先把这类线程叫做“匿名线程”！当然！并不是说这个线程没有名字，而是线程名一般是“Thread -1 ”这种没有额外信息含量的名字，这样对我们后期的线程维护会带来很大的干扰，时间长了，可能就存在大多数这种匿名线程，有可能带来线程创建的oom crash！所以我们的目标是，给这些线程赋予“名字”，即调用者的名字

解决“匿名”Thread

为了达到这个目的，我们需要对thread的构造有一个了解，当然Thread的构造函数有很多，我们举几个例子

public Thread(String name) { init(null, null, name, 0); }

public Thread(ThreadGroup group, String name) { init(group, null, name, 0); }

可以看到，我们Thread的多个构造函数，最后一个参数都是name，即Thread的名称，所以我们的hook点是，能不能在Thread的构造过程，调用到有name的构造函数是不是就可以实现我们的目的了！我们再看一下普通的new Thread（）字节码

那么我们怎么才能把new Thread（）的方式变成 new Thread（name）的方式呢？很简单！只需要我们把init的这条指令变成有参的方式就可以了，怎么改变呢？其实就是改变desc！方法签名即可，因为一个方法的调用，就是依据方法签名进行匹配的。我们在函数后面添加一个string的参数即可

node是methidInsnNode def desc = "${node.desc.substring(0, r)}Ljava/lang/String;${node.desc.substring(r)}" node.desc = desc

那么这样我们就可以完成了吗，非也非也，我们只是给方法签名对加了一个参数，但是这并不代表我们函数就是这么运行的！因为方法参数的参数列表中的string参数我们还没放入操作数栈呢！那么我们就可以构造一个string参数放入操作数栈中，这个指令就是ldc指令啦！asm为我们提供了一个类是LdcInsnNode，我们可以创建一个该类对象即可，构造参数需要传入一个字符串，那么这个就可以把当前方法的owner（解释如上，调用者名称）放进去了，是不是就达到我们想要的目的了！好啦！东西我们又了，我们要在哪里插入呢？

所以我们的目标很明确，就是在init指令调用前插入即可，asm也提供了insertBefore方法，提供在某个指令前插入的便捷操作。

method.instructions.insertBefore( node, new LdcInsnNode(klass.name) )

我们看看最后插入后的字节码

当然，我们插入asm代码一般是在android提供给我们的Transform阶段进行的（agp新版有改变，但是大体工作流程一致），所以我们在transfrom中为了避免对类的过度干扰，我们还需要把不必要的阶段提早剔除！比如我们只在new Thread操作，那么就把非Opcodes.INVOKESPECIAL的操作过滤即可。还有就是非init阶段（即非构造函数阶段）或者owner不为Thread类就可以提前过滤，不参与更改即可。

那我们看到完整的代码（需要在Transform中执行的代码）

static void transform(ClassNode klass) { println("ThreadTransformUtils") // 这里只处理Thread klass.methods?.forEach { methodNode -> methodNode.instructions.each { // 如果是构造函数才继续进行 if (it.opcode == Opcodes.INVOKESPECIAL) { transformInvokeSpecial((MethodInsnNode) it, klass, methodNode) } } } } private static void transformInvokeSpecial(MethodInsnNode node, ClassNode klass, MethodNode method) { // 如果不是构造函数，就直接退出 if (node.name != "" || node.owner != THREAD) { return } println("transformInvokeSpecial") transformThreadInvokeSpecial(node, klass, method) } private static void transformThreadInvokeSpecial( MethodInsnNode node, ClassNode klass, MethodNode method ) { switch (node.desc) { // Thread() case "()V": // Thread(Runnable) case "(Ljava/lang/Runnable;)V": method.instructions.insertBefore( node, new LdcInsnNode(klass.name) ) def r = node.desc.lastIndexOf(')') def desc = "${node.desc.substring(0, r)}Ljava/lang/String;${node.desc.substring(r)}" // println(" + $SHADOW_THREAD.makeThreadName(Ljava/lang/String;Ljava/lang/String;) => ${this.owner}.${this.name}${this.desc}: ${klass.name}.${method.name}${method.desc}") println(" * ${node.owner}.${node.name}${node.desc} => ${node.owner}.${node.name}$desc: ${klass.name}.${method.name}${method.desc}") node.desc = desc break } }

最后

看到这里，应该可以了解到asm tree api相关用法与实战了，希望能有所帮助！

推荐阅读

int
Eclipse JFace Text框架中IDocument接口的getNumberOfLines方法详解与编程实例

Eclipse JFace Text框架中IDocument接口的getNumberOfLines方法详解与编程实例 ... [详细]

蜡笔小新 2024-11-02 20:35:45
int
优化后的标题：深入探讨网关安全：将微服务升级为OAuth2资源服务器的最佳实践

本文深入探讨了如何将微服务升级为OAuth2资源服务器，以订单服务为例，详细介绍了在POM文件中添加 `spring-cloud-starter-oauth2` 依赖，并配置Spring Security以实现对微服务的保护。通过这一过程，不仅增强了系统的安全性，还提高了资源访问的可控性和灵活性。文章还讨论了最佳实践，包括如何配置OAuth2客户端和资源服务器，以及如何处理常见的安全问题和错误。 ... [详细]

蜡笔小新 2024-11-09 16:13:27
int
Android中将独立SO库封装进JAR包并实现SO库的加载与调用

在Android开发中，将独立的SO库封装进JAR包并实现其加载与调用是一个常见的需求。本文详细介绍了如何将SO库嵌入到JAR包中，并确保在外部应用调用该JAR包时能够正确加载和使用这些SO库。通过这种方式，开发者可以更方便地管理和分发包含原生代码的库文件，提高开发效率和代码复用性。文章还探讨了常见的问题及其解决方案，帮助开发者避免在实际应用中遇到的坑。 ... [详细]

蜡笔小新 2024-11-07 14:28:55
int
如何高效启动大数据应用之旅？

在前一篇文章中，我探讨了大数据的定义及其与数据挖掘的区别。本文将重点介绍如何高效启动大数据应用项目，涵盖关键步骤和最佳实践，帮助读者快速踏上大数据之旅。 ... [详细]

蜡笔小新 2024-11-04 18:30:38
int
Java类加载机制详解：第二阶段深入解析

类加载机制是Java虚拟机运行时的重要组成部分。本文深入解析了类加载过程的第二阶段，详细阐述了从类被加载到虚拟机内存开始，直至其从内存中卸载的整个生命周期。这一过程中，类经历了加载（Loading）、验证（Verification）等多个关键步骤。通过具体的实例和代码示例，本文探讨了每个阶段的具体操作和潜在问题，帮助读者全面理解类加载机制的内部运作。 ... [详细]

蜡笔小新 2024-11-11 11:42:38
int
C#编程指南：利用ASP.NET和JavaScript实现带有Fingerprint功能的Web应用登录系统

本指南介绍了如何在ASP.NET Web应用程序中利用C#和JavaScript实现基于指纹识别的登录系统。通过集成指纹识别技术，用户无需输入传统的登录ID即可完成身份验证，从而提升用户体验和安全性。我们将详细探讨如何配置和部署这一功能，确保系统的稳定性和可靠性。 ... [详细]

蜡笔小新 2024-11-09 18:14:37
int
Python 伦理黑客技术：深入探讨后门攻击（第三部分）

在《Python 伦理黑客技术：深入探讨后门攻击（第三部分）》中，作者详细分析了后门攻击中的Socket问题。由于TCP协议基于流，难以确定消息批次的结束点，这给后门攻击的实现带来了挑战。为了解决这一问题，文章提出了一系列有效的技术方案，包括使用特定的分隔符和长度前缀，以确保数据包的准确传输和解析。这些方法不仅提高了攻击的隐蔽性和可靠性，还为安全研究人员提供了宝贵的参考。 ... [详细]

蜡笔小新 2024-11-09 16:33:02
int
Ave V8 JavaScript 引擎：持续优化与创新

V8不仅是一款著名的八缸发动机，广泛应用于道奇Charger、宾利Continental GT和BossHoss摩托车中。自2008年以来，作为Chromium项目的一部分，V8 JavaScript引擎在性能优化和技术创新方面取得了显著进展。该引擎通过先进的编译技术和高效的垃圾回收机制，显著提升了JavaScript的执行效率，为现代Web应用提供了强大的支持。持续的优化和创新使得V8在处理复杂计算和大规模数据时表现更加出色，成为众多开发者和企业的首选。 ... [详细]

蜡笔小新 2024-11-09 15:56:40
int
深入解析CAS机制：全面替代传统锁的底层原理与应用

本文深入探讨了CAS（Compare-and-Swap）机制，分析了其作为传统锁的替代方案在并发控制中的优势与原理。CAS通过原子操作确保数据的一致性，避免了传统锁带来的性能瓶颈和死锁问题。文章详细解析了CAS的工作机制，并结合实际应用场景，展示了其在高并发环境下的高效性和可靠性。 ... [详细]

蜡笔小新 2024-11-09 15:45:07
int
Java 8编程的四大高级技巧解析与应用

在多年使用Java 8进行新应用开发和现有应用迁移的过程中，我总结了一些非常实用的技术技巧。虽然我不赞同“最佳实践”这一术语，因为它可能暗示了通用的解决方案，但这些技巧在实际项目中确实能够显著提升开发效率和代码质量。本文将深入解析并探讨这四大高级技巧的具体应用，帮助开发者更好地利用Java 8的强大功能。 ... [详细]

蜡笔小新 2024-11-08 18:35:48
int
使用ObjectMapper实现JSON与JavaBean的高效转换

本文介绍了如何利用ObjectMapper实现JSON与JavaBean之间的高效转换。ObjectMapper是Jackson库的核心组件，能够便捷地将Java对象序列化为JSON格式，并支持从JSON、XML以及文件等多种数据源反序列化为Java对象。此外，还探讨了在实际应用中如何优化转换性能，以提升系统整体效率。 ... [详细]

蜡笔小新 2024-11-08 13:21:48
int
深入解析 Android 中 EditText 的 getLayoutParams 方法及其代码应用实例

深入解析 Android 中 EditText 的 getLayoutParams 方法及其代码应用实例 ... [详细]

蜡笔小新 2024-11-07 20:50:46
int
清华大学出版社 | 杨丹：基于MATLAB机器视觉的黑色素瘤皮肤癌检测技术及源代码分析（第1689期）

清华大学出版社 | 杨丹：基于MATLAB机器视觉的黑色素瘤皮肤癌检测技术及源代码分析（第1689期） ... [详细]

蜡笔小新 2024-11-07 13:30:09
int
深入解析 Android TextView 中 getImeActionLabel() 方法的使用与代码示例

深入解析 Android TextView 中 getImeActionLabel() 方法的使用与代码示例 ... [详细]

蜡笔小新 2024-11-04 19:48:30
version
Ant JAR 执行错误：Java I/O 异常 — 无法启动程序 ${aAPT}，错误代码 2，指定文件或目录不存在

在尝试为 Unity 编译一个简单的 Java 库时，运行 `ant jar` 命令后遇到了 Java I/O 异常。具体错误信息为“无法启动程序 ${aAPT}，错误代码 2”，这通常表示指定的文件或目录不存在。此问题可能是由于环境配置不正确或路径设置有误导致的。建议检查相关路径和环境变量，确保所有依赖项都已正确安装和配置。 ... [详细]

蜡笔小新 2024-11-04 16:40:40