当前位置: 开发笔记 > 编程语言 > 正文

基于bionicc分析线程的一生

作者：mobiledu2502853397 | 来源：互联网 | 2024-10-16 17:35

1.概述和问题进程和线程操作系统基础和重要的机制，从源码角度理解进程和线程的区别对于理解操作系统的基本原理非常有帮助，同时进程和线程的创建又是通过系统

1.概述和问题

进程和线程操作系统基础和重要的机制，从源码角度理解进程和线程的区别对于理解操作系统的基本原理非常有帮助，同时进程和线程的创建又是通过系统调用实现，两者结合起来理解可以融会贯通。

问题：

进程和线程从源码实现角度看有什么不同？
一次"fork"调用为什么子进程和父进程返回值不同？一个函数有两个返回值？
pthread_create创建线程会指定一个线程的入口函数，怎么实现线程运行后的入口是该函数？另外线程有单独的线程栈（区别于父进程的栈），怎么给该入口函数传参？

2.系统调用基本流程

arm32系统调用是通过swi(svc)指令触发，且r7存储器存放系统调用号，进程和线程创建基本流程总结如下：

软件调用swi指令。
cpu跳转到中断向量表的vector_swi，保存硬件上下文，并且跳转到对应的系统调用clone。
clone系统调用执行，根据参数不同实现创建进程或者线程。
从内核空间返回用户空间，恢复硬件上下文(寄存器）。

3. 线程和线程创建（android bionic c库实现为例）

3.1 线程创建pthread_create

代码路径：bionic/libc/bionic/pthread_create.cpp

__BIONIC_WEAK_FOR_NATIVE_BRIDGE int pthread_create(pthread_t* thread_out, pthread_attr_t const* attr,void* (*start_routine)(void*), void* arg) {ErrnoRestorer errno_restorer;pthread_attr_t thread_attr;...pthread_internal_t* thread = NULL;void* child_stack = NULL;int result = __allocate_thread(&thread_attr, &thread, &child_stack);if (result != 0) {return result;}thread->startup_handshake_lock.init(false);thread->startup_handshake_lock.lock();thread->start_routine = start_routine;thread->start_routine_arg = arg;thread->set_cached_pid(getpid());int flags = CLONE_VM | CLONE_FS | CLONE_FILES | CLONE_SIGHAND | CLONE_THREAD | CLONE_SYSVSEM |CLONE_SETTLS | CLONE_PARENT_SETTID | CLONE_CHILD_CLEARTID;void* tls = reinterpret_cast(thread->tls);int rc = clone(__pthread_start, child_stack, flags, thread, &(thread->tid), tls, &(thread->tid));...return 0; }

__allocate_thread分配内存，创建线程栈和pthread的数据结构
clone开始创建线程。注意clone函数设置了线程运行的入口函数：__pthread_start。flags设置了CLONE_VM, CLONE_FS等各种标志。比如设置CLONE_VM意味着线程的mm_struct直接指向了父进程的mm_struct，没有单独分配内存创建独立的mm_struct，而进程创建的时候未指定CLONE_VM，通过allocate_mm分配子进程的mm_struct结构体，只不过该结构体的内容memcpy复制自父进程。

3.2 进程创建fork

__BIONIC_WEAK_FOR_NATIVE_BRIDGE int fork() {__bionic_atfork_run_prepare();pthread_internal_t* self = __get_thread();int result = clone(nullptr,nullptr,(CLONE_CHILD_SETTID | CLONE_CHILD_CLEARTID | SIGCHLD),nullptr,nullptr,nullptr,&(self->tid));if (result == 0) {// Update the cached pid, since clone() will not set it directly (as// self->tid is updated by the kernel).self->set_cached_pid(gettid());__bionic_atfork_run_child();} else {__bionic_atfork_run_parent();}return result; }

进程创建比线程创建相对简单，调用clone第一个参数入口函数和第二个参数childstack为nullptr，flags只指定了CLONE_CHILD_SETTID | CLONE_CHILD_CLEARTID | SIGCHLD。

3.3 clone函数

__BIONIC_WEAK_FOR_NATIVE_BRIDGE int clone(int (*fn)(void*), void* child_stack, int flags, void* arg, ...) {...// Actually do the clone.int clone_result;if (fn != nullptr) {clone_result = __bionic_clone(flags, child_stack, parent_tid, new_tls, child_tid, fn, arg);} else { #if defined(__x86_64__) // sys_clone&＃39;s last two arguments are flipped on x86-64.clone_result = syscall(__NR_clone, flags, child_stack, parent_tid, child_tid, new_tls); #elseclone_result = syscall(__NR_clone, flags, child_stack, parent_tid, new_tls, child_tid); #endif}...return clone_result; }

线程创建由于fn != nullptr，进入__bionic_clone函数，该函数由汇编实现，通过swi指令进入系统调用。
进程创建通过syscall函数进入NR_clone系统调用，syscall函数也是由汇编实现，通过swi进入系统调用。
注意swi EABI下r7寄存器存储系统调用号。

3.4 __bionic_clone和syscall函数

__bionic_clone函数：

ENTRY_PRIVATE(__bionic_clone)mov ip, sp# save registers to parent stackstmfd sp!, {r4, r5, r6, r7}.cfi_def_cfa_offset 16.cfi_rel_offset r4, 0.cfi_rel_offset r5, 4.cfi_rel_offset r6, 8.cfi_rel_offset r7, 12# load extra parametersldmfd ip, {r4, r5, r6}# Push &＃39;fn&＃39; and &＃39;arg&＃39; onto the child stack.stmdb r1!, {r5, r6}# Make the system call.ldr r7, =__NR_cloneswi #0# Are we the child?movs r0, r0beq .L_bc_child# In the parent, reload saved registers then either return or set errno.ldmfd sp!, {r4, r5, r6, r7}cmn r0, #(MAX_ERRNO + 1)bxls lrneg r0, r0b __set_errno_internal.L_bc_child:# Setting lr to 0 will make the unwinder stop at __start_thread.mov lr, #0# Call __start_thread with the &＃39;fn&＃39; and &＃39;arg&＃39; we stored on the child stack.pop {r0, r1} @从线程栈中取fn和arg参数放入r0,r1，这样实现给__start_thread传参。b __start_thread END(__bionic_clone)

注意：由于系统调用会从用户态切换到内核态，用户态和内核态栈是不同的，所以无法使用栈传参，只能使用寄存器传参数，系统调用arm32上可以使用r0-r6这7个寄存器传参。

问题：child返回值为什么0：

int copy_thread(unsigned long clone_flags, unsigned long stack_start,unsigned long stk_sz, struct task_struct *p) {struct thread_info *thread = task_thread_info(p);struct pt_regs *childregs = task_pt_regs(p);memset(&thread->cpu_context, 0, sizeof(struct cpu_context_save));#ifdef CONFIG_CPU_USE_DOMAINS/** Copy the initial value of the domain access control register* from the current thread: thread->addr_limit will have been* copied from the current thread via setup_thread_stack() in* kernel/fork.c*/thread->cpu_domain = get_domain(); #endif//非内核线程if (likely(!(p->flags & PF_KTHREAD))) {*childregs = *current_pt_regs();childregs->ARM_r0 = 0;if (stack_start)childregs->ARM_sp = stack_start;} else {//内核线程memset(childregs, 0, sizeof(struct pt_regs));thread->cpu_context.r4 = stk_sz;thread->cpu_context.r5 = stack_start;childregs->ARM_cpsr = SVC_MODE;}... }

childregs->ARM_sp = stack_start设置了线程的sp寄存器。同时可以看到childregs->ARM_r0 = 0，这就是子进程为什么返回值是0的原因。

问题： pop {r0, r1} @从线程栈中取fn和arg参数放入r0,r1，怎么实现的？

pop能将fn和arg值出栈写入r0和r1寄存器的前提是，从系统调用返回执行到L_bc_child这个分支时，cpu的sp寄存器指向了线程栈，这是哪里设置的呢？copy_thread的childregs->ARM_sp = stack_start，图示如下：

syscall函数：

ENTRY(syscall)mov ip, sp @sp存储入ip，因为后续入栈要修改sp。stmfd sp!, {r4, r5, r6, r7} @寄存器入栈.cfi_def_cfa_offset 16.cfi_rel_offset r4, 0.cfi_rel_offset r5, 4.cfi_rel_offset r6, 8.cfi_rel_offset r7, 12mov r7, r0 @系统调用号存入r7寄存器mov r0, r1 @arm使用r0传第一个参数mov r1, r2 @arm使用r1传第二个参数mov r2, r3 @arm使用r2传第三个餐宿ldmfd ip, {r3, r4, r5, r6} @读取第syscall函数的第5，6，7，8个参数到寄存器中swi #0 @现在r0 - r7都已设置好，可以进入系统调用。ldmfd sp!, {r4, r5, r6, r7}.cfi_def_cfa_offset 0cmn r0, #(MAX_ERRNO + 1)bxls lrneg r0, r0b __set_errno_internal END(syscall)

调用swi指令cpu会切换模式，由于两个模式之间使用的sp不同，所以系统调用参数只能使用寄存器。不同的cpu架构使用的寄存器不同：

目前默认的内核配置时arm/EABI，即使用r0-r6传参。

3.5 中断向量表

swi调用进入系统调用，进入vector_swi代码流程：

.align 5 ENTRY(vector_swi)sub sp, sp, #PT_REGS_SIZEstmia sp, {r0 - r12} @ Calling r0 - r12ARM( add r8, sp, #S_PC )ARM( stmdb r8, {sp, lr}^ ) @ Calling sp, lrTHUMB( mov r8, sp )THUMB( store_user_sp_lr r8, r10, S_SP ) @ calling sp, lrmrs saved_psr, spsr @ called from non-FIQ mode, so ok.TRACE( mov saved_pc, lr )str saved_pc, [sp, #S_PC] @ Save calling PCstr saved_psr, [sp, #S_PSR] @ Save CPSRstr r0, [sp, #S_OLD_R0] @ Save OLD_R0zero_fpalignment_trap r10, ip, __cr_alignmentasm_trace_hardirqs_on save=0enable_irq_notracect_user_exit save=0/** Get the system call number.*/#if defined(CONFIG_OABI_COMPAT)/** If we have CONFIG_OABI_COMPAT then we need to look at the swi* value to determine if it is an EABI or an old ABI call.*/ARM_BE8(rev r10, r10) @ little endian instruction#elif defined(CONFIG_AEABI)/** Pure EABI user space always put syscall number into scno (r7).*/ #elif defined(CONFIG_ARM_THUMB)/* Legacy ABI only, possibly thumb mode. */tst saved_psr, #PSR_T_BIT @ this is SPSR from save_user_regsaddne scno, r7, #__NR_SYSCALL_BASE @ put OS number inUSER( ldreq scno, [saved_pc, #-4] )#else/* Legacy ABI only. */USER( ldr scno, [saved_pc, #-4] ) @ get SWI instruction #endif/* saved_psr and saved_pc are now dead */uaccess_disable tbladr tbl, sys_call_table @ load syscall table pointerget_thread_info tsk/** Reload the registers that may have been corrupted on entry to* the syscall assembly (by tracing or context tracking.)*/TRACE( ldmia sp, {r0 - r3} )local_restart:ldr r10, [tsk, #TI_FLAGS] @ check for syscall tracingstmdb sp!, {r4, r5} @ push fifth and sixth argstst r10, #_TIF_SYSCALL_WORK @ are we tracing syscalls?bne __sys_traceinvoke_syscall tbl, scno, r10, ret_fast_syscalladd r1, sp, #S_OFF 2: cmp scno, #(__ARM_NR_BASE - __NR_SYSCALL_BASE)eor r0, scno, #__NR_SYSCALL_BASE @ put OS number backbcs arm_syscallmov why, #0 @ no longer a real syscallb sys_ni_syscall @ not private funcENDPROC(vector_swi)

核心逻辑：

保存硬件上下文（寄存器）
从r7获取系统调用号
invoke_syscall进入对应的系统调用函数，比如进程/线程创建进入SyS_clone函数。注意invoke_syscall有个参数ret_fast_syscall，系统调用执行完，调用ret_fast_syscall从内核态返回用户态，恢复硬件上下文（寄存器）

invoke_syscall函数：

.macro invoke_syscall, table, nr, tmp, ret, reload=0mov \tmp, \nrcmp \tmp, #NR_syscalls @ check upper syscall limitmovcs \tmp, #0csdbbadr lr, \ret @ return address.if \reloadadd r1, sp, #S_R0 + S_OFF @ pointer to regsldmccia r1, {r0 - r6} @ reload r0-r6stmccia sp, {r4, r5} @ update stack arguments.endifldrcc pc, [\table, \tmp, lsl #2] @ call sys_* routine.endm

badr lr, \ret(badr是个宏定义，本质是adr指令），将lr寄存器设置为ret_fast_syscall，系统调用执行完就会跳转到ret_fast_syscall函数执行。
ldrcc pc[\table, \tmp, lsl #2] 如注释跳转到sys_*对应的系统调用函数。

ret_fast_syscall:

ret_fast_syscall:UNWIND(.fnstart )UNWIND(.cantunwind )str r0, [sp, #S_R0 + S_OFF]! @ save returned r0disable_irq_notrace @ disable interruptsldr r2, [tsk, #TI_ADDR_LIMIT]cmp r2, #TASK_SIZEblne addr_limit_check_failedldr r1, [tsk, #TI_FLAGS] @ re-check for syscall tracingtst r1, #_TIF_SYSCALL_WORK | _TIF_WORK_MASKbeq no_work_pendingUNWIND(.fnend )

进入no_work_pending调用restore_user_regs恢复硬件上下文。

4.sys_clone系统调用实现

clone系统调用实现最重要的是调用copy_process来为子进程或者线程创建task_strcut数据结构,重点来看copy_process实现，主要是负责父进程的各种资源，上面介绍的copy_thread就是clone系统调用里面一个函数，后续会有文章更仔细的分析copy_process实现，本文不再展开。

5.系统调用返回

父进程（执行clone的原进程）返回路径：

系统调用执行完继续执行，父进程（执行clone的进程）是按正常的系统调用的返回路径ret_fast_syscall返回，而子进程（或者线程）返回的路径是ret_from_frok，因为copy_thread中将thread->cpu_context.pc = (unsigned long)ret_from_fork;这样线程调度时候时候，将thread_info->cpu_context值弹出到cpu寄存器之后，线程就从ret_from_fork开始执行返回，图示流程参见3.4小节中图片。

子进程（线程）第一次执行：

在进程切换时，switch_to()函数会完成进程硬件上下文的切换，即把下一个进程（next进程）的cpu_context数据结构保存的内容恢复到处理器的寄存器中，从而完成进程的切换。此时，处理器开始运行next进程了。根据PC寄存器的值，处理器会从ret_from_fork汇编函数里开始执行，新进程的执行过程如图所示。为什么要把新建线程的首次执行入口设置成ret_from_fork，而不是直接像父进程一样直接ret_fast_syscall，主要是原因是还有一种情况是内核线程要特殊处理，所以返回的时候要判定是否是内核线程，如果是非内核线程才返回用户空间。

父进程和新线程返回用户空间之后，回到__bionic_clone中：

// pid_t __bionic_clone(int flags, void* child_stack, pid_t* parent_tid, void* tls, pid_t* child_tid, int (*fn)(void*), void* arg); ENTRY_PRIVATE(__bionic_clone)mov ip, sp# save registers to parent stackstmfd sp!, {r4, r5, r6, r7}.cfi_def_cfa_offset 16.cfi_rel_offset r4, 0.cfi_rel_offset r5, 4.cfi_rel_offset r6, 8.cfi_rel_offset r7, 12# load extra parametersldmfd ip, {r4, r5, r6}# Push &＃39;fn&＃39; and &＃39;arg&＃39; onto the child stack.stmdb r1!, {r5, r6}# Make the system call.ldr r7, =__NR_cloneswi #0# Are we the child?movs r0, r0beq .L_bc_child# In the parent, reload saved registers then either return or set errno.ldmfd sp!, {r4, r5, r6, r7}cmn r0, #(MAX_ERRNO + 1)bxls lrneg r0, r0b __set_errno_internal.L_bc_child:# Setting lr to 0 will make the unwinder stop at __start_thread.mov lr, #0# Call __start_thread with the &＃39;fn&＃39; and &＃39;arg&＃39; we stored on the child stack.pop {r0, r1}b __start_thread END(__bionic_clone)

此时如果r0寄存器的值是0，代表是子线程，执行.L_bc_child分支，将fn和arg参数弹出，调用__start_thread函数，这个函数会执行pthread_create中指定的入口参数

// Called from the __bionic_clone assembler to call the thread function then exit. extern "C" __LIBC_HIDDEN__ void __start_thread(int (*fn)(void*), void* arg) {BIONIC_STOP_UNWIND;pthread_internal_t* self = __get_thread();if (self && self->tid == -1) {self->tid = syscall(__NR_gettid);}int status = (*fn)(arg);__exit(status); }

推荐阅读

io
UE4 中的距离场技术详解

本文将深入探讨 Unreal Engine 4 (UE4) 中的距离场技术，包括其原理、实现细节以及在渲染中的应用。距离场技术在现代游戏引擎中用于提高光照和阴影的效果，尤其是在处理复杂几何形状时。文章将结合具体代码示例，帮助读者更好地理解和应用这一技术。 ... [详细]

蜡笔小新 2024-11-19 18:21:03
main
编写有趣的VBScript恶作剧脚本

本文将介绍如何编写一些有趣的VBScript脚本，这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例，帮助您了解VBScript的基本语法和功能。 ... [详细]

蜡笔小新 2024-12-28 09:46:23
io
Node.js 本地扩展开发指南

本文详细介绍了如何在 Windows 环境下使用 node-gyp 工具进行 Node.js 本地扩展的编译和配置，涵盖从环境搭建到代码实现的全过程。 ... [详细]

蜡笔小新 2024-12-25 10:35:17
main
Java中this关键字的使用及指针概念的理解

在Java中，this是一个引用当前对象的关键字。如何通过this获取并显示其所指向的对象的属性和方法？本文详细解释了this的用法及其背后的原理。 ... [详细]

蜡笔小新 2024-12-24 13:20:44
object
JavaScript 基础语法指南

本文详细介绍了 JavaScript 的基础语法，包括变量、数据类型、运算符、语句和函数等内容，旨在为初学者提供全面的入门指导。 ... [详细]

蜡笔小新 2024-12-23 10:54:44
main
优化C++项目中的JSON处理：选择高性能的RapidJSON库

在高并发需求的C++项目中，我们最初选择了JsonCpp进行JSON解析和序列化。然而，在处理大数据量时，JsonCpp频繁抛出异常，尤其是在多线程环境下问题更为突出。通过分析发现，旧版本的JsonCpp存在多线程安全性和性能瓶颈。经过评估，我们最终选择了RapidJSON作为替代方案，并实现了显著的性能提升。 ... [详细]

蜡笔小新 2024-12-21 18:13:59
io
ElasticSearch 集群监控与优化

本文详细介绍了如何有效地监控 ElasticSearch 集群，涵盖了关键性能指标、集群健康状况、统计信息以及内存和垃圾回收的监控方法。 ... [详细]

蜡笔小新 2024-12-21 13:43:04
io
深入剖析JVM垃圾回收机制

本文详细探讨了Java虚拟机（JVM）中的垃圾回收机制，包括其意义、对象判定方法、引用类型、常见垃圾收集算法以及各种垃圾收集器的特点和工作原理。通过理解这些内容，开发人员可以更好地优化内存管理和程序性能。 ... [详细]

蜡笔小新 2024-12-20 17:24:41
main
Linux线程中私有数据的管理与保护

本文探讨了Linux环境下线程私有数据(Thread-Specific Data, TSD)的概念及其重要性，介绍了如何通过TSD技术避免多线程间全局变量冲突的问题，并提供了具体的实现方法和示例代码。 ... [详细]

蜡笔小新 2024-11-23 13:45:37
main
Linux设备驱动程序：异步时间操作与调度机制

本文介绍了Linux内核中的几种异步延迟操作方法，包括内核定时器、tasklet机制和工作队列。这些机制允许在未来的某个时间点执行任务，而无需阻塞当前线程，从而提高系统的响应性和效率。 ... [详细]

蜡笔小新 2024-12-26 08:55:03
io
MySQL索引详解与优化

本文深入探讨了MySQL中的索引机制，包括索引的基本概念、优势与劣势、分类及其实现原理，并详细介绍了索引的使用场景和优化技巧。通过具体示例，帮助读者更好地理解和应用索引以提升数据库性能。 ... [详细]

蜡笔小新 2024-12-25 19:52:47
blob
基于KVM的SRIOV直通配置及性能测试

SRIOV介绍、VF直通配置，以及包转发率性能测试小慢哥的原创文章，欢迎转载目录?1.SRIOV介绍?2.环境说明?3.开启SRIOV?4.生成VF?5.VF ... [详细]

蜡笔小新 2024-12-25 19:26:39
main
解决JAX-WS动态客户端工厂弃用问题并迁移到XFire

在处理Java项目中的JAR包冲突时，我们遇到了JaxWsDynamicClientFactory被弃用的问题，并成功将其迁移到org.codehaus.xfire.client。本文详细介绍了这一过程及解决方案。 ... [详细]

蜡笔小新 2024-12-25 18:48:34
version
如何用ping测试网络连接

如何使用Ping命令来测试网络连接？当网卡安装和有关参数配置完成后，可以使用ping命令来测试一下网络是否连接成功。以winXP为例1、打开XP下DOS窗口具体操作是点击“开始”菜 ... [详细]

蜡笔小新 2024-12-22 07:41:31
io
深入解析SpringMVC核心组件：DispatcherServlet的工作原理

本文详细探讨了SpringMVC的核心组件——DispatcherServlet的运作机制，旨在帮助有一定Java和Spring基础的开发人员理解HTTP请求是如何被映射到Controller并执行的。文章将解答以下问题：1. HTTP请求如何映射到Controller；2. Controller是如何被执行的。 ... [详细]

蜡笔小新 2024-12-21 18:50:52

mobiledu2502853397

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章