当前位置: 开发笔记 > 编程语言 > 正文

函数运行时在内存中是什么样子？

作者：伤心脑残猪_940 | 来源：互联网 | 2024-10-16 10:46

Python实战社群Java实战社群长按识别下方二维码，按需求添加扫码关注添加客服进Python社群▲扫码关注添加客服进Java社群▲作者丨码农的荒岛求生来源丨码农的

Python实战社群

Java实战社群

长按识别下方二维码&＃xff0c;按需求添加

640.webp (1).jpg

扫码关注添加客服

进Python社群▲

微信图片_20200223084351_副本.png

扫码关注添加客服

进Java社群▲

作者丨码农的荒岛求生

来源丨码农的荒岛求生&＃xff08;ID:escape-it&＃xff09;

在开始本篇的内容前&＃xff0c;我们先来思考几个问题。

1. 我们先来看一段简单的代码&＃xff1a;

void func(int a) {if (a > 100000000) return;int arr[100] &＃61; {0};func(a &＃43; 1); }

你能看出这段代码会有什么问题吗&＃xff1f;

2. 我们之前提到过一项关键技术——协程&＃xff0c;你知道协程的本质是什么吗&＃xff1f;有的同学可能会说是用户态线程&＃xff0c;那么什么是用户态线程&＃xff0c;这是怎么实现的&＃xff1f;

3. 函数运行起来后在内存中是什么样子&＃xff1f;

这几个问题看似没什么关联&＃xff0c;但这背后都指向一样东西&＃xff0c;这就是所谓的函数运行时栈&＃xff0c;run time stack。

接下来我们就好好看看到底什么是函数运行时栈&＃xff0c;为什么彻底理解函数运行时栈对程序员来说非常重要。

从进程、线程到函数调用

汽车在高速上行驶时有很多信息&＃xff0c;像速度、位置等等&＃xff0c;通过这些信息我们可以直观的感受汽车的运行时状态。

同样的&＃xff0c;程序在运行时也有很多信息&＃xff0c;像有哪些程序正在运行、这些程序执行到了哪里等等&＃xff0c;通过这些信息我们可以直观的感受系统中程序运行的状态。

进程和线程的运行体现在函数执行上&＃xff0c;函数的执行除了函数内部执行的顺序执行还有子函数调用的控制转移以及子函数执行完毕的返回。其中函数内部的顺序执行乏善可陈&＃xff0c;重点是函数的调用。

因此接下来我们的视角将从宏观的进程和线程拉近到微观下的函数调用&＃xff0c;重点来讨论一下函数调用是怎样实现的。

函数执行的活动轨迹&＃xff1a;栈

玩过游戏的同学应该知道&＃xff0c;有时你为了完成一项主线任务不得不去打一些支线的任务&＃xff0c;支线任务中可能还有支线任务&＃xff0c;当一个支线任务完成后退回到前一个支线任务&＃xff0c;这是什么意思呢&＃xff0c;举个例子你就明白了。

假设主线任务西天取经A依赖支线任务收服孙悟空B和收服猪八戒C&＃xff0c;也就是说收服孙悟空B和收服猪八戒C完成后才能继续主线任务西天取经A&＃xff1b;

支线任务收服孙悟空B依赖任务拿到紧箍咒D&＃xff0c;只有当任务D完成后才能回到任务B&＃xff1b;

整个任务的依赖关系如图所示&＃xff1a;

现在我们来模拟一下任务完成过程。

首先我们来到任务A&＃xff0c;执行主线任务&＃xff1a;

执行任务A的过程中我们发现任务A依赖任务B&＃xff0c;这时我们暂停任务A去执行任务B&＃xff1a;

执行任务B的时候&＃xff0c;我们又发现依赖任务D&＃xff1a;

执行任务D的时候我们发现该任务不再依赖任何其它任务&＃xff0c;因此C完成后我们可以会退到前一个任务&＃xff0c;也就是B&＃xff1a;

任务B除了依赖任务C外不再依赖其它任务&＃xff0c;这样任务B完成后就可以回到任务A&＃xff1a;

现在我们回到了主线任务A&＃xff0c;依赖的任务B执行完成&＃xff0c;接下来是任务C&＃xff1a;

和任务D一样&＃xff0c;C不依赖任何其它其它任务&＃xff0c;任务C完成后就可以再次回到任务A&＃xff0c;再之后任务A执行完毕&＃xff0c;整个任务执行完成。

让我们来看一下整个任务的活动轨迹&＃xff1a;

仔细观察&＃xff0c;实际上你会发现这是一个First In Last Out 的顺序&＃xff0c;天然适用于栈这种数据结构来处理。

再仔细看一下栈顶的轨迹&＃xff0c;也就是A、B、D、B、A、C、A&＃xff0c;实际上你会发现这里的轨迹就是任务依赖树的遍历过程&＃xff0c;是不是很神奇&＃xff0c;这也是为什么树这种数据结构的遍历除了可以用递归也可以用栈来实现的原因。

A Box

函数调用也是同样的道理&＃xff0c;你把上面的ABCD换成函数ABCD&＃xff0c;本质不变。

因此&＃xff0c;现在我们知道了&＃xff0c;使用栈这种结构就可以用来保存函数调用信息。

和游戏中的每个任务一样&＃xff0c;当函数在运行时每个函数也要有自己的一个“小盒子”&＃xff0c;这个小盒子中保存了函数运行时的各种信息&＃xff0c;这些小盒子通过栈这种结构组织起来&＃xff0c;这个小盒子就被称为栈帧&＃xff0c;stack frames&＃xff0c;也有的称之为call stack&＃xff0c;不管用什么命名方式&＃xff0c;总之&＃xff0c;就是这里所说的小盒子&＃xff0c;这个小盒子就是函数运行起来后占用的内存&＃xff0c;这些小盒子构成了我们通常所说的栈区。

那么函数调用时都有哪些信息呢&＃xff1f;

控制转移

我们知道当函数A调用函数B的时候&＃xff0c;控制从A转移到了B&＃xff0c;所谓控制其实就是指CPU执行属于哪个函数的机器指令&＃xff0c;CPU从开始执行属于函数A的指令切换到执行属于函数B的指令&＃xff0c;我们就说控制从函数A转移到了函数B。

控制从函数A转移到函数B&＃xff0c;那么我们需要有这样两个信息&＃xff1a;

我从哪里来 (返回)
要到去哪里 (跳转)

是不是很简单&＃xff0c;就好比你出去旅游&＃xff0c;你需要知道去哪里&＃xff0c;还需要记住回家的路。

函数调用也是同样的道理。

当函数A调用函数B时&＃xff0c;我们只要知道&＃xff1a;

函数A对于的机器指令执行到了哪里 (我从哪里来&＃xff0c;返回)
函数B第一条机器指令所在的地址 (要到哪里去&＃xff0c;跳转)

有这两条信息就足以让CPU开始执行函数B对应的机器指令&＃xff0c;当函数B执行完毕后跳转回函数A。

那么这些信息是怎么获取并保持的呢&＃xff1f;

现在我们就可以打开这个小盒子&＃xff0c;看看是怎么使用的了。

假设函数A调用函数B&＃xff0c;如图所示&＃xff1a;

当前&＃xff0c;CPU执行函数A的机器指令&＃xff0c;该指令的地址为0x400564&＃xff0c;接下来CPU将执行下一条机器指令也就是:

call 0x400540

这条机器指令是什么意思呢&＃xff1f;

这条机器指令对应的就是我们在代码中所写的函数调用&＃xff0c;注意call后有一条机器指令地址&＃xff0c;注意观察上图你会看到&＃xff0c;该地址就是函数B的第一条机器指令&＃xff0c;从这条机器指令后CPU将跳转到函数B。

现在我们已经解决了控制跳转的“要到哪里去”问题&＃xff0c;当函数B执行完毕后怎么跳转回来呢&＃xff1f;

原来&＃xff0c;call指令除了给出跳转地址之外还有这样一个作用&＃xff0c;也就是把call指令的下一条指令的地址&＃xff0c;也就是0x40056a push到函数A的栈帧中&＃xff0c;如图所示&＃xff1a;

现在&＃xff0c;函数A的小盒子变大了一些&＃xff0c;因为装入了返回地址&＃xff1a;

现在CPU开始执行函数B对应的机器指令&＃xff0c;注意观察&＃xff0c;函数B也有一个属于自己的小盒子(栈帧)&＃xff0c;可以往里面扔一些必要的信息。

如果函数B中又调用了其它函数呢&＃xff1f;

道理和函数A调用函数B是一样的。

让我们来看一下函数B最后一条机器指令ret&＃xff0c;这条机器指令的作用是告诉CPU跳转到函数A保存在栈帧上的返回地址&＃xff0c;这样当函数B执行完毕后就可以跳转到函数A继续执行了。

至此&＃xff0c;我们解决了控制转移中“我从哪里来”的问题。

传递参数与获取返回值

函数调用与返回使得我们可以编写函数&＃xff0c;进行函数调用。但调用函数除了提供函数名称之外还需要传递参数以及获取返回值&＃xff0c;那么这又是怎样实现的呢&＃xff1f;

在x86-64中&＃xff0c;多数情况下参数的传递与获取返回值是通过寄存器来实现的。

假设函数A调用了函数B&＃xff0c;函数A将一些参数写入相应的寄存器&＃xff0c;当CPU执行函数B时就可以从这些寄存器中获取参数了。

同样的&＃xff0c;函数B也可以将返回值写入寄存器&＃xff0c;当函数B执行结束后函数A从该寄存器中就可以读取到返回值了。

我们知道寄存器的数量是有限的&＃xff0c;当传递的参数个数多于寄存器的数量该怎么办呢&＃xff1f;

这时那个属于函数的小盒子也就是栈帧又能发挥作用了。

原来&＃xff0c;当参数个数多于寄存器数量时剩下的参数直接放到栈帧中&＃xff0c;这样被调函数就可以从前一个函数的栈帧中获取到参数了。

现在栈帧的样子又可以进一步丰富了&＃xff0c;如图所示&＃xff1a;

从图中我们可以看到&＃xff0c;调用函数B时有部分参数放到了函数A的栈帧中&＃xff0c;同时函数A栈帧的顶部依然保存的是返回地址。

局部变量

我们知道在函数内部定义的变量被称为局部变量&＃xff0c;这些变量在函数运行时被放在了哪里呢&＃xff1f;

原来&＃xff0c;这些变量同样可以放在寄存器中&＃xff0c;但是当局部变量的数量超过寄存器的时候这些变量就必须放到栈帧中了。

因此&＃xff0c;我们的栈帧内容又一步丰富了。

细心的同学可能会有这样的疑问&＃xff0c;我们知道寄存器是共享资源可以被所有函数使用&＃xff0c;既然可以将函数A的局部变量写入寄存器&＃xff0c;那么当函数A调用函数B时&＃xff0c;函数B的局部变量也可以写到寄存器&＃xff0c;这样的话当函数B执行完毕回到函数A时寄存器的值已经被函数B修改过了&＃xff0c;这样会有问题吧。

这样的确会有问题&＃xff0c;因此我们在向寄存器中写入局部变量之前&＃xff0c;一定要先将寄存器中开始的值保存起来&＃xff0c;当寄存器使用完毕后再恢复原值就可以了。

那么我们要将寄存器中的原始值保存在哪里呢&＃xff1f;

有的同学可能已经猜到了&＃xff0c;没错&＃xff0c;依然是函数的栈帧中。

最终&＃xff0c;我们的小盒子就变成了如图所示的样子&＃xff0c;当寄存器使用完毕后根据栈帧中保存的初始值恢复其内容就可以了。

现在你应该知道函数在运行时到底是什么样子了吧&＃xff0c;以上就是问题3的答案。

Big Picture

需要再次强调的一点就是&＃xff0c;上述讨论的栈帧就位于我们常说的栈区。

栈区&＃xff0c;属于进程地址空间的一部分&＃xff0c;如图所示&＃xff0c;我们将栈区放大就是图左边的样子。

最后&＃xff0c;让我们回到文章开始的这段简单代码&＃xff1a;

void func(int a) {if (a > 100000000) return;int arr[100] &＃61; {0};func(a &＃43; 1); }void main(){func(0); }

想一想这段代码会有什么问题&＃xff1f;

原来&＃xff0c;栈区是有大小限制的&＃xff0c;当超过限制后就会出现著名的栈溢出问题&＃xff0c;显然上述代码会导致这一问题的出现。

因此&＃xff1a;

不要创建过大的局部变量
函数栈帧&＃xff0c;也就是调用层次不能太多

总结

本章我们从几个看似没什么关联的问题出发&＃xff0c;详细讲解了函数运行时栈是怎么一回事&＃xff0c;为什么我们不能创建过多的局部变量。细心的同学会发现第2个问题我们没有解答&＃xff0c;这个问题的讲解放到下一篇&＃xff0c;也就是协程中讲解。

希望这篇文章能对大家理解函数运行时栈有所帮助。

程序员专栏扫码关注填加客服长按识别下方二维码进群

近期精彩内容推荐&＃xff1a;

为何说IT科技公司应该留住35岁员工&＃xff1f;

工友们&＃xff01;大家好&＃xff0c;今天你摸鱼了吗&＃xff1f;

缓存穿透&＃xff0c;雪崩&＃xff0c;击穿以及解决方案分析

图文详解&＃xff1a;如何给女朋友解释什么是微服务&＃xff1f;

在看点这里好文分享给更多人↓↓

推荐阅读

join
Python配置文件读写指南

本文详细介绍如何使用Python进行配置文件的读写操作，涵盖常见的配置文件格式（如INI、JSON、TOML和YAML），并提供具体的代码示例。 ... [详细]

蜡笔小新 2024-12-28 08:39:55
int
Python 异步编程：深入理解 asyncio 库（上）

本文介绍了 Python 3.4 版本引入的标准库 asyncio，该库为异步 IO 提供了强大的支持。我们将探讨为什么需要 asyncio，以及它如何简化并发编程的复杂性，并详细介绍其核心概念和使用方法。 ... [详细]

蜡笔小新 2024-12-28 11:52:00
join
Python 的 10 个开发技巧！太实用了

1.如何在运行状态查看源代码？查看函数的源代码，我们通常会使用IDE来完成。比如在PyCharm中，你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢？当我们想使用一个函 ... [详细]

蜡笔小新 2024-12-27 18:36:54
int
深入理解C++中的KMP算法：高效字符串匹配的利器

本文详细介绍C++中实现KMP算法的方法，探讨其在字符串匹配问题上的优势。通过对比暴力匹配（BF）算法，展示KMP算法如何利用前缀表优化匹配过程，显著提升效率。 ... [详细]

蜡笔小新 2024-12-27 14:45:30
join
深入理解Python的os和sys模块

本文详细解析了Python中的os和sys模块，介绍了它们的功能、常用方法及其在实际编程中的应用。 ... [详细]

蜡笔小新 2024-12-26 22:04:19
bit
寻找满足特定条件的整数N的最大和(a+b)

本文探讨了如何在给定整数N的情况下，找到两个不同的整数a和b，使得它们的和最大，并且满足特定的数学条件。 ... [详细]

蜡笔小新 2024-12-26 19:26:18
object
深入理解Java泛型：JDK 5的新特性

本文详细介绍了Java泛型的概念及其在JDK 5中的应用，通过具体代码示例解释了泛型的引入、作用和优势。同时，探讨了泛型类、泛型方法和泛型接口的实现，并深入讲解了通配符的使用。 ... [详细]

蜡笔小新 2024-12-26 11:15:56
int
技术变现之道：从日常工作中挖掘潜力

本文探讨了如何在日常工作中通过优化效率和深入研究核心技术，将技术和知识转化为实际收益。文章结合个人经验，分享了提高工作效率、掌握高价值技能以及选择合适工作环境的方法，帮助读者更好地实现技术变现。 ... [详细]

蜡笔小新 2024-12-24 15:21:23
int
C语言的起源与发展历程

本文详细介绍了C语言的起源、发展及其标准化过程，涵盖了从早期的BCPL和B语言到现代C语言的演变，并探讨了其在操作系统和跨平台编程中的重要地位。 ... [详细]

蜡笔小新 2024-12-23 14:11:43
int
Lesson09异常

异常要理解Java异常处理是如何工作的，需要掌握一下三种异常类型：检查性异常：最具代表性的检查性异常是用户错误或问题引起的异常ÿ ... [详细]

蜡笔小新 2024-12-23 10:49:54
const
Python处理Word文档的高效技巧

本文详细介绍了如何使用Python处理Word文档，涵盖从基础操作到高级功能的各种技巧。我们将探讨如何生成文档、定义样式、提取表格数据以及处理超链接和图片等内容。 ... [详细]

蜡笔小新 2024-12-23 10:40:32
int
优化Spring Boot项目，大幅提升并发性能

本文探讨了如何通过一系列技术手段提升Spring Boot项目的并发处理能力，解决生产环境中因慢请求导致的系统性能下降问题。 ... [详细]

蜡笔小新 2024-12-19 21:07:12
filter
Spring Boot 解决 AJAX 跨域请求及自定义 Headers 方法

本文探讨了浏览器的同源策略限制及其对 AJAX 请求的影响，并详细介绍了如何在 Spring Boot 应用中优雅地处理跨域请求，特别是当请求包含自定义 Headers 时的解决方案。 ... [详细]

蜡笔小新 2024-12-17 13:57:01
join
技术分享：从动态网站提取站点密钥的解决方案

本文探讨了如何从动态网站中提取站点密钥，特别是针对验证码（reCAPTCHA）的处理方法。通过结合Selenium和requests库，提供了详细的代码示例和优化建议。 ... [详细]

蜡笔小新 2024-12-28 04:11:47
ascii
HTTP请求与响应机制详解

本文深入探讨了HTTP请求和响应对象的使用，详细介绍了如何通过响应对象向客户端发送数据、处理中文乱码问题以及常见的HTTP状态码。此外，还涵盖了文件下载、请求重定向、请求转发等高级功能。 ... [详细]

蜡笔小新 2024-12-23 20:40:08

伤心脑残猪_940

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章