当前位置: 开发笔记 > 编程语言 > 正文

自己动手制作C语言编译器（1）：设计

作者：暮色归家 | 来源：互联网 | 2023-10-11 23:17

这篇文章我们要从整体上讲解如何设计我们的C语言编译器。本系列：首先要说明的是，虽然标题是编译器，但实际上我们构建的是C语言的解释器&#

这篇文章我们要从整体上讲解如何设计我们的 C 语言编译器。

本系列&＃xff1a;

首先要说明的是&＃xff0c;虽然标题是编译器&＃xff0c;但实际上我们构建的是 C 语言的解释器&＃xff0c;这意味着我们可以像运行脚本一样去运行 C 语言的源代码文件。这么做的理由有两点&＃xff1a;

1.解释器与编译器仅在代码生成阶段有区别&＃xff0c;而其它方面如词法分析、语法分析是一样的。

2.解释器需要我们实现自己的虚拟机与指令集&＃xff0c;而这部分能帮助我们了解计算机的工作原理。

编译器的构建流程

一般而言&＃xff0c;编译器的编写分为 3 个步骤&＃xff1a;

1.词法分析器&＃xff0c;用于将字符串转化成内部的表示结构。

2.语法分析器&＃xff0c;将词法分析得到的标记流&＃xff08;token&＃xff09;生成一棵语法树。

3.目标代码的生成&＃xff0c;将语法树转化成目标代码。

已经有许多工具能帮助我们处理阶段1和2&＃xff0c;如 flex 用于词法分析&＃xff0c;bison 用于语法分析。只是它们的功能都过于强大&＃xff0c;屏蔽了许多实现上的细节&＃xff0c;对于学习构建编译器帮助不大。所以我们要完全手写这些功能。

所以我们会根据下面的流程&＃xff1a;

1.构建我们自己的虚拟机以及指令集。这后生成的目标代码便是我们的指令集。

2.构建我们的词法分析器

3.构建语法分析器

编译器的框架

我们的编译器主要包括 4 个函数&＃xff1a;

next()用于词法分析&＃xff0c;获取下一个标记&＃xff0c;它将自动忽略空白字符。

program()语法分析的入口&＃xff0c;分析整个 C 语言程序。

expression(level)用于解析一个表达式。

eval()虚拟机的入口&＃xff0c;用于解释目标代码。

这里有一个单独用于解析“表达式”的函数expression是因为表达式在语法分析中相对独立并且比较复杂&＃xff0c;所以我们将它单独作为一个模块&＃xff08;函数&＃xff09;。

因为我们的源代码看起来就像是&＃xff1a;

#include

#include

#include

#include

int token;            // current token

char *src, *old_src;  // pointer to source code string;

int poolsize;         // default size of text/data/stack

int line;             // line number

void next() {

    token &＃61; *src&＃43;&＃43;;

    return;

}

void expression(int level) {

    // do nothing

}

void program() {

    next();                  // get next token

    while (token > 0) {

        printf("token is: %c\n", token);

        next();

    }

}

int eval() { // do nothing yet

    return 0;

}

int main(int argc, char **argv)

{

    int i, fd;

    argc--;

    argv&＃43;&＃43;;

    poolsize &＃61; 256 * 1024; // arbitrary size

    line &＃61; 1;

    if ((fd &＃61; open(*argv, 0)) <0) {

        printf("could not open(%s)\n", *argv);

        return -1;

    }

    if (!(src &＃61; old_src &＃61; malloc(poolsize))) {

        printf("could not malloc(%d) for source area\n", poolsize);

        return -1;

    }

    // read the source file

    if ((i &＃61; read(fd, src, poolsize-1)) <&＃61; 0) {

        printf("read() returned %d\n", i);

        return -1;

    }

    src[i] &＃61; 0; // add EOF character

    close(fd);

    program();

    return eval();

}

上面的代码看上去挺复杂&＃xff0c;但其实内容不多&＃xff0c;就是读取一个源代码文件&＃xff0c;逐个读取每个字符&＃xff0c;并输出每个字符。这里重要的是注意每个函数的作用&＃xff0c;后面的文章中&＃xff0c;我们将逐个填充每个函数的功能&＃xff0c;最终构建起我们的编译器。如果想一起交流的可以加这个群&＃xff1a;941636044 &＃xff0c;有什么问题可以群里面交流&＃xff0c;群里面也有一些方便学习C语言C&＃43;&＃43;编程的资料可以给你利用。

这样我们就有了一个最简单的编译器&＃xff1a;什么都不干的编译器&＃xff0c;下一章中&＃xff0c;我们将实现其中的eval函数&＃xff0c;即我们自己的虚拟机。

推荐阅读

case
编译原理中的语法分析方法探讨

本文探讨了在编译原理课程中遇到的复杂文法问题，特别是当使用SLR(1)文法时遇到的多重规约与移进冲突。文章讨论了可能的解决策略，包括递归下降解析、运算符优先级解析等，并提供了相关示例。 ... [详细]

蜡笔小新 2024-11-19 14:44:19
string
阶段一：Hankson的趣味数学挑战——不使用辗转相除法求解特定条件下的正整数

Hanks博士是一位著名的生物技术专家，他的儿子Hankson对数学有着浓厚的兴趣。最近，Hankson遇到了一个有趣的数学问题，涉及求解特定条件下的正整数x，而不使用传统的辗转相除法。 ... [详细]

蜡笔小新 2024-11-22 14:26:49
string
递归实现表达式求和

本文通过C++语言实现了一个递归算法，用于解析并计算数学表达式的值。该算法能够处理加法、减法、乘法和除法操作。 ... [详细]

蜡笔小新 2024-11-21 15:38:13
case
C语言利用前缀表达式实现复杂科学计算器

用C语言实现的科学计算器，支持2种常量，10种基本函数，Ans寄存器。相对来说拓展性应该是不错的，思路是首先化简复杂名称的函 ... [详细]

蜡笔小新 2024-11-16 11:46:11
string
Spring 高级教程（15）：Spring AOP（3）—— 使用注解配置切面（1）：方法执行前后的增强处理

本文介绍了如何在Spring框架中使用AspectJ实现AOP编程，重点讲解了通过注解配置切面的方法，包括方法执行前和方法执行后的增强处理。阅读本文前，请确保已安装并配置好AspectJ。 ... [详细]

蜡笔小新 2024-11-15 15:57:13
case
UVALive 8201 - BBP 公式计算圆周率

在1995年，Simon Plouffe 发现了一种特殊的求和方法来表示某些常数。两年后，Bailey 和 Borwein 在他们的论文中发表了这一发现，这种方法被命名为 Bailey-Borwein-Plouffe (BBP) 公式。该问题要求计算圆周率 π 的第 n 个十六进制数字。 ... [详细]

蜡笔小新 2024-11-21 18:32:57
uml
Singleton单例模式和DoubleChecked Locking双重检查锁定模式

问题描述现在，不管开发一个多大的系统（至少我现在的部门是这样的），都会带一个日志功能；在实际开发过程中 ... [详细]

蜡笔小新 2024-11-21 15:14:45
数组
自定义字符串连接函数（避免使用标准库函数）

本文介绍如何手动实现一个字符串连接函数，该函数不依赖于C语言的标准字符串处理函数，如strcpy或strcat。函数原型为void concatenate(char *dest, char *src)，其主要作用是将源字符串src追加到目标字符串dest的末尾。 ... [详细]

蜡笔小新 2024-11-20 17:39:42
数组
c语言二元插值,二维线性插值c语言

c语言二元插值,二维线性插值c语言 ... [详细]

蜡笔小新 2024-11-20 12:20:16
require
配置 Apache 虚拟主机详解

本文详细介绍如何在 Apache 中设置虚拟主机，包括基本配置和高级设置，帮助用户更好地理解和使用虚拟主机功能。 ... [详细]

蜡笔小新 2024-11-22 15:04:59
main
OpenCV中的霍夫圆检测技术解析

本文详细介绍了如何使用OpenCV库中的HoughCircles函数实现霍夫圆检测，并提供了具体的代码示例及参数解释。 ... [详细]

蜡笔小新 2024-11-22 12:17:05
post
Linux信号量操作详解：sem_init, sem_wait, sem_post, sem_destroy

本文详细介绍了Linux系统中信号量的相关函数，包括sem_init、sem_wait、sem_post和sem_destroy，解释了它们的功能和使用方法，并提供了示例代码。 ... [详细]

蜡笔小新 2024-11-21 21:21:16
string
ZC公司员工评估系统的动态数据表生成方案

本文介绍了一种在ZC公司的员工评估系统中，如何根据动态设置的评分指标，在后台查询时动态生成并显示数据表的方法。该方法确保了评分指标与被评人员信息的有效整合。 ... [详细]

蜡笔小新 2024-11-19 20:14:11
sum
SQL 中的 SUM 函数详解

本文将详细介绍 SQL 中的 SUM 函数及其用法，并通过具体示例展示如何在实际场景中应用。 ... [详细]

蜡笔小新 2024-11-17 19:34:14
string
WPF项目学习.一

WPF项目搭建版权声明：本文为博主初学经验，未经博主允许不得转载。一、前言记录在学习与制作WPF过程中遇到的解决方案。使用MVVM的优点是数据和视图分离，双向绑定，低耦合，可重用行 ... [详细]

蜡笔小新 2024-11-15 11:38:43

暮色归家

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章