解密C语言程序的编译过程

码农公社  210.net.cn   210是何含义?10月24日是程序员节,1024 = 210、210既 210 之意。


       我们大部分程序员可能都是从C语言学起的,写过几万行、几十万行、甚至上百万行的代码,但是大家是否都清楚C语言编译的完整过程呢,如果不清楚的话,我今天就带着大家一起来做个解密吧。     

C语言相对于汇编语言是一种高级语言,要想在系统上运行,需要通过编译器把它转换成机器能够读懂的可执行的代码。     

以Linux系统上的gcc为例,通常我们编译一个源文件都是用下面的命令:   

$gcc hello.c ?o hello


cccccccccccc.png


编译成功后,目录里会生成hello这个程序,直接运行它可以看到结果。  


$./hello  

Hello World!     

但hello这个程序是怎么生成的呢,其实中间还是有好几步的。用下面这个命令重新编译一下,你可以看到所有的中间文件。  

$gcc -save-temps hello.c ?o hello  

$ls  

hello hello.c hello.i hello.o hello.s     


C编译器的编译过程主要分成四步:  (1) 预处理  (2) 编译  (3) 汇编  (4) 连接

cccccccccccc.png

1) 预处理 Pre-prosssing   

预处理生成了hello.i 的中间文件,主要完成了下面几步:  

去掉所有的注释  

展开所有的宏定义(也就是做字符替换)  

插入#include文件的内容  

处理所有的条件编译  

hello.i 文件内容如下(文件较大,只展示了最下面的一块):

cccccccccccc.png


可以发现源代码中所有的注释被删除了,并且插入了stdio.h头文件的内容。


2)编译 Compiling   

编译将 hello.i 文件编译生成一个中间文件 hello.s,打开可以看到里边都是汇编语言,所以编译的作用就是把源代码转换成汇编语言。

cccccccccccc.png


3)汇编 Assembly   

汇编器将 hello.s 汇编成 hello.o 文件。hello.o是二进制文件,里边都是机器可以执行的代码。

cccccccccccc.png


4)连接 Linking   

连接顾名思义起到了一个连接作用,虽然 hello.o 已经是二进制文件了,但是里边用到的比如 printf 函数需要调用别的库。连接器将我们的二进制文件和其他库做了一个绑定。可以看到连接后生成的 hello 文件要比 hello.o 大的多。

cccccccccccc.png

到这里 C的完整编译流程就结束了,本文的示例用的是Linux操作系统,编译器用的是 gcc,但在其他操作系统,比如 Unix、Windows,或者用其他编译器,原理都是一样的,感兴趣的同学可以去学习一下编译原理,会对编译有更深入的理解。

评论