代码如何变成可执行文件

hello.c

#include <stdio.h>

int main()

{

    printf("Hello World\n");

    return 0;

}

 

gcc hello.c 将会生成a.out

 

在hello.c到a.out这个过程到底是经历了哪几个阶段,gcc帮我们做了什么,a.out是怎么生成

 

hello.c ->a.out主要经历了四个阶段:预处理,编译,汇编,链接

代码如何变成可执行文件

一:预处理

预处理主要是处理源代码中以#开始的预编译指令,比如#include,#define

将所有的#define删除,展开宏定义

处理所有的条件编译指令#if,#ifdef,#elif,#else,#endif

处理#include预编译指令,将被包含的头文件插入该预编译指令的位置,是个递归的过程

删除所有的注释 //与/**/

添加行号与文件名表示,用于调试符号与编译错误或警告报错

保留#pragma编译指令,改指令 编译器需要使用

 

二:编译

编译过程就是把预编译生成的文件进行一系列词法分析(也叫扫描),语法分析,语义分析,源代码优化,汇编代码生成,目标代码优化

 

词法分析:根据分隔符,将代码分割成一系列的记号

比如: int a = (a+3)*(2+5);

将会 变成以下记号: int,a,=,(,a,+,3,),(,2,+,5,)

词法分析产生的记号可以分为:关键字,标识符,字面量(数字,字符串,即常量),特殊符号(加号,等号等),在识别记号时,会将标识符放入符号表,字面量放入文字表

 

语法分析:根据记号进行语法分析,产生语法树,整个分析过程采用上下文无关语法(语法树就是以表达式为节点的树),仅仅是完成对表达式的语法层面进行分析

代码如何变成可执行文件

 

语义分析:语义分析对语法树中的表达式标识类型,对于类型不匹配,编译器将会报错,如果有些类型需要做隐式转换,将会在语法树中插入对应的节点

代码如何变成可执行文件

 

源代码优化生成汇编代码:int a = (a+3)*(2+5); 将会被优化为int a = (a+3)*(7);

代码如何变成可执行文件

 

三:汇编 

汇编即根据汇编指令翻译为机器指令

 

四:链接

链接主要包含 地址和空间分配,符号决议,重定位