内存分配
转自:http://blog.****.net/hackerain/article/details/7953261
http://blog.****.net/firefly_2002/article/details/8045096
首先要来理解一下可执行文件加载进内存后形成的进程在内存中的结构,如下图:
代码区:存放CPU执行的机器指令,代码区是可共享,并且是只读的。
数据区:存放已初始化的全局变量、静态变量(全局和局部)、常量数据。
BBS区:存放的是未初始化的全局变量和静态变量。
栈区:由编译器自动分配释放,存放函数的参数值、返回值和局部变量,在程序运行过程中实时分配和释放,栈区由操作系统自动管理,无须程序员手动管理。
堆区:堆是由malloc()函数分配的内存块,使用free()函数来释放内存,堆的申请释放工作由程序员控制,容易产生内存泄漏。
c语言中的存储类型有auto, extern, register, static 这四种,存储类型说明了该变量要在进程的哪一个段中分配内存空间,可以为变量分配内存存储空间的有数据区、BBS区、栈区、堆区。下面来一一举例看一下这几个存储类型:
1. auto存储类型
auto只能用来标识局部变量的存储类型,对于局部变量,auto是默认的存储类型,不需要显示的指定。因此,auto标识的变量存储在栈区中。示例如下:
- #include <stdio.h>
- int main(void)
- {
- auto int i=1; //显示指定变量的存储类型
- int j=2;
- printf("i=%d\tj=%d\n",i,j);
- return 0;
- }
2. extern存储类型
extern用来声明在当前文件中引用在当前项目中的其它文件中定义的全局变量。如果全局变量未被初始化,那么将被存在BBS区中,且在编译时,自动将其值赋值为0,如果已经被初始化,那么就被存在数据区中。全局变量,不管是否被初始化,其生命周期都是整个程序运行过程中,为了节省内存空间,在当前文件中使用extern来声明其它文件中定义的全局变量时,就不会再为其分配内存空间。
示例如下:
- #include <stdio.h>
- int i=5; //定义全局变量,并初始化
- void test(void)
- {
- printf("in subfunction i=%d\n",i);
- }
- #include <stdio.h>
- extern i; //声明引用全局变量i
- int main(void)
- {
- printf("in main i=%d\n",i);
- test();
- return 0;
- }
- $ gcc -o test test.c file.c #编译连接
- $ ./test #运行
- 结果:
- in main i=5
- in subfunction i=5
3. register存储类型
声明为register的变量在由内存调入到CPU寄存器后,则常驻在CPU的寄存器中,因此访问register变量将在很大程度上提高效率,因为省去了变量由内存调入到寄存器过程中的好几个指令周期。如下示例:
- #include <stdio.h>
- int main(void)
- {
- register int i,sum=0;
- for(i=0;i<10;i++)
- sum=sum+1;
- printf("%d\n",sum);
- return 0;
- }
4. static存储类型
被声明为静态类型的变量,无论是全局的还是局部的,都存储在数据区中,其生命周期为整个程序,如果是静态局部变量,其作用域为一对{}内,如果是静态全局变量,其作用域为当前文件。静态变量如果没有被初始化,则自动初始化为0。静态变量只能够初始化一次。示例如下:
- #include <stdio.h>
- int sum(int a)
- {
- auto int c=0;
- static int b=5;
- c++;
- b++;
- printf("a=%d,\tc=%d,\tb=%d\t",a,c,b);
- return (a+b+c);
- }
- int main()
- {
- int i;
- int a=2;
- for(i=0;i<5;i++)
- printf("sum(a)=%d\n",sum(a));
- return 0;
- }
- $ gcc -o test test.c
- $ ./test
- a=2, c=1, b=6 sum(a)=9
- a=2, c=1, b=7 sum(a)=10
- a=2, c=1, b=8 sum(a)=11
- a=2, c=1, b=9 sum(a)=12
- a=2, c=1, b=10 sum(a)=13
6. 字符串常量
字符串常量存储在数据区中,其生存期为整个程序运行时间,但作用域为当前文件,示例如下:
- #include <stdio.h>
- char *a="hello";
- void test()
- {
- char *c="hello";
- if(a==c)
- printf("yes,a==c\n");
- else
- printf("no,a!=c\n");
- }
- int main()
- {
- char *b="hello";
- char *d="hello2";
- if(a==b)
- printf("yes,a==b\n");
- else
- printf("no,a!=b\n");
- test();
- if(a==d)
- printf("yes,a==d\n");
- else
- printf("no,a!=d\n");
- return 0;
- }
- $ gcc -o test test.c
- $ ./test
- yes,a==b
- yes,a==c
- no,a!=d
总结如下表:
一、预备知识—程序的内存分配
C++编译器将计算机内存分为代码区和数据区,很显然,代码区就是存放程序代码,而数据区则是存放程序编译和执行过程出现的变量和常量。数据区又分为静态数据区、动态数据区以及常量区,动态数据区包括堆区和栈区。
说明:数据结构中的堆(n个元素的序列{k1,k2,...,kn}称之为堆,当且仅当满足以下条件时:(1)ki>=k2i且ki>=k2i+1或(2)ki<=k2i且ki<=k2i+1)
二、例子程序
{
char *p="abcdef"; //
cout<<p[2]<<endl;
cout<<*(p+2)<<endl;
printf("%d\n%d\n",&p[2],(p+2));
}
//main.cpp
int a = 0; // 全局初始化区
char *p1; // 全局未初始化区
char s1[] = "abcdef"; //1) s1在静态区,"abcdef"无需额外存放,就是数组s1内部,总共占用一个串的内存
const char *p ="abcdef";//2)p在静态区,"abcdef",必须额外存放(在常量区,通常也在静态区),/总共占用一个指针,和一个串的内存
{
int b; // 栈区
char s[]="abcdef";//s是在栈区,但这时的“abcdef”应该是在栈区,因为这里'[]'操作符已经说明是动态分配了,所以肯定是堆区。
//“abcdef”到底在栈区还是堆区,没有搞清楚,还请高手指教,我认为在栈区
// 因为局部非静态变量,在函数运行的过程中初始化。这样,编译器无法预先把数据,存放到 s[] 中。于是,只好先存起来,然后再用。s[]中这份,你可以随便处理,预存的 //那份,你根本摸不清它在哪里,所以根本不能处理它,不能读,不能写。如果你可以读写了,那么编译器就不能保证初始化,是正确的了。
//而这个s指针没有被const* 修饰,所以指向的也不是常量,可以通过指针移动改变指向的内容。(初始化之前,"abcdef"在常量区,初始化之后在s[]有了一份,你可以随便处 //理s[],不知道对否)
*s='w';//正确
s[2]='w';//正确
char *p3 = "123456"; // p3在栈区,"123456/0" 在常量区,其值不能被修改,指向常量的指针是不可以通过指针移动去修改指针所指内容的
*p3='w';//错误,此区域是编译的时候确定的,并且程序结束的时候自动释放的, *p3= 'w';企图修改文字常量区引起错误
char *p2; // 栈区
static int c =0; // 全局(静态)初始化区p1 = (char *)malloc(10);
p2 = (char *)malloc(20); // 分配得来的10和20字节的区域就在堆区
strcpy(p1, "123456"); // "123456/0" 放在常量区,编译器可能会将它与p3所指向的"123456"优化成一个地方
}
注意:
1)全局变量以及静态变量存放在静态数据区;
2)注意常量的存放区域,通常情况下,常量存放在程序区(程序区是只读的,因此任何修改常量的行为都是非法的),而不是数据区。有的系统,也将部分常量分配到静态数据区,比如字符串常量(有的系统也将其分配在程序区)。但是要记住一点,常量所在的内存空间都是受系统保护的,不能修改。对常量空间的修改将造成访问内存出错,一般系统都会提示。常量的生命周期一直到程序执行结束为止。
1.test1
#include<iostream> using namespace std; void test(int *p) { int b=2; p=&b; cout<<p<<endl; } int main(void) { int a=10; int *p=&a; cout<<p<<endl; test(p); cout<<p<<endl; return 0; }
第一行输出和第三行输出的结果相同,而第一行、第三行与第二行输出的结果不同。从这里可以看出,当指针作为参数进行传递时传递的也只是一个值,只不过该值只一个地址,因此对于形参的改变并不影响实参。
2.test2
#include<iostream> using namespace std; char* test(void) { char str[]="hello world!"; return str; } int main(void) { char *p; p=test(); cout<<p<<endl; return 0; }
输出结果可能是hello world!,也可能是乱麻。
出现这种情况的原因在于:在test函数内部声明的str数组以及它的值"hello world”是在栈上保存的,当用return将str的值返回时,将str的值拷贝一份传回,当test函数执行结束后,会自动释放栈上的空间,即存放hello world的单元可能被重新写入数据,因此虽然main函数中的指针p是指向存放hello world的单元,但是无法保证test函数执行完后该存储单元里面存放的还是hello world,所以打印出的结果有时候是hello world,有时候是乱麻。
3.test3
#include<iostream> using namespace std; int test(void) { int a=1; return a; } int main(void) { int b; b=test(); cout<<b<<endl; return 0; }
输出结果为 1
有人会问为什么这里传回来的值可以正确打印出来,不是栈会被刷新内容么?是的,确实,在test函数执行完后,存放a值的单元是可能会被重写,但是在函数执行return时,会创建一个int型的零时变量,将a的值复制拷贝给该零时变量,因此返回后能够得到正确的值,即使存放a值的单元被重写数据,但是不会受到影响。
4.test4
#include<iostream> using namespace std; char* test(void) { char *p="hello world!"; return p; } int main(void) { char *str; str=test(); cout<<str<<endl; return 0; }
执行结果是 hello world!
同样返回的是指针,为什么这里会正确地打印出hello world1?这是因为char *p="hello world!",指针p是存放在栈上的,但是"hello world!”是一个常量字符串,因此存放在常量区,而常量区的变量的生存期与整个程序执行的生命期是一样的,因此在test函数执行完后,str指向存放“hello world!”的单元,并且该单元里的内容在程序没有执行完是不会被修改的,因此可以正确输出结果。
5.test5
#include<iostream> using namespace std; char* test(void) { char *p=(char *)malloc(sizeof(char)*100); strcpy(p,"hello world"); return p; } int main(void) { char *str; str=test(); cout<<str<<endl; return 0; }
运行结果 hello world
这种情况下同样可以输出正确的结果,是因为是用malloc在堆上申请的空间,这部分空间是由程序员自己管理的,如果程序员没有手动释放堆区的空间,那么存储单元里的内容是不会被重写的,因此可以正确输出结果。
6.test6
#include<iostream> using namespace std; void test(void) { char *p=(char *)malloc(sizeof(char)*100); strcpy(p,"hello world"); free(p); if(p==NULL) { cout<<"NULL"<<endl; } } int main(void) { test(); return 0; }
没有输出
在这里注意了,free()释放的是指针指向的内存!注意!释放的是内存,不是指针!这点非常非常重 要!指针是一个变量,只有程序结束时才被销毁。释放了内存空间后,原来指向这块空间的指针还是存在!只不过现在指针指向的内容的垃圾,是未定义的,所以说是垃圾。因此,释放内存后应把把指针指向NULL,防止指针在后面不小心又被使用,造成无法估计的后果
static全局变量与普通的全局变量有什么区别?答:全局变量(外部变量)的说明之前再冠以static 就构成了静态的全局变量。全局变量本身就是静态存储方式, 静态全局变量当然也是静态存储方式。 这两者在存储方式上并无不同。这两者的区别在于作用域的扩展上。非静态的全局变量可以用extern扩展到组成源程序的多个文件中,而静态的全局变量的作用域只限于本文件,不能扩展到其它文件,由于静态全局变量的作用域局限于一个源文件内,只能为该源文件内的函数公用,因此可以避免在其它源文件中引起错误。把全局变量改变为静态全局变量后是改变了它的作用域,限制了它的使用范围。
static局部变量和普通局部变量有什么区别?
答:把局部变量改变为静态局部变量后是改变了它的存储方式即改变了它的生存期。static函数与普通函数有什么区别?
答:static函数与普通函数作用域不同,仅在本文件。只在当前源文件中使用的函数应该说明为内部函数(static),内部函数应该在当前源文件中说明和定义。对于可在当前源文件以外使用的函数,应该在一个头文件中说明,要使用这些函数的源文件要包含这个头文件
综上所述:static全局变量与普通的全局变量有什么区别:
static全局变量只初使化一次,防止在其他文件单元中被引用;
static局部变量和普通局部变量有什么区别:
static局部变量只被初始化一次,下一次依据上一次结果值;
static函数与普通函数有什么区别:
static函数在内存中只有一份,普通函数在每个被调用中维持一份拷贝
2.1申请方式
stack:
由系统自动分配。 例如,声明在函数中一个局部变量 int b; 系统自动在栈中为b
开辟空间
heap:
需要程序员自己申请,并指明大小,在c中malloc函数
如p1 = (char *)malloc(10);
在C++中用new运算符
如p2 = (char *)malloc(10);
但是注意p1、p2本身是在栈中的。
2.2申请后系统的响应
栈:只要栈的剩余空间大于所申请空间,系统将为程序提供内存,否则将报异常提示栈溢出。
堆:首先应该知道操作系统有一个记录空闲内存地址的链表,当系统收到程序的申请时,会遍历该链表,寻找第一个空间大于所申请空间的堆结点,然后将该结点从空闲结点链表中删除,并将该结点的空间分配给程序,另外,对于大多数系统,会在这块内存空间中的首地址处记录本次分配的大小,这样,代码中的delete语句才能正确的释放本内存空间。另外,由于找到的堆结点的大小不一定正好等于申请的大小,系统会自动的将多余的那部分重新放入空闲链表中。
2.3申请大小的限制
栈:在Windows下,栈是向低地址扩展的数据结构,是一块连续的内存的区域。这句话的意思是栈顶的地址和栈的最大容量是系统预先规定好的,在 WINDOWS下,栈的大小是2M(也有的说是1M,总之是一个编译时就确定的常数),如果申请的空间超过栈的剩余空间时,将提示overflow。因此,能从栈获得的空间较小。
堆:堆是向高地址扩展的数据结构,是不连续的内存区域。这是由于系统是用链表来存储空闲内存地址的,自然是不连续的,而链表的遍历方向是由低地址向高地址。堆的大小受限于计算机系统中有效的虚拟内存。由此可见,堆获得的空间比较灵活,也比较大。
2.4申请效率的比较:
栈由系统自动分配,速度较快。但程序员是无法控制的。
堆是由new分配的内存,一般速度比较慢,而且容易产生内存碎片,不过用起来最方便。另外,在WINDOWS下,最好的方式是用VirtualAlloc分配内存,他不是在堆,也不是在栈,是直接在进程的地址空间中保留一快内存,虽然用起来最不方便。但是速度快,也最灵活
2.5堆和栈中的存储内容
栈: 在函数调用时,第一个进栈的是主函数中后的下一条指令(函数调用语句的下一条可执行语句)的地址,然后是函数的各个参数,在大多数的C编译器中,参数是由右往左入栈的,然后是函数中的局部变量。注意静态变量是不入栈的。当本次函数调用结束后,局部变量先出栈,然后是参数,最后栈顶指针指向最开始存的地址,也就是主函数中的下一条指令,程序由该点继续运行。
堆:一般是在堆的头部用一个字节存放堆的大小。堆中的具体内容有程序员安排。
2.6存取效率的比较
char *s2 = "bbbbbbbbbbbbbbbbb";
aaaaaaaaaaa是在运行时刻赋值的;
而bbbbbbbbbbb是在编译时就确定的;
但是,在以后的存取中,在栈上的数组比指针所指向的字符串(例如堆)快。
比如:
#i nclude <stdio.h>;
void main()
{
char a = 1;
char c[] = "1234567890";
char *p ="1234567890";
a = c[1];
a = p[1];
return;
}
对应的汇编代码
10: a = c[1];
00401067 8A 4D F1 mov cl,byte ptr [ebp-0Fh]
0040106A 88 4D FC mov byte ptr [ebp-4],cl
11: a = p[1];
0040106D 8B 55 EC mov edx,dword ptr [ebp-14h]
00401070 8A 42 01 mov al,byte ptr [edx+1]
00401073 88 45 FC mov byte ptr [ebp-4],al
第一种在读取时直接就把字符串中的元素读到寄存器cl中,而第二种则要先把指针值读到edx中,在根据edx读取字符,显然慢了。
堆和栈的区别可以用如下的比喻来看出:
使用栈就象我们去饭馆里吃饭,只管点菜(发出申请)、付钱、和吃(使用),吃饱了就走,不必理会切菜、洗菜等准备工作和洗碗、刷锅等扫尾工作,他的好处是快捷,但是自由度小。
使用堆就象是自己动手做喜欢吃的菜肴,比较麻烦,但是比较符合自己的口味,而且自由度大。
操作系统方面的堆和栈,如上面说的那些,不多说了。
还有就是数据结构方面的堆和栈,这些都是不同的概念。这里的堆实际上指的就是(满足堆性质的)优先队列的一种数据结构,第1个元素有最高的优先权;栈实际上就是满足先进后出的性质的数学或数据结构。
虽然堆栈,堆栈的说法是连起来叫,但是他们还是有很大区别的,连着叫只是由于历史的原因。