malloc的brk和mmap
先放一张虚拟地址空间分布图(图截至深入理解计算机系统第三版):
malloc的分配内存有两个系统调用,一个brk,一个mmap,brk是将.data的最高地址指针_edata往高地址走,mmap则是在进程的虚拟地址空间(在堆和栈之间的内存映射区域)找一块空间。这两种都是没有实际分配物理内存,只有当真正使用的时候才发生缺页中断,分配物理内存。 http://blog.yufeng.info/archives/tag/mmap上提到了通过MAP_POPULATE来实现mmap函数直接预分配物理内存的方法,这个就不展开说了。
一般情况下,我们使用malloc,如果小于128k,则使用brk分配,如果大于128k,则使用mmap在堆和栈之间找一个空闲空间分配。我们可以看看一个例子:
#include <stdio.h>
#include <malloc.h>
int main() {
int *m = NULL, *n = NULL;
printf("begin\n");
m = malloc(64 * 1024);
getchar();
n = malloc(256 * 1024);
getchar();
printf("end\n");
free(m);
free(n);
return 0;
}
使用strace跟踪系统调用,可以发现执行第一个malloc如下:
第一个malloc调用brk系统调用,这是/proc/3433/maps的内容如下,_edata的指针应该从0x1ac0000升到了0x1af1000, heap的范围就是这个。
第二个malloc调用mmap系统调用,strace的内容如下:
第二个malloc调用mmap调用,这是/proc/3433/maps的内容如下:
这里
将mmap分配的内存合并到内存映射区域当中。
接着我们可以看下下面这个例子:
#include <stdio.h>
#include <malloc.h>
int main() {
int *m = NULL, *n = NULL;
printf("begin\n");
m = malloc(256 * 1024);
getchar();
free(m);
n = malloc(256 * 1024);
getchar();
free(n);
printf("end\n");
return 0;
}
按理说应该两次调用mmap才对,但是实际上如下:
第二次调用的是brk。这是为什么?
因为M_MMAP_THRESHOLD可以动态调整。
M_MMAP_THRESHOLD是设置mmap的阈值,但是glic中M_MMAP_THRESHOLD是可以动态调整的(在128KB 到 64MB之间调整),当申请并释放了一块大小为N KB的内存之后,,会调整到N 到 (N + 4)KB。可以手动设置M_MMAP_THRESHOLD的值防止动态调整(mallopt).
顺便备两篇博文: