malloc的brk和mmap

先放一张虚拟地址空间分布图(图截至深入理解计算机系统第三版):
malloc的brk和mmap
    malloc的分配内存有两个系统调用,一个brk,一个mmap,brk是将.data的最高地址指针_edata往高地址走,mmap则是在进程的虚拟地址空间(在堆和栈之间的内存映射区域)找一块空间。这两种都是没有实际分配物理内存,只有当真正使用的时候才发生缺页中断,分配物理内存。 http://blog.yufeng.info/archives/tag/mmap上提到了通过MAP_POPULATE来实现mmap函数直接预分配物理内存的方法,这个就不展开说了。

    一般情况下,我们使用malloc,如果小于128k,则使用brk分配,如果大于128k,则使用mmap在堆和栈之间找一个空闲空间分配。我们可以看看一个例子:

#include <stdio.h>
#include <malloc.h>

int main() {
    int *m = NULL, *n = NULL;
    printf("begin\n");
    m = malloc(64 * 1024);
    getchar();
    n = malloc(256 * 1024);
    getchar();
    printf("end\n");
    free(m);
    free(n);
    return 0;
}

使用strace跟踪系统调用,可以发现执行第一个malloc如下:
malloc的brk和mmap

第一个malloc调用brk系统调用,这是/proc/3433/maps的内容如下,_edata的指针应该从0x1ac0000升到了0x1af1000,  heap的范围就是这个。
malloc的brk和mmap

第二个malloc调用mmap系统调用,strace的内容如下:
malloc的brk和mmap

第二个malloc调用mmap调用,这是/proc/3433/maps的内容如下:
malloc的brk和mmap

这里
malloc的brk和mmap
malloc的brk和mmap
将mmap分配的内存合并到内存映射区域当中。

接着我们可以看下下面这个例子:

#include <stdio.h>
#include <malloc.h>

int main() {
    int *m = NULL, *n = NULL;    
    printf("begin\n");
    m = malloc(256 * 1024);
    getchar();
    free(m);
    n = malloc(256 * 1024);
    getchar();
    free(n);    
    printf("end\n");
    return 0;
}

按理说应该两次调用mmap才对,但是实际上如下:
malloc的brk和mmap
malloc的brk和mmap
第二次调用的是brk。这是为什么?

因为M_MMAP_THRESHOLD可以动态调整。
M_MMAP_THRESHOLD是设置mmap的阈值,但是glic中M_MMAP_THRESHOLD是可以动态调整的(在128KB 到 64MB之间调整),当申请并释放了一块大小为N KB的内存之后,会调整到N 到 (N + 4)KB。可以手动设置M_MMAP_THRESHOLD的值防止动态调整(mallopt).



顺便备两篇博文: