内存寻址之分页机制

写在前面：

分页机制完成线性地址到物理地址的转换 80x86 规定分页机制是可选的。分段和分页没有什么必然联系，分段可以说是 Intel 的 CPU 一直保持着的一种机制，而分页只是保护模式下的一种内存管理策略。想开启分页机制，CPU必须工作在保护模式，而工作在保护模式可以不开启分页。

分页机制由控制寄存器 CR0 中的 PG 位启用，如PG=1则启用分页机制，把线性地址转换为物理地址；如果PG=0则直接把段机制产生的线性地址当作物理地址使用。

为什么要分页？

问题的本质是在目前只分段的情况， CPU 认为线性地址等于物理地址，而线性地址是由编译器编译出来的，它本身是连续的，所以物理地址也必须要连续才行，但我们可用的物理地址不连续。换句话说，如果线性地址连续，而物理地址可以不连续，不就解决了吗。所以要解除线性地址和物理地址一一对应的关系，然后将他们的关系重新建立，通过某种映射关系，可以将线性地址映射到任意物理地址。

页与页表

为了效率起见，将线性地址空间分成若干大小相等的片，称为页( Page )。相应的地，逻辑上把内存划分为与页大小相等的若干存储块，称为( 物理 )块或页面( Page Frame )。常见的页面大小为 4KB，每一页都有 4K 字节长，每一页的起始地址都能被 4K 整除。

分页机制通过把线性地址空间中的页，重新定位到物理地址空间来进行管理，因为每个页面的整个 4K 字节作为一个单位来映射，并且每个页面都对齐 4K 字节的边界，因此，线性地址的低 12 位经过分页机制直接地作为物理地址的低 12 位使用。所以，线性地址的高 20位可用来定位一个物理页，低 12 位可用来在该物理页内寻址。

页表项结构

页表就是个 N 行 l 列的表格,页表中的每一行(只有一个单元格)称为页表项( Page Table Entry，PTE )，其大小是 4 字节,页表项的作用是存储内存物理地址。当访问一个线性地址时,实际上就是在访问页表项中所记录的物理内存地址。

内存寻址之分页机制

不管是页目录还是页表，每个表项占4个字节，其表项结构基本相同，如上图。

页面地址对页目录而言，指的是页表所在的物理页面在内存的起始地址；对页表而言，指的是页所对应的物理页面在内存的起始物理地址。页面的起始地址是 4K 的整数倍，所以页面项的低 12 位另做它用，内核用这 12 位来存放页的属性。

属性包括以下内容：

第0位是存在位，如果P=1，表示该页存在于物理内存中，如果P=0，表示不在物理内存中。
第1位是读/写位，若为1表示可读可写，若为0表示可读不可写。
第2位是普通用户/超级用户位，这两位为页目录项提供硬件保护。当特权级为3的进程要想访问页面时，需要通过页保护检查，而特权级为0的进程就可以绕过页保护。
第3位是PWT（Page Write-Through）位，表示是否采用写透方式，写透方式就是既写内存（RAM）也写高速缓存,该位为1表示采用写透方式
第4位是PCD（Page Cache Disable）位，表示是否启用高速缓存,该位为1表示启用高速缓存。
第5位是访问位，若为 1 表示该页被 CPU 访问过了。
第6位是脏页位，当 CPU 对一个页面执行写操作时，就会设置对应页表项的D位为1。仅针对页表项有效，并不会修改目录项中的 D 位。
第7位是Page Size标志，只适用于页目录项。如果置为1，页目录项指的是4MB的页面，请看后面的扩展分页。
第8位为全局位，用来指定该页是否为全局页，为 1 表示是全局页，为 0 表示不是全局页。若为全局页，该页在高速缓存TLB中一直保存，给出虚拟地址直接给物理地址
第9~11位由操作系统专用，Linux也没有做特殊之用。

怎样用线性地址找到页表中对应的页表项？

首先要明确：分页机制打开前，要将页表地址加载到控制寄存器 CR3 中，这个地址是页表的物理地址。虽然分页机制的作用是将线性地址转换成物理地址，但其转换过程相当于在关闭分页机制下进行，过程中所涉及到的页表及页表项的寻址，它们的地址都被 CPU 当作最终的物理地址（本来也是物理地址）直接送上地址总线，不会被分页机制再次转换（否则会无限递归下去）。

一个页表项对应一个页，所以，用线性地址的高 20 位作为页表项的索引，每个页表项要占用 4 字节大小，所以这高 20 位的索引乘以 4 后才是该页表项相对于页表物理地址的字节偏移量。用 CR3 寄存器中的页表物理地址加上此偏移量便是该页表项的物理地址，从该页表项中得到映射的物理地址，然后用线性地址的低 12 位与该物理页地址相加，所得的地址就是最终要访问的物理地址。

为什么使用两级页表？

32 位环境下，4GB 线性空间分成 4KB 一个页，那就是 1M 个页，每个页表项需要 4 个字节来存储，那么整个 4GB 空间的映射就需要 4MB 的内存来存储管理信息。这只是一个线性地址空间的映射，每个进程都有自己的映射，假设有100个进程在运行，就需要 400MB 的内存来存储管理信息，太浪费了。

一级页表中所有页表项必须提前建好，且要求是连续的。为什么需要连续的呢？如果不连续，就没有办法通过页表寄存器+偏移量找到对应的页表项了。

所以要解决的是：不要一次性地将页表项全建好，需要时动态创建页表项。二级页表很好的解决了这个问题。

两级页表结构

所谓两级页表就是对页表再进行分页，一个页表内的所有页表项是连续存放的，页表本质上是一堆数据，也是以页为单位存放在主存中。

内存寻址之分页机制

第一级称为页目录表。每个页表的物理地址在页目录表中都以页目录项( Page Directory Entey，PDE ) 的形式来存储，4MB 的页表再次分页可以分为 1K ( 4MB / 4KB )个页，对每个页的描述需要 4 个字节，所以页目录表占用 4K 大小，正好是一个标准页的大小，其指向第二级表。线性地址的高 10 位产生第一级的索引，由索引得到的表项中，指定并选择了 1K 个二级表中的一个页表。

第二级称为页表，存放在一个 4K 大小的页面中，包含 1K 个表项，每个表项包含一个页的物理基地址。线性地址的中间 10 位产生第二级索引，可以获得包含页的物理地址的页表项。这个物理地址的高 20 位与线性地址的低 12 位形成了最终的物理地址。

内存寻址之分页机制

有人觉着这样做的话映射 4GB 地址空间需要 4MB+4KB 的内存，不是更大了吗？当然不是，在一个进程中，实际使用到的内存远没有4GB这么大，一级页表需要一次分配所有页表空间，且要求是连续的，两级页表则可以在需要的时候再分配页表空间，这样节省内存。

线性地址到物理地址的转换

内存寻址之分页机制

CR3包含着页目录的起始地址，用32位线性地址的最高10位A31~A22作为页目录的页目录项的索引，将它乘以4，与CR3中的页目录的起始地址相加，形成相应页表的地址。
从指定的地址中取出32位页目录项，它的低12位为0，这32位是页表的起始地址。用32位线性地址中的A21~A12位作为页表中的页面的索引，将它乘以4，与页表的起始地址相加，形成32位页面地址。
将A11~A0作为相对于页面地址的偏移量，与32位页面地址相加，形成32位物理地址。

整个过程是比较机械的，每次转换先获取物理页基地址，再从线性地址中获取索引，合成物理地址后再访问内存。不管是页表还是要访问的数据都是以页为单位存放在主存中的，因此每次访问内存时都要先获得基址，再通过索引(或偏移)在页内访问数据，因此可以将线性地址看作是若干个索引的集合。

快表 TLB( Translation Lookaside Buffer )简介

分页机制虽然很灵活，但是从线性地址转换为物理地址的过程还是比较麻烦，过程不再赘述。每一个线性地址到物理地址的转换都要重复转换的过程，涉及到多级页表就更显得麻烦。而且处理器的速度和内存的速度完全是两个数量级，页表在内存中，转换过程中频繁的访问内存，使得地址转换的速度慢上加慢。

那能不能通过线性地址直接得到对应的物理地址，免去查表的过程？答案是可以的，就是应用到缓存，根据程序局部性原理，可以将近来常访问的地址和指令加载到速度更快的设备中。处理器准备了一个高速缓存，专门用来存放虚拟地址页框与物理地址页框的映射关系，这个缓存就是 TLB，俗称快表。

内存寻址之分页机制

有了 TLB，处理器在寻址之前会用虚拟地址的高 20 位作为索引来查找 TLB 中的相关条目，如果命中则返回虚拟地址所映射的物理页框地址，否则会查询内存中的页表，获得物理地址后再更新 TLB。

Linux中的分页机制

内存寻址之分页机制

页全局目录
页*目录
页中间目录
页表

页全局目录包含若干页上级目录的地址，页上级目录又依次包含若干页中间目录的地址，而页中间目录又包含若干页表的地址。每一个页表项指向一个页框。线性地址因此被分成五个部分。图中没有显示位数，因为每一部分的大小与具体的计算机体系结构有关。

对于没有启用物理地址扩展的32位系统，两级页表已经足够了。从本质上说Linux通过使“页上级目录”位和“页中间目录”位全为0，彻底取消了页上级目录和页中间目录字段。不过，页上级目录和页中间目录在指针序列中的位置被保留，以便同样的代码在32位系统和64位系统下都能使用。内核为页上级目录和页中间目录保留了一个位置，这是通过把它们的页目录项数设置为1，并把这两个目录项映射到页全局目录的一个合适的目录项而实现的。

启用了物理地址扩展的32 位系统使用了三级页表。Linux的页全局目录对应80×86 的页目录指针表（PDPT），取消了页上级目录，页中间目录对应80×86的页目录，Linux的页表对应80×86的页表。

最后，64位系统使用三级还是四级分页取决于硬件对线性地址的位的划分。

我们虽然讨论的是Linux的分页机制，实际上我们用了大部分篇幅来讨论Intel CPU的分页机制实现。因为Linux的分页机制是建立在硬件基础之上的，不同的平台需要有不同的实现。Linux在软件层面构造的虚拟地址，最终还是要通过MMU转换为物理地址，也就是说，不管Linux的分页机制是怎样实现的，CPU只按照它的分页实现来解读线性地址，所以Linux传给CPU的线性地址必然是满足硬件实现的。例如说：Linux在32位CPU上，它的四级页表结构就会兼容到硬件的两级页表结构。可见，Linux在软件层面上做了一层抽象，用四级页表的方式兼容32位和64位CPU内存寻址的不同硬件实现。

内存寻址之分页机制

写在前面：

为什么要分页？

页与页表

页表项结构

怎样用线性地址找到页表中对应的页表项？

为什么使用两级页表？

两级页表结构

线性地址到物理地址的转换

快表 TLB( Translation Lookaside Buffer )简介

Linux中的分页机制

相关推荐