[toc]

表格数据使用字典和列表存储, 并实现访问

字典核心底层原理 (重要)

字典对象的核心是散列表. 散列表是一个稀疏数组 ( 总是有空白元素的数组 ), 数组的每个单元叫做 bucket. 每个 bucket 有两个部分: 一个是键对象的引用, 一个是值对象的引用.

由于, 所有 bucket 结构和大小一致, 我们可以通过偏移量来读取指定 bucket.

Python 第四节第五课

将一个键值存放进字典的底层过程

>>> a = {}

>>>

a["name"] = "我是小白"

假设字典 a 对象创建完后, 数组长度为 8:

Python 第四节第五课

我们要把 "name" = "我是小白" 这个键值对放到字典对象 a 中, 首先第一步需要计算键 "name" 的散列值. Python 中可以通过 hash() 来计算.

>>> bin(hash("name"))

0b100000111110100101100111000111101100110100111111000000110100101

由于数组长度为 8, 我们可以拿计算出的散列在的最右边 3 位数字作为偏移量, 即 "101", 十进制是数字 5. 我们查看偏移量 5, 对应的 bucket 是否为空. 如果为空, 则将键值对放进去. 如果不为空, 则依次取右边 3 位作为1偏移量, 即 "100", 十进制是数字 4. 再查看偏移量为 4 的 bucket 是否为空. 直到为空的 bucket 将键对值放进去. 流程如下:

Python 第四节第五课

扩容

Python 会根据散列表的拥挤程度扩容. "扩容" 指的是: 创造更大的数组, 将原有内容拷贝到新数组中.

接近 2/3 时, 数组就会扩容.

Python 第四节 第五课

表格数据使用字典和列表存储, 并实现访问

字典核心底层原理 (重要)

将一个键值存放进字典的底层过程

扩容

相关推荐

Python 第四节第五课