【数据结构】搜索中散列构造时冲突处理方法

一、冲突产生原因

散列函数是一个压缩映象函数。关键码集合比散列表地址集合大得多。因此有可能经过散列函数的计算，把不同的关键码映射到同一个散列地址上，就会产生冲突。

二、处理冲突的方法之一—闭散列法，也称开地址法

1.线性探查法：
（1）方法概述
先用除留余数法计算散列地址 hash(key) = key % p
若发现冲突，则使用增量 i 探查空的散列地址，直至无冲突出现为止。
H0 = hash (key)
Hi = (H0 + i) % m， i =1, 2, …, m-1
例题：
【数据结构】搜索中散列构造时冲突处理方法

（2）线性探查法平均搜索长度ASL
搜索成功的平均搜索长度 ASLsucc 是指找到表中已有表项的平均探查次数，是找到表中各个已有表项的探查次数的平均值。如：
【数据结构】搜索中散列构造时冲突处理方法

2.二次探查法
（1）方法概述
先用除留余数法计算散列地址 hash(key) = key%p，若发现冲突，则使用增量 + i 2探查空的散列地址，直至无冲突出现为止。
H0 = hash(key)
Hi = (H0+i2) % m, Hi = (H0-i2)% m,
i = 1, 2, 3, …, (m-1)/2，m 是表的大小
二次探查法的探查序列形如：
H0, H0+1, H0-1, H0+4, H0-4, H0+9, H0-9, …。

举例：【数据结构】搜索中散列构造时冲突处理方法

（2）二次探查法平均搜索长度
计算方法同线性探查法

3.伪随机探查法
先用除留余数法计算散列地址 hash(key) = key%p，
若发现冲突，则用一个伪随机数序列探查空的散列地址，直至无冲突出现为止。
H0 = hash (key)
Hi = (H0 + i ) % m， i =r1, r2, r3, … (伪随机数序列)
举例：
【数据结构】搜索中散列构造时冲突处理方法

4.双散列法
使用双散列方法时, 需要两个散列函数:
• 第一个散列函数按表项的关键码 key 计算散列地址，H0 = Hash(key)。
• 一旦发生冲突，就利用第二个散列函数ReHash()计算下一个散列地址的移位量。它的取值与key的值有关, 要求它的取值小于散列表的长度m，且与表长m为互质的正整数。
• H0 = Hash(key)， p = ReHash(key)；
• Hi = (Hi-1+ p) % m； p是小于m且与m互质的整数
• 利用双散列法, 按一定的距离, 跳跃式地寻找下一个空的散列地址, 减少了“堆积”的机会。
举例
【数据结构】搜索中散列构造时冲突处理方法

【数据结构】搜索中散列构造时冲突处理方法

二、处理冲突的方法之二—开散列法（链地址法）

【数据结构】搜索中散列构造时冲突处理方法
即将同义词放在同一子集，前后用指针联结即可
优点：
① 处理冲突简单，无堆积现象，因此平均查找长度较短；② 由于链地址法中链表上的结点空间是动态申请的，故它更适合于构造散列表前无法确定表长的情况；③ 开放定址法为减少冲突，必须保持大量空闲的存储空间以确保搜索效率；而链地址法中，当结点数目较大时，增加的指针域可忽略不计，因此能节省存储空间；④ 用链地址法构造的散列表中，删除结点易于实现。而开放地址法构造的散列表，只能在被删的表项上做删除标记，不能真正删除表项。

注：图片来自于济南大学信息科学与工程学院数据结构课程课件

【数据结构】搜索中散列构造时冲突处理方法

一、冲突产生原因

二、处理冲突的方法之一—闭散列法，也称开地址法

二、处理冲突的方法之二—开散列法（链地址法）

相关推荐