导读：经过前面的博客总结，可以知道的是，HashMap是有一个一维数组和一个链表组成，从而得知，在解决冲突问题时，hashmap选择的是链地址法。为什么HashMap会用一个数组这链表组成，当时给出的答案是从那几种解决冲突的算法中推论的，这里给出一个正面的理由：

1，为什么用了一维数组：数组存储区间是连续的，占用内存严重，故空间复杂的很大。但数组的二分查找时间复杂度小，为O(1)；数组的特点是：寻址容易，插入和删除困难

2，为什么用了链表：链表存储区间离散，占用内存比较宽松，故空间复杂度很小，但时间复杂度很大，达O（N）。链表的特点是：寻址困难，插入和删除容易

而HashMap是两者的结合，用一维数组存放散列地址，以便更快速的遍历；用链表存放地址值，以便更快的插入和删除！

一、环形链表的形成分析

那么，在HashMap中，到底是怎样形成环形链表的？这个问题，得从HashMap的resize扩容问题说起！

备注：本博客中所示源码，均为java 7版本

HashMap中是如何形成环形链表的

HashMap的扩容原理：

当HashMap中的元素个数超过数组大小(数组总大小length，不是数组中个数size)*loadFactor时，就会进行数组扩容，loadFactor的默认值为0.75，这是一个折中的取值。也就是说，默认情况下，数组大小为16，那么当HashMap中元素个数超过16*0.75=12（这个值就是代码中的threshold值，也叫做临界值）的时候，就把数组的大小扩展为 2*16=32，即扩大一倍，然后重新计算每个元素在数组中的位置，而这是一个非常消耗性能的操作，所以如果我们已经预知HashMap中元素的个数，那么预设元素的个数能够有效的提高HashMap的性能。

再看源码中，关于扩容resize()的实现:

HashMap中是如何形成环形链表的

备注：请注意这句话： newCapacity the new capacity, MUST be a power of two; must be greater than current capacity unless current capacity is MAXIMUM_CAPACITY (in which case value is irrelevant)

在这里面，又调用了一个函数transfer函数：

HashMap中是如何形成环形链表的

总得来说，就是拷贝旧的数据元素，从新新建一个更大容量的空间，然后进行数据复制！

那么关于环形链表的形成，则主要在这扩容的过程。当多个线程同时对这个HashMap进行put操作，而察觉到内存容量不够，需要进行扩容时，多个线程会同时执行resize操作，而这就出现问题了，问题的原因分析如下：

首先，在HashMap扩容时，会改变链表中的元素的顺序，将元素从链表头部插入。PS：说是为了避免尾部遍历，这一部分不是本博客的主要介绍内容，后面再说。

而环形链表就在这一时刻发生，以下模拟2个线程同时扩容。假设，当前hashmap的空间为2（临界值为1），hashcode分别为0和1，在散列地址0处有元素A和B，这时候要添加元素C，C经过hash运算，得到散列地址为1，这时候由于超过了临界值，空间不够，需要调用resize方法进行扩容，那么在多线程条件下，会出现条件竞争，模拟过程如下：

（额，我画图的功底一向不好，见谅见谅）

线程一：读取到当前的hashmap情况，在准备扩容时，线程二介入

HashMap中是如何形成环形链表的

线程二：读取hashmap，进行扩容

HashMap中是如何形成环形链表的

线程一：继续执行

HashMap中是如何形成环形链表的

这个过程为，先将A复制到新的hash表中，然后接着复制B到链头（A的前边：B.next=A），本来B.next=null，到此也就结束了（跟线程二一样的过程），但是，由于线程二扩容的原因，将B.next=A，所以，这里继续复制A，让A.next=B，由此，环形链表出现：B.next=A; A.next=B

二、总结

在这里，只总结一个事儿，额，算是摘抄总结吧，就是在源码注释中，发现扩容的时候，必须为2的指数，这是为什么呢？

HashMap中是如何形成环形链表的

一、环形链表的形成分析

二、总结

相关推荐