HashMap的源码分析

hashmap和hashtable的区别

hashmap线程不安全，效率比较高，hashtable线程安全，效率低。
hashmap中key和value都可以为空，hashtable不允许为空。

hashmap的初始值为2的n次幂，原因：

hash & (initCapacity - 1)分别进行 & 操作，提高效率， & 要比取模运算效率要高。

由于initCapacity - 1 是全1，这样数组下标 index 的值完全取决于 key 的 hash 值的后几位。如果不是全1，那么按位与的时候，容易发生哈希碰撞。
在扩容之后涉及元素的迁移过程，迁移的时候只需要判断二进制的前一位是0或者是1即可。
如果是0，表示新数组和旧数组的下标位置不变，如果是1，只需要将索引位置加上旧的数组的长度值即为新数组的下标。

1.7 hashmap的源码分析：数组+链表

默认初始容量

加载因子

put操作
1）设置值，计算hash
2）扩展操作
3）数据迁移的过程

private void inflateTable(int toSize)
`capacity` : hashmap的初始值,为2的n次幂
`threshold = capacity * loadFactor` : loadFactor是加载因子，每次进行扩容的时候会用到。如果capacity = 16，loadFactor = 0.75，那么当容量为12的时候我们可以进行扩容。
`table = new Entry(capacity)` 在堆里面创建一个数组空间,我们可以往里面放入元素值了。

if(key == null)
为了减少哈希碰撞

关于 |= , &= , ^= 运算符
a |= b：相当于“a ∪ b” 只有a，b二进制位均为0时，结果才为0
a &= b：相当于“a ∩ b” 只有a，b二进制位均为1时，结果才为0
a |= b：相当于“a异或b” 只有a，b二进制位相异，结果才为0

1.8 hashmap的源码分析：数组+链表+红黑树

扰动函数：让高位参与运算来减少哈希碰撞发生的概论。

1.8之后，当链表长度过长（默认超过了8），就转为红黑树。

问题

问题一：对HashMap 构造方法中 initialCapacity（初始容量）、loadFactor（加载因子）的理解？

初始容量代表了哈希表中table数组的初始长度，默认是16，如果自定义，会通过方法保证每次初始容量为2的n次幂。
加载因子衡量了散列表的空间使用程度，加载因子越大，对空间利用越充分，但是越容易发生hash碰撞。默认0.75。
如果当前存储数量超过了阈值【初始容量 * 加载因子】，就要进行扩容操作。

问题二： JDK1.7 中 HashMap 什么情况下会发生扩容？如何扩容？

扩容必须满足两个条件:

存放新值的时候当前已有元素必须大于等于阈值；
存放新值的时候当前存放数据发生hash碰撞

所以在第一次扩容时候，最少存到了16个键值对，最多能存到26个键值对
不超过阈值时候，每次都存到同一个位置，最多存了11个；第12个开始，后面15个没有发生哈希碰撞，所以一共能存27个才发生扩容。

如果满足扩容条件，调用扩容的方法：把原数组中的值放到新数组中。然后设置hashmap的新阈值（threshold）：newCapacity * loadFactor。新容量=2 * oldCapcity

元素迁移过程：

通过key值的hash值和新数组的大小，计算出在当前数组中的位置。
因为数组扩大了两倍，迁移的时候只需要判断二进制的前一位是0或者是1即可。如果是0，新数组中位置就是旧数组的位置；如果是1，新数组中的位置就是旧数组的位置再加上数组的长度。
取出数组元素，遍历链表。原来hash冲突的链表尾部变成了新数组元素中，链表的头部。