ConcurrentHashMap原理与使用

原理

ConcurrentHashMap采用分段锁，每一把锁锁住一段数据，这样在多线程访问不同段的数据时，不会存在锁竞争。

ConcurrentHashMap内部维护一个Segment数组segments和一个Node数组table。

Segment继承自ReentrantLock，代表一把重入锁。segments就是table所用到的所有锁。一个锁管理几个Node。

Node实现了Map.Entry接口，一个Node就是一个键值对。Node中封装了hash、key、value、next，可以在相同的hash值下建立链表。其中，key和hash用final修饰，value、next用volatile修饰。table就是整张哈希表。

Node与Segment的对应关系

Node在table中的索引、Segment在segments中的索引都是由key的哈希值计算得出的。其中：

hash值 » segmentShift位，然后再& segmentMask得到在segments中的索引；
(table的长度 - 1) & hash 得到在table中的索引。

因此，Node和Segment实现对应。

put()实现

计算Segment得到在segments中的索引；
获取Segment对象，tryLock()尝试获取锁；
获取成功后，计算Node在table中的索引；
获取索引位置的链表的第一个Node，开始遍历；比较每个Node的key，如果相同更新value，否则创建新的Node加入链表末端。

get()实现

计算Node在table中的索引；
获取索引位置的链表的第一个Node，开始遍历；
比较每个Node的key，如果相同返回value，否则返回null。

注意到get()操作并不加锁。读操作的正确性由final和volatile保证。

size()等需要遍历整个table的操作

先给3次机会，不lock所有的Segment，遍历所有Segment，累加各个Segment的大小得到整个Map的大小，如果某相邻的两次计算获取的所有Segment的更新的次数（每个Segment都有一个modCount变量，这个变量在Segment中的Entry被修改时会加一，通过这个值可以得到每个Segment的更新操作的次数）是一样的，说明计算过程中没有更新操作，则直接返回这个值。如果这三次不加锁的计算过程中Map的更新次数有变化，则之后的计算先对所有的Segment加锁，再遍历所有Segment计算Map大小，最后再解锁所有Segment。

对比HashTable的优势

HashTable线程安全的策略实现代价太大，get/put所有相关操作都是synchronized的，这相当于给整个哈希表加了一把大锁，多线程访问时候，只要有一个线程访问或操作该对象，其他线程只能阻塞，相当于将所有的操作串行化，在高并发场景中性能就会非常差。

ConcurrentHashMap采用分段锁，在容器中有多把锁，每一把锁锁住一段数据，这样在多线程访问时不同段的数据时，就不会存在锁竞争了，这样便可以有效地提高并发效率。

ConcurrentHashMap原理与使用