java.util.HashSet,java.util.LinkedHashMap,java.util.IdentityHashMap源码阅读(JDK1.8.0_111)

作者：冷恋企鹅 | 来源：互联网 | 2023-05-17 12:16

一、java.util.HashSet1.1HashSet集成结构1.2java.util.HashSet属性1privatetransientHashMap&am

一、java.util.HashSet

1.1 HashSet集成结构

java.util.HashSet, java.util.LinkedHashMap, java.util.IdentityHashMap 源码阅读 (JDK 1.8.0_111)

1.2 java.util.HashSet属性

1     private transient HashMap map;
2 
3     // Dummy value to associate with an Object in the backing Map
4     private static final Object PRESENT = new Object();

HashSet的本质其实就是一个HashMap。Set集合一个重要的特性就是元素不重复，而HashMap本身就是符合这一特性的。

1     public Iterator iterator() {
2         return map.keySet().iterator();
3     }

集合的迭代器就是HashMap中keySet()的迭代器。

HashSet类需要理解的不多，看懂了HashMap这个类就没什么问题了。HashMap源码解析请参考：java.util.HashMap和java.util.HashTable (JDK1.8)

二、java.util.LinkedHashMap

2.1 LinkedHashMap继承结构

java.util.HashSet, java.util.LinkedHashMap, java.util.IdentityHashMap 源码阅读 (JDK 1.8.0_111)

图中蓝色的为继承extend，虚线为implements

HashMap的本质是一个Node的数组，本质是个数组，数组可以根据下标去访问数组内容。HashMap的Map.Entry是无序的。

LinkedHashMap继承自HashMap，因此LinkedHashMap首先它是一个HashMap，其次它具备Node链表的属性。这个Node链表维护了Node插入顺序或者访问顺序。

2.2 LinkedHashMap属性

 1     static class Entry extends HashMap.Node {
 2         // 包含前一节点和后一节点的引用，是个双向链表
 3         Entry before, after;
 4         Entry(int hash, K key, V value, Node next) {
 5             super(hash, key, value, next);
 6         }
 7     }
 8     // 链表头节点，也是最老的节点
 9     transient LinkedHashMap.Entry head;
10     // 链表尾节点，也是最年轻的节点
11     transient LinkedHashMap.Entry tail;
12     // 访问顺序，true为访问顺序，false为插入顺序
13     final boolean accessOrder;

accessOrder默认为false，如果需要设置成true，LinkedhashMap提供了如下构造函数：

1     public LinkedHashMap(int initialCapacity,
2                          float loadFactor,
3                          boolean accessOrder) {
4         super(initialCapacity, loadFactor);
5         this.accessOrder = accessOrder;
6     }

设置为false，则整个双向链表按照插入顺序进行排列；为true则按照访问顺序进行排列，当某个节点被get访问，则将该节点放置到链表最结尾（最结尾是最年轻的节点）。

访问顺序则是采用了LRU（Least recently used，最近最少使用）算法，其核心思想是“如果数据最近被访问过，那么将来被访问的几率也更高”。

2.3 LinkedHashMap方法

 1     // 将src的相关引用全部复制给dst节点
 2     private void transferLinks(LinkedHashMap.Entry src,
 3                                LinkedHashMap.Entry dst) {
 4         // 修改节点自身的before和after引用
 5         LinkedHashMap.Entry b = dst.before = src.before;
 6         LinkedHashMap.Entry a = dst.after = src.after;
 7         // 修改前后节点的引用
 8         if (b == null)
 9             head = dst;
10         else
11             b.after = dst;
12         if (a == null)
13             tail = dst;
14         else
15             a.before = dst;
16     }

这个方法是替换节点的核心，新的节点接替旧的节点的所有引用关系，旧的节点无法被引用最终会被GC回收。

 1     // 删除节点操作
 2     void afterNodeRemoval(Node e) { // unlink
 3         // 保存当前节点及其前后节点
 4         LinkedHashMap.Entry p =
 5             (LinkedHashMap.Entry)e, b = p.before, a = p.after;
 6         // 从链表中去除掉该节点，主要是去除对该节点的引用
 7         // 将该节点对链表其它节点的引用也去掉
 8         p.before = p.after = null;
 9         if (b == null)
10             head = a;
11         else
12             b.after = a;
13         if (a == null)
14             tail = b;
15         else
16             a.before = b;
17     }
18 
19     void afterNodeAccess(Node e) { // move node to last
20         LinkedHashMap.Entry last;
21         // 如果按照访问顺序，则需要将被访问节点至于链表最结尾处
22         if (accessOrder && (last = tail) != e) {
23             LinkedHashMap.Entry p =
24                 (LinkedHashMap.Entry)e, b = p.before, a = p.after;
25             p.after = null;
26             if (b == null)
27                 head = a;
28             else
29                 b.after = a;
30             if (a != null)
31                 a.before = b;
32             else
33                 last = b;
34             if (last == null)
35                 head = p;
36             else {
37                 p.before = last;
38                 last.after = p;
39             }
40             tail = p;
41             ++modCount;
42         }
43     }
44 
45     void afterNodeInsertion(boolean evict) { // possibly remove eldest
46         LinkedHashMap.Entry first;
47         // removeEldestEntry(first) 默认返回false，如果需要可以继承LinkedHashMap，覆盖该函数。
48         // removeEldestEntry(first) 如果返回true,则在put的时候会删除链表头结点
49         if (evict && (first = head) != null && removeEldestEntry(first)) {
50             K key = first.key;
51             removeNode(hash(key), key, null, false, true);
52         }
53     }

上面三个方法在HashMap中也是存在的，不过方法体为空，LinkedHashMap覆盖了该方法。在HashMap的put、get、remove方法中

LinkedHashMap并没有重新实现put、get、remove、clear方法，仍然是采用HashMap的实现方式，不同的是afterNodeRemoval、afterNodeAccess、afterNodeInsertion已经不再是空的方法体了。

在LinkedHashMap, LinkedKeySet, LinkedValueSet, LinkedEntrySet类中的forEach方法以及都是遍历链表的，因此可以按照插入顺序（或访问顺序）去遍历LinkedHashMap，从而解决了HashMap无序问题。

三、java.util.IndentifyHashMap

3.1 IndentifyHashMap继承结构

java.util.HashSet, java.util.LinkedHashMap, java.util.IdentityHashMap 源码阅读 (JDK 1.8.0_111)

IdentityHashMap虽然冠以HashMap之名，却不是HashMap的子类，它是继承自AbstractHashMap。

IdentityHashMap比较两个key是否相等，并不是采用内容比较，而是直接进行==比较，比较两个key是否为同一个对象。

3.2 IdentityHashMap属性

1     transient Object[] table; // non-private to simplify nested class access
2     int size;
3     transient int modCount;
4     static final Object NULL_KEY = new Object();

identityHashMap是一个Object数组，size表示当前Map存入的数据总数，modCount表示修改次数。

IdentityHashMap允许使用NULL作为key，如下代码所示，如果key为null，则存入预先定义的NULL_KEY对象。

1     private static Object maskNull(Object key) {
2         return (key == null ? NULL_KEY : key);
3     }
4 
5     static final Object unmaskNull(Object key) {
6         return (key == NULL_KEY ? null : key);
7     }

3.3 IdentityHashMap方法

1     private static int nextKeyIndex(int i, int len) {
2         return (i + 2 );
3     }

这个方法在IdentityHashMap中频繁用到，作用是寻找下一个index以解决hash碰撞问题，下一个index获取也是按照非常简单的(i+2

HashMap采用链表和红黑树避免hash碰撞问题，而在IdentityHashMap中则是采用开放定址法，而且采用的是最简单的线性探测法。

我们先来看下最hash算法

1     private static int hash(Object x, int length) {
2         int h = System.identityHashCode(x);
3         // Multiply by -127, and left-shift to use least bit as part of hash
4         return ((h <<1) - (h <<8)) & (length - 1);
5     }

无论x对象所属的类是否重新实现了hashCode()方法，System.identityHashCode(x) 都将返回默认的hashCode()结果，所谓默认的hashCode()就是指Object类中的hashCode()方法。Object类中的hashCode()可以为不同的对象返回不同的结果，根据Java doc中的描述，这是根据对象的内存地址来计算hash结果的。System.identityHashCode(x) 在x为null时返回0。

hash方法在通过System.identityHashCode方法获得hash code之后，再通过移位和与运算计算index。因为采用System.identityHashCode方法获取hash code，因此不同的对象hash code是不同的。

 1     public V put(K key, V value) {
 2         final Object k = maskNull(key);
 3 
 4         retryAfterResize: for (;;) {
 5             final Object[] tab = table;
 6             final int len = tab.length;
 7             // 计算下标
 8             int i = hash(k, len);
 9             
10             // 遍历所有可能的位置，直到找到一个空位
11             for (Object item; (item = tab[i]) != null;
12                  i = nextKeyIndex(i, len)) {
13                 // 待插入的key已经存在，替换value
14                 if (item == k) {
15                     @SuppressWarnings("unchecked")
16                         V oldValue = (V) tab[i + 1];
17                     tab[i + 1] = value;
18                     return oldValue;
19                 }
20             }
21 
22             // 新加一个节点如果size > len/3则需要扩容
23             final int s = size + 1;
24             // Use optimized form of 3 * s.
25             // Next capacity is len, 2 * current capacity.
26             if (s + (s <<1) > len && resize(len))
27                 // 扩容后待插入的节点需要重新查找位置
28                 continue retryAfterResize;
29 
30             // 修改次数加一
31             modCount++;
32             // 在下标i存放key，在i+1下标存放value
33             tab[i] = k;
34             tab[i + 1] = value;
35             size = s;
36             return null;
37         }
38     }

在put方法中，判断两个key是否相等，是直接使用“==”的，也就是说不同对象就会被当做不同的key处理。

其次在存放的时候i存放key，i+1存放value，这也就能解释查找下一个空位方法nextKeyIndex中使用i+2的原因了。

从put方法中还能看出扩容条件为size > len/3，也就是说IdentityHashMap最多只能使用总capacity的1/3。相对于HashMap默认的loadFactor=0.75，IdentityHashMap的使用率还是非常低的。

接下来看下resize方法

 1     private boolean resize(int newCapacity) {
 2         // assert (newCapacity & -newCapacity) == newCapacity; // power of 2
 3         // 直接扩容为之前的2倍
 4         int newLength = newCapacity * 2;
 5 
 6         Object[] oldTable = table;
 7         int oldLength = oldTable.length;
 8         if (oldLength == 2 * MAXIMUM_CAPACITY) { // can't expand any further
 9             if (size == MAXIMUM_CAPACITY - 1)
10                 throw new IllegalStateException("Capacity exhausted.");
11             return false;
12         }
13         if (oldLength >= newLength)
14             return false;
15         // 重新new一个新的数组出来，简单粗暴！
16         Object[] newTable = new Object[newLength];
17 
18         for (int j = 0; j ) {
19             Object key = oldTable[j];
20             if (key != null) {
21                 Object value = oldTable[j+1];
22                 // 将原数组上的key value清空，不清空将会导致内存无法被释放
23                 oldTable[j] = null;
24                 oldTable[j+1] = null;
25                 // key重新hash
26                 int i = hash(key, newLength);
27                 while (newTable[i] != null)
28                     // hash冲突了就查找下一个位置
29                     i = nextKeyIndex(i, newLength);
30                 newTable[i] = key;
31                 newTable[i + 1] = value;
32             }
33         }
34         table = newTable;
35         return true;
36     }

resize方法真的是简单粗暴，直接double capacity，然后将旧的table中的数据hash到新的table中。

 1     public V get(Object key) {
 2         Object k = maskNull(key);
 3         Object[] tab = table;
 4         int len = tab.length;
 5         // 根据key计算下标
 6         int i = hash(k, len);
 7         while (true) {
 8             Object item = tab[i];
 9             if (item == k)
10                 return (V) tab[i + 1];
11             if (item == null)
12                 return null;
13             // 查找下一个位置
14             i = nextKeyIndex(i, len);
15         }
16     }

get方法和containsKey方法方法体相同，其实现思路也就是遍历数组，如果插到一个空位置，则说明不存在该key。

 1     public V remove(Object key) {
 2         Object k = maskNull(key);
 3         Object[] tab = table;
 4         int len = tab.length;
 5         int i = hash(k, len);
 6 
 7         while (true) {
 8             Object item = tab[i];
 9             // 查找到该key
10             if (item == k) {
11                 modCount++;
12                 size--;
13                 @SuppressWarnings("unchecked")
14                     V oldValue = (V) tab[i + 1];
15                 // 相应位置置空
16                 tab[i + 1] = null;
17                 tab[i] = null;
18                 // 直接置空会导致查找出现问题
19                 closeDeletion(i);
20                 return oldValue;
21             }
22             // 没有找到该key
23             if (item == null)
24                 return null;
25             i = nextKeyIndex(i, len);
26         }
27     }

因为IdentityHashMap是以开放定址法解决hash冲突的，直接将数组某个地方设置为null，势必会导致查找出问题。为此需要调用closeDeletion方法来解决这一问题。

 1     private void closeDeletion(int d) {
 2         // Adapted from Knuth Section 6.4 Algorithm R
 3         Object[] tab = table;
 4         int len = tab.length;
 5 
 6         Object item;
 7         for (int i = nextKeyIndex(d, len); (item = tab[i]) != null;
 8              i = nextKeyIndex(i, len) ) {
 9             int r = hash(item, len);
10             // 将后面的因为hash碰撞而存放的元素往前移
11             if ((i  i)) {
12                 // 将后面的元素往前移位
13                 tab[d] = item;
14                 tab[d + 1] = tab[i + 1];
15                 tab[i] = null;
16                 tab[i + 1] = null;
17                 d = i;
18             }
19         }
20     }

closeDeletion方法其思路就是对空置出来的位置d后面的元素进行hash判断，如果之前是因为hash碰撞存放在d后面的，则直接往前移，将这个空置的d位置给覆盖掉。在这个过程中要注意table数组是个环形的。

整体感觉IdentityHashMap实现非常的简单粗暴，优化较少，可能是因为使用较少的原因。

推荐阅读

js
Java集合框架的使用方法与性能对比分析

本文详细探讨了Java集合框架的使用方法及其性能特点。首先，通过关系图展示了集合接口之间的层次结构，如`Collection`接口作为对象集合的基础，其下分为`List`、`Set`和`Queue`等子接口。其中，`List`接口支持按插入顺序保存元素且允许重复，而`Set`接口则确保元素唯一性。此外，文章还深入分析了不同集合类在实际应用中的性能表现，为开发者选择合适的集合类型提供了参考依据。 ... [详细]

蜡笔小新 2024-11-01 09:51:38
list
如何在Spark数据排序过程中有效避免内存溢出（OOM）问题

本文深入探讨了在使用Spark进行数据排序时如何有效预防内存溢出（OOM）问题。通过具体的代码示例，详细阐述了优化策略和技术手段，为读者在实际工作中遇到类似问题提供了宝贵的参考和指导。 ... [详细]

蜡笔小新 2024-11-01 16:55:53
list
稀疏直接法视觉里程计中的特征点优化：基于光度误差最小化的灰度图像线性插值技术

在稀疏直接法视觉里程计中，通过优化特征点并采用基于光度误差最小化的灰度图像线性插值技术，提高了定位精度。该方法通过对空间点的非齐次和齐次表示进行处理，利用RGB-D传感器获取的3D坐标信息，在两帧图像之间实现精确匹配，有效减少了光度误差，提升了系统的鲁棒性和稳定性。 ... [详细]

蜡笔小新 2024-10-31 13:24:59
js
深入解析十大经典排序算法：动画演示、原理分析与代码实现

本文深入探讨了十种经典的排序算法，不仅通过动画直观展示了每种算法的运行过程，还详细解析了其背后的原理与机制，并提供了相应的代码实现，帮助读者全面理解和掌握这些算法的核心要点。 ... [详细]

蜡笔小新 2024-10-29 12:31:50
default
深入解析 C# 中 SqlCommand 与 SqlDataAdapter 的核心差异与应用场景

本文深入探讨了 C# 中 `SqlCommand` 和 `SqlDataAdapter` 的核心差异及其应用场景。`SqlCommand` 主要用于执行单一的 SQL 命令，并通过 `DataReader` 获取结果，具有较高的执行效率，但灵活性较低。相比之下，`SqlDataAdapter` 则适用于复杂的数据操作，通过 `DataSet` 提供了更多的数据处理功能，如数据填充、更新和批量操作，更适合需要频繁数据交互的场景。 ... [详细]

蜡笔小新 2024-10-28 12:25:41
default
优化后的标题：在 Asp.net 中动态加载 DropDownList 控件的数据源方法与技巧

在 Asp.net 应用中，动态加载 DropDownList 控件的数据源是一项常见需求。本文探讨了如何高效地从数据库中获取数据，并实时更新下拉列表，确保用户界面始终与后台数据保持同步。通过使用 ADO.NET 和 LINQ to SQL 技术，开发者可以轻松实现这一功能，同时提高应用的性能和用户体验。文中还提供了代码示例和最佳实践，帮助开发者解决常见的数据绑定问题。 ... [详细]

蜡笔小新 2024-10-24 19:57:15
list
计算 n 叉树中各节点子树的叶节点数量分析

计算 n 叉树中各节点子树的叶节点数量分析 ... [详细]

蜡笔小新 2024-11-01 12:22:01
int
利用C#技术实现Word文档的动态生成与编辑

本文通过一个简单的示例，介绍了如何使用C#语言实现Word文档的动态生成与编辑功能。文章详细阐述了在项目中引用Word动态库的方法，并通过具体代码示例展示了如何创建和操作Word表格。此内容旨在为初学者提供参考和学习资料，欢迎读者提出宝贵意见和建议。 ... [详细]

蜡笔小新 2024-11-01 09:37:18
list
开发心得：深入探讨Servlet、Dubbo与MyBatis中的责任链模式应用

开发心得：深入探讨Servlet、Dubbo与MyBatis中的责任链模式应用 ... [详细]

蜡笔小新 2024-10-31 20:30:19
require
深入解析JWT的实现与应用

本文深入探讨了JSON Web Token (JWT) 的实现机制及其应用场景。JWT 是一种基于 RFC 7519 标准的开放性认证协议，用于在各方之间安全地传输信息。文章详细分析了 JWT 的结构、生成和验证过程，并讨论了其在现代 Web 应用中的实际应用案例，为开发者提供了全面的理解和实践指导。 ... [详细]

蜡笔小新 2024-10-31 20:06:46
list
如何在 Java LinkedHashMap 中高效地提取首个或末尾的键值对？

如何在 Java LinkedHashMap 中高效地提取首个或末尾的键值对？ ... [详细]

蜡笔小新 2024-10-31 12:19:08
function
C语言中extern的简易编译方法及预编译、static和extern的综合应用解析

本文详细探讨了C语言中`extern`关键字的简易编译方法，并深入解析了预编译、`static`和`extern`的综合应用。通过具体的代码示例，介绍了如何在不同的文件之间共享变量和函数声明，以及这些关键字在编译过程中的作用和影响。文章还讨论了预编译过程中宏定义的使用，为开发者提供了实用的编程技巧和最佳实践。 ... [详细]

蜡笔小新 2024-10-31 11:53:22
email
C#编程指南：实现列表与WPF数据网格的高效绑定方法

C#编程指南：实现列表与WPF数据网格的高效绑定方法 ... [详细]

蜡笔小新 2024-10-31 10:46:47
int
技术日志：深入探讨Spark Streaming与Spark SQL的融合应用

技术日志：深入探讨Spark Streaming与Spark SQL的融合应用 ... [详细]

蜡笔小新 2024-10-30 14:20:53
js
获取文件列表：DictoryInfo.GetFiles 方法详解与应用

本文详细解析了 `DirectoryInfo.GetFiles` 方法的使用方法及其应用场景。通过示例代码展示了如何在 C# 程序中利用该方法获取指定目录下的所有文件列表，同时探讨了其参数选项和返回值类型，为开发者提供了实用的操作指南。 ... [详细]

蜡笔小新 2024-10-26 16:05:55

冷恋企鹅

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章