深入解析JDK8HashMap源代码：put方法详解及capacity、size、loadFactor和红黑树转换阈值的设定原理

作者：mobiledu2502923573 | 来源：互联网 | 2024-11-10 14:10

本文深入解析了JDK8中HashMap的源代码，重点探讨了put方法的工作机制及其内部参数的设定原理。HashMap允许键和值为null，但键为null的情况只能出现一次，因为null键在内部通过索引0进行存储。文章详细分析了capacity（容量）、size（大小）、loadFactor（加载因子）以及红黑树转换阈值的设定原则，帮助读者更好地理解HashMap的高效实现和性能优化策略。

HashMap

一、HashMap允许key为null&＃xff0c;value为null&＃xff0c;但是key为null只可以为一个&＃xff0c;因为放进去key &＃61; null的新键值对&＃xff0c;再放进去的时候会更新key &＃61; null的value值

二、put(key, value)的过程

return putVal(hash(key), key, value, false, true);

0、创建了HashMap以后&＃xff0c;其capacity为16&＃xff08;仅仅是DEFAULT_INITIAL_CAPACITY值为16但是容量并不为16&＃xff0c;目前里面实际存储键值对的Node数组仍然为空&＃xff09;、loadFactor为0.75&＃xff1b;size&＃xff08;为键值对的个数而不是桶被占用的个数&＃xff09;、threshold为0&＃xff0c;在put第一个值的时候才new Node[16]&＃xff0c;threshold&＃61;16 * 0.75&＃xff1b;

HashMap底层存储数据其实是一个其内部类Node implements Map.Entry的数组

1、key先进行hash运算

&＃xff08;1&＃xff09;如果key为null&＃xff0c;返回0&＃xff1b;

&＃xff08;2&＃xff09;如果不为null&＃xff0c;执行hashcode运算

Ⅰ.如果为普通数据&＃xff08;字符串、数字&＃xff09;&＃xff0c;那么它的hashCode运算为&＃xff1a;

&＃xff08;数字会自动装箱转为包装类&＃xff0c;使用其重写的hashcode运算&＃xff09;

* 字符串对象内部存储为数组&＃xff1b;* int h &＃61; 0* 循环计算&＃xff1a;h &＃61; h*31 &＃43; 字符数组中的字符ASCII值

Ⅱ.如果为Java对象&＃xff0c;一般需要重写hashCode方法&＃xff0c;不重写的话会调用本地方法&＃xff0c;这个方法是C语言实现的&＃xff0c;但是返回值绝对不是对象的内存地址&＃xff1b;

public native int hashCode();

&＃xff08;3&＃xff09;hashCode的返回值hash和hash自己做无符号右移16位后的值做&运算&＃xff08;高位补0&＃xff09;

return (key &＃61;&＃61; null) ? 0 : (h &＃61; key.hashCode()) ^ (h >>> 16);

2、将hash值&＃xff0c;key和value传入putVal()方法中&＃xff0c;开始做散列

将hash值 & 容量size- 1&＃xff08;初始为16&＃xff09;&＃xff0c;映射到Node数组上&＃xff0c;判断这个位置是否为null
- 为null&＃xff0c;说明这个位置没有创建过值&＃xff0c;那么就创建一个Node&＃xff08;hash, k, v, next &＃61; null&＃xff09;的节点放进去&＃xff0c;这里next代表链表中的下一个节点&＃xff0c;然后被修改的次数modcount &＃43; 1&＃xff08;结构上被修改的次数&＃xff0c;这里的被修改次数指的是删除和增加&＃xff0c;不包括更新值&＃xff09;&＃xff0c;size &＃43; 1【注释&＃xff1a;modcount 该字段被Iterator以及ListIterator的实现类所使用&＃xff0c;如果该值被意外更改&＃xff0c;Iterator或者ListIterator 将抛出ConcurrentModificationException异常&＃xff0c;】
  - 如果size超过了threshold&＃xff08;初始为12&＃xff09;&＃xff0c;就将创建一个新的Node(capacity × 2)的数组&＃xff0c;然后将旧的Node数组的所有键值对放进去&＃xff08;放到新数组的过程单独在下面分析&＃xff09;&＃xff0c;让HashMap里面的Node数组成员变量指向这个新的Node对象&＃xff0c;返回null&＃xff08;记住&＃xff0c;插入新的值就是返回null&＃xff0c;更新值时返回老的value&＃xff09;
  - size没超过&＃xff0c;直接返回null
- 不为null说明这个位置有值&＃xff0c;那么比较老的Node的key和新需要插入的Node的key是否相等&＃xff1b;
  - key相等&＃xff0c;则将原来的value替换为新的&＃xff0c;并将来的老的value返回
  - key不相等
    - 查看当前Node数组位置的节点是不是一个红黑树TreeNode节点&＃xff08;p instanceof TreeNode判断的&＃xff09;&＃xff0c;是的话就按照红黑树节点进行遍历更新或插入数据&＃xff0c;如果是被修改则返回老的值&＃xff0c;如果是被插入数据那么返回null并且modcount &＃43; 1&＃xff0c;size &＃43; 1&＃xff0c;之后判断是否需要扩容
    - 不是红黑树节点遍历该位置是否有链表
      - 有链表&＃xff0c;循环遍历链表中的&＃xff0c;是否有K相等但是V不等的&＃xff0c;如果有就将V替换成新的Value并且返回老的值&＃xff0c;如果没有就在最后位置插入新节点并且modCount &＃43; 1&＃xff0c;size &＃43; 1&＃xff0c;
        如果是插入节点&＃xff0c;判断链表长度是否大于8&＃xff0c;如果大于8就扩成红黑树结构
      - 无链表&＃xff0c;说明Node数组这个位置就这一个节点&＃xff0c;把新的节点插入进去并且modCount &＃43; 1&＃xff0c;size &＃43; 1&＃xff0c;

【扩容时如何复制节点到新的Node[]数组&＃xff1a;&＃xff08;暂不考虑红黑树情况&＃xff09;

循环遍历每一个桶

如果只有一个节点&＃xff0c;直接hash & newCapacity - 1确定新的桶位置&＃xff08;新的位置要不就是新数组的原下标号桶里&＃xff0c;要不就是在oldCapacity &＃43; 原下标号的桶里&＃xff0c;这个下面代码块部分会解释&＃xff09;;
如果不止一个节点&＃xff0c;循环遍历每一个节点&＃xff0c;先hash & oldCapacity&＃xff08;老数组的容量&＃xff09;&＃xff0c;这样是为了判断你的下标需不需要挪到新扩出来的桶去&＃xff0c;举个例子&＃xff1a;

容量16&＃xff08;16-1 &＃61; 1111&＃xff09;&＃xff0c;hash1 &＃61; 10001和hash2 &＃61; 00001的桶位置都在1里面&＃xff0c;但是扩容以后&＃xff0c;容量32&＃xff08;32-1 &＃61; 11111&＃xff09;因为首位数字不同所以就不会在一个桶了&＃xff0c;这样hash & oldCapacity是为了判断你的最高那一位是不是1&＃xff0c;如果是0那你不用挪位置&＃xff0c;如果是1&＃xff0c;那就要挪桶的位置&＃xff0c;挪到oldCapacity &＃43; 当前下标的位置&＃xff08;最高位为1&＃xff0c;做hash运算的时候肯定会变为1XXXX&＃xff0c;就等于oldCap &＃43; 当前下标&＃xff09;

挪的过程中就会进行分表&＃xff0c;即把这个老的链表拆开&＃xff0c;一部分留在新数组原下标号的桶里&＃xff0c;一部分放到&＃xff08;oldCapacity &＃43; 当前下标&＃xff09;的桶里

】

三、hashmap一些值设定的原因

1、为什么数值要为2^n个

&＃xff08;1&＃xff09;当哈希表的桶的个数为2^n 的时候&＃xff0c;它的下标最大为 2^n - 1 &＃xff0c;这个时候转为二进制就是111…11的结构&＃xff0c;可以保证与key的hash值做&运算得到的值可以完美投影到其中一个桶上&＃xff0c;这样就不担心是否会投影到桶之外再做另外的处理。

例如当前容量为16&＃xff0c;key的hash值为10001&＃xff0c;我们直接使用16 &＃61; 10000 & 10001 &＃61; 10000 &＃61; 16 >桶的最大下标15&＃xff0c;这个时候就还需要再做其他处理甚至可能需要做二次hash&＃xff0c;那么是很麻烦和浪费时间的&＃xff1b;

&＃xff08;2&＃xff09;可以尽可能的减少碰撞次数&＃xff0c;因为只要两个key的hash值不同&＃xff0c;与111…111的&运算就一定不同&＃xff0c;可以尽可能的避免碰撞

2、为什么加载因子是0.75

这是考虑了时间和空间效率得出的折中方案&＃xff0c;如果为1的时候在扩容那么会增大碰撞率&＃xff0c;如果考虑一下中间值0.5的时候再扩容那么会浪费很多空间&＃xff0c;因此要取一个折中方案。那么是因为0.5 &＃43; 1/ 2 &＃61; 0.75吗&＃xff0c;实际维基百科有一个介绍说&＃xff1a;

对于开放定址法&＃xff0c;加载因子是特别重要因素&＃xff0c;应严格限制在0.7-0.8以下。超过0.8&＃xff0c;查表时的CPU缓存不命中&＃xff08;cache missing&＃xff09;按照指数曲线上升。因此&＃xff0c;一些采用开放定址法的hash库&＃xff0c;如Java的系统库限制了加载因子为0.75&＃xff0c;超过此值将resize散列表。

因此折衷方案来自于这里&＃xff01;

有的博客说是因为那个泊松分布&＃xff0c;在我看来那个泊松分布是说在加载因子为0.75的前提下&＃xff0c;可以保证我们的桶上链表节点的个数大于等于8的可能性几乎为0&＃xff0c;这个更像是说明链表转红黑树的设定阈值为8的原因。

参考原文&＃xff1a;https://blog.csdn.net/NYfor2017/article/details/105454097/?utm_medium&＃61;distribute.pc_relevant.none-task-blog-baidujs-2

3、为什么链表长度大于等于8的时候转为红黑树&＃xff0c;小于等于6的时候转为链表

&＃xff08;1&＃xff09;依据泊松分布&＃xff0c;加载因子为0.75的时候&＃xff0c;链表中的个数为8的可能性为亿分之6&＃xff08;代码中注释所描述&＃xff09;&＃xff0c;所以正常情况下是不会出现这种状况的&＃xff0c;但是如果出现了就说明是非正常情况&＃xff0c;这个时候可能有很多的key碰撞在同一个桶中&＃xff0c;这个时候继续用链表的话查询时间复杂度O&＃xff08;n&＃xff09;效率是很低的&＃xff0c;而红黑树的O(log(n))则要远远优于链表&＃xff0c;举个例子&＃xff0c;1024的链表查询平均时间为512&＃xff0c;而红黑树则仅仅为10。节点数小于8的时候链表的查询时间是很小的&＃xff0c;没必要用红黑树&＃xff0c;而且红黑树调整树结构也需要时间&＃xff0c;节点数也为链表节点数的2倍&＃xff0c;所以没必要使用。

总结&＃xff1a;Ⅰ桶上节点数出现8的概率很低&＃xff0c;出现了说明为非正常情况&＃xff0c;因此要额外处理&＃xff1b;Ⅱ而当大于等于8的时候继续使用链表查询效率会比较低&＃xff0c;改用红黑树会更快&＃xff08;这是以空间换取时间的策略&＃xff09;&＃xff1b;Ⅲ节点数小于8的时候考虑时间和空间效率没必要使用红黑树&＃xff1b;

参考原文&＃xff1a;https://blog.csdn.net/qq_43519310/article/details/102887039

&＃xff08;2&＃xff09;那为什么6是树转链表的阈值&＃xff1a;因为达到了8的时候如果一个桶上频繁的增删节点可能节点数会不停的在8和7变动&＃xff0c;那么阈值设定为7就要不停的链表和树互转&＃xff0c;这个时候耗费时间空间&＃xff0c;所以给它一个缓冲空间设定阈值为6的时候再转链表&＃xff0c;达到6的时候说明节点数在向减少的趋势发展&＃xff0c;所以设定为6了&＃xff1b;

推荐阅读

get
深入理解org.neo4j.helpers.collection.Iterators.single()方法及其应用

本文详细介绍了Java中org.neo4j.helpers.collection.Iterators.single()方法的功能、使用场景及代码示例，帮助开发者更好地理解和应用该方法。 ... [详细]

蜡笔小新 2024-12-28 10:51:55
case
Handling Null Object Encoding in OAuth 1.0a API Implementation

Explore a common issue encountered when implementing an OAuth 1.0a API, specifically the inability to encode null objects and how to resolve it. ... [详细]

蜡笔小新 2024-12-28 08:54:34
case
Java 序列化接口详解

本文深入探讨了 Java 中的 Serializable 接口，解释了其实现机制、用途及注意事项，帮助开发者更好地理解和使用序列化功能。 ... [详细]

蜡笔小新 2024-12-27 15:06:12
case
Unity 客户端框架设计：UI管理系统的构建

本文详细介绍了如何构建一个高效的UI管理系统，集中处理UI页面的打开、关闭、层级管理和页面跳转等问题。通过UIManager统一管理外部切换逻辑，实现功能逻辑分散化和代码复用，支持多人协作开发。 ... [详细]

蜡笔小新 2024-12-27 10:28:40
get
优化ListView性能

本文深入探讨了如何通过多种技术手段优化ListView的性能，包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]

蜡笔小新 2024-12-28 10:36:30
case
编写有趣的VBScript恶作剧脚本

本文将介绍如何编写一些有趣的VBScript脚本，这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例，帮助您了解VBScript的基本语法和功能。 ... [详细]

蜡笔小新 2024-12-28 09:46:23
get
Python配置文件读写指南

本文详细介绍如何使用Python进行配置文件的读写操作，涵盖常见的配置文件格式（如INI、JSON、TOML和YAML），并提供具体的代码示例。 ... [详细]

蜡笔小新 2024-12-28 08:39:55
case
java编写的简易计算器

主要用了2个类来实现的，话不多说，直接看运行结果，然后在奉上源代码1.Index.javaimportjava.awt.Color;im ... [详细]

蜡笔小新 2024-12-27 18:18:10
int
Linux 自动化安装脚本详解

本文介绍了一款用于自动化部署 Linux 服务的 Bash 脚本。该脚本不仅涵盖了基本的文件复制和目录创建，还处理了系统服务的配置和启动，确保在多种 Linux 发行版上都能顺利运行。 ... [详细]

蜡笔小新 2024-12-27 16:33:32
get
深入解析ExpandableComposite.addExpansionListener()方法及其应用

本文详细介绍了Java中org.eclipse.ui.forms.widgets.ExpandableComposite类的addExpansionListener()方法，并提供了多个实际代码示例，帮助开发者更好地理解和使用该方法。这些示例来源于多个知名开源项目，具有很高的参考价值。 ... [详细]

蜡笔小新 2024-12-27 16:11:49
case
Akka BackoffSupervisor的深入解析与实践

本文详细介绍了Akka中的BackoffSupervisor机制，探讨其在处理持久化失败和Actor重启时的应用。通过具体示例，展示了如何配置和使用BackoffSupervisor以实现更细粒度的异常处理。 ... [详细]

蜡笔小新 2024-12-27 15:04:09
case
UNP 第9章：主机名与地址转换

本章探讨了用于在主机名和数值地址之间进行转换的函数，如gethostbyname和gethostbyaddr。此外，还介绍了getservbyname和getservbyport函数，用于在服务器名和端口号之间进行转换。 ... [详细]

蜡笔小新 2024-12-27 11:26:39
get
Apache Jena 中 Txn.executeWrite 方法详解与代码示例

本文详细介绍了 Apache Jena 库中的 Txn.executeWrite 方法，通过多个实际代码示例展示了其在不同场景下的应用，帮助开发者更好地理解和使用该方法。 ... [详细]

蜡笔小新 2024-12-26 17:55:52
char
2023年京东Android面试真题解析与经验分享

本文由一位拥有6年Android开发经验的工程师撰写，详细解析了京东面试中常见的技术问题。涵盖引用传递、Handler机制、ListView优化、多线程控制及ANR处理等核心知识点。 ... [详细]

蜡笔小新 2024-12-26 17:45:48
get
从 .NET 转 Java 的自学之路：IO 流基础篇

本文详细介绍了 Java 中的 IO 流，包括字节流和字符流的基本概念及其操作方式。探讨了如何处理不同类型的文件数据，并结合编码机制确保字符数据的正确读写。同时，文中还涵盖了装饰设计模式的应用，以及多种常见的 IO 操作实例。 ... [详细]

蜡笔小新 2024-12-26 17:37:25

mobiledu2502923573

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章