热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

图解HashMap

什么是HashMap,文章内HashMap源码主要来自Android7.0HashMap是开发中常用的一个类,那么他究竟是什么呢?HashMap是一个存储key-value的集合,
什么是HashMap,文章内HashMap源码主要来自Android 7.0

HashMap是开发中常用的一个类,那么他究竟是什么呢?

HashMap是一个存储key-value的集合,底层实现的是数组,所以可以看作HashMap是对数组的一种封装。

构造方法

《图解HashMap》 HashMap构造函数.png

《图解HashMap》 HashMap构造函数.png

不管调用的是哪一个方法, 最终都会回调两个参数的这个构造函数,第一个参数是容量,第二个参数是阈值(用于扩容的时候计算容量)

先看看HashMap主要的成员变量

/**
* HashMap默认容量
*/
static final int DEFAULT_INITIAL_CAPACITY = 4;
/**
* HashMap最大可存储的容量值 1<<30
*/
static final int MAXIMUM_CAPACITY = 1 <<30;
/**
* 加载因子(阈值)如果put进来的元素数量>=总数量*0.75的时候, 就会进行扩容了
*/
static final float DEFAULT_LOAD_FACTOR = 0.75f;
/**
* EMPTY_TABLE 看了一下,好像没啥用。。。
*/
static final HashMapEntry[] EMPTY_TABLE = {};
transient HashMapEntry[] table = (HashMapEntry[]) EMPTY_TABLE;
/**
* 这个size表示容量值,put了几次,这个size就是几,所以我们方法中用的size() 就是返回的这个值
*/
transient int size;

因为HashMap常用的就是get和put,所以主要分析一下这两个方法,在讲这个之前,先看一下HashMapEntry这个类吧

HashMapEntry

HashMapEntry继承自Map.Entry

static class HashMapEntry implements Map.Entry {
final K key;
V value;
HashMapEntry next;
int hash;
...
}

HashMapEntry的结构是链表(在api25之前是链表,在api26开始引入了红黑树, 当节点>8个的时候会转为红黑树, 节点<6个的时候又会转回为链表, 红黑树跳这里HashMap在Api26后的应用&#8212;红黑树篇),所以存储数据的时候是这样的

《图解HashMap》 存储结构.png

关于链表可参考其他文章

现在来讲一讲HashMap的put和get

put

public V put(K key, V value) {
if (table == EMPTY_TABLE) {
inflateTable(threshold);
}
if (key == null)
return putForNullKey(value);
int hash = sun.misc.Hashing.singleWordWangJenkinsHash(key);
int i = indexFor(hash, table.length);
for (HashMapEntry e = table[i]; e != null; e = e.next) {
Object k;
if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
V oldValue = e.value;
e.value = value;
e.recordAccess(this);
return oldValue;
}
}
modCount++;
addEntry(hash, key, value, i);
return null;
}

整个put的方法并不长,首次进来时会判断table是不是EMPTY_TABLE,就是上面那两数组,然后会执行inflatetable方法,这个方法就不看了。。。只有第一次put时候才会进入,因为只有那个时候table==EMPTY_TABLE,在inflatetable里,table就会被重新赋值
接下来看第二个判断 key==null
看看这个方法putForNullKey()

private V putForNullKey(V value) {
for (HashMapEntry e = table[0]; e != null; e = e.next) {
if (e.key == null) {
V oldValue = e.value;
e.value = value;
e.recordAccess(this);
return oldValue;
}
}
modCount++;
addEntry(0, null, value, 0);
return null;
}

如果已经有了一个 key为null的元素,那么就会替换他的value值,所以HashMap只能由一个空key。
sun.misc.Hashing.singleWordWangJenkinsHash(key);这个方法就是根据key计算hash值,然后通过indexFor方法算出key在table中的下标。由于数组的存储方式大概是这样的

《图解HashMap》 image.png

但是由于下标是根据key的hash和数组长度计算来的,所以有可能下标会一样,这个时候HashMapEntry这个链表的用处就体现出来了,如果下标一样的时候,那么就会比对HashMapEntry的key值是否一致,如果一致,就替换原key-value,如果没有与新添加的key一致的值,就会在HashMapEntry中新加一个节点,所以现在的存储方式变成了这样

《图解HashMap》 hashmap存储方式.png

如果是替换就value,会直接吧旧的value返回回去,如果不是的话就会走addEntry方法, 这个方法有三个作用

  • 扩容
  • 拷贝数据
  • 插入新数据
    跟进一下addEntry方法

void addEntry(int hash, K key, V value, int bucketIndex) {
if ((size >= threshold) && (null != table[bucketIndex])) {
resize(2 * table.length);
hash = (null != key) ? sun.misc.Hashing.singleWordWangJenkinsHash(key) : 0;
bucketIndex = indexFor(hash, table.length);
}
createEntry(hash, key, value, bucketIndex);
}

首先判断的是size是否大于阈值(总容量*0.75),并且table[bucketIndex]!=null, 所以只有两个条件成立的时候才会进行扩容

resize()

void resize(int newCapacity) {
HashMapEntry[] oldTable = table;
int oldCapacity = oldTable.length;
if (oldCapacity == MAXIMUM_CAPACITY) {
threshold = Integer.MAX_VALUE;
return;
}
HashMapEntry[] newTable = new HashMapEntry[newCapacity];
transfer(newTable);
table = newTable;
threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1);
}

newCapacity的大小等于就数组长度*2, 所以下方构建的newTable的长度就是原数组的长度两倍,到这里,就进行扩容完毕了,但是新数组是有了,但是没数据啊!不急,看transfer方法

transfer()

void transfer(HashMapEntry[] newTable) {
int newCapacity = newTable.length;
for (HashMapEntry e : table) {
while(null != e) {
HashMapEntry next = e.next;
int i = indexFor(e.hash, newCapacity);
e.next = newTable[i];
newTable[i] = e;
e = next;
}
}
}

看到了吧,或进行一个双层循环,先循环数组,然后在循环里面节点,直到next==null的时候,会跳出当前循环,进行下一次循环,直到循环完毕,也就是新数据赋值完毕
再回到resize方法,再看下面的代码,把新数组newTable又给了table,threshold又得到了扩容后新的阈值,到这一步,扩容和拷贝数据就已经完成了。
再回看addEntry方法,又会更具新数组的大小和key的hash值重新计算下标,传递给createEntry(hash, key, value, bucketIndex)方法中,

void createEntry(int hash, K key, V value, int bucketIndex) {
HashMapEntry e = table[bucketIndex];
table[bucketIndex] = new HashMapEntry<>(hash, key, value, e);
size++;
}

到此,hashmap的put就结束了,回头看看。。。其实还算蛮简单的哈

《图解HashMap》 毛骨悚然.png

那么get方法呢?

get

final Entry getEntry(Object key) {
if (size == 0) {
return null;
}
int hash = (key == null) ? 0 : sun.misc.Hashing.singleWordWangJenkinsHash(key);
for (HashMapEntry e = table[indexFor(hash, table.length)];
e != null;
e = e.next) {
Object k;
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
return e;
}
return null;
}

get方法最终会调用这个getEntry方法,看看里面的方法是不是很眼熟,计算hash,比对key。

《图解HashMap》

对!就是这么简单,同样也是根据hash和数组长度获取下标,然后就是这么一个循环,只要hash值一样并且key有一样的就会返回这个元素,否则就是返回null

总结一下:
put添加元素的操作为:

计算key的hash ==> 根据hash和数组长度计算对应的数组下标 ==> 如果当前下标内容为null,就直接添加,否则的话会进入一个循环,在这个循环中去寻找链表内有没有当前key值,有的话替换原value,没有的话插入到最后一个节点

《图解HashMap》 put步骤.png

get获取元素

计算key的hash ==> 根据hash和数组长度计算对应的数组下标 ==> 如果当前下标元素不为null,进入循环,在这个循环中去寻找链表内有没有当前key值,有的话返回,没有的话就返回null
get就不画了啊 自行体会

《图解HashMap》

话说你们画图都用啥啊。。。 我这大晚上的用截图工具扣扣画画好累,win10自带的画图工具感觉用不来


推荐阅读
  • 一、HashSet1.虑重功能特性(HashMap实现)2.put(key)如果重复返回false***Add ... [详细]
  • HashTable与ConcurrentHashMap均可实现HashMap的功能,对外提供了键值对存储的数据结构。但是在内部结构及实现上有何区别,性能上的差异到底在哪里又是如何导致的 ... [详细]
  • 在高并发需求的C++项目中,我们最初选择了JsonCpp进行JSON解析和序列化。然而,在处理大数据量时,JsonCpp频繁抛出异常,尤其是在多线程环境下问题更为突出。通过分析发现,旧版本的JsonCpp存在多线程安全性和性能瓶颈。经过评估,我们最终选择了RapidJSON作为替代方案,并实现了显著的性能提升。 ... [详细]
  • 深入解析Spring启动过程
    本文详细介绍了Spring框架的启动流程,帮助开发者理解其内部机制。通过具体示例和代码片段,解释了Bean定义、工厂类、读取器以及条件评估等关键概念,使读者能够更全面地掌握Spring的初始化过程。 ... [详细]
  • 深入解析 Android IPC 中的 Messenger 机制
    本文详细介绍了 Android 中基于消息传递的进程间通信(IPC)机制——Messenger。通过实例和源码分析,帮助开发者更好地理解和使用这一高效的通信工具。 ... [详细]
  • 本文探讨了如何在Classic ASP中实现与PHP的hash_hmac('SHA256', $message, pack('H*', $secret))函数等效的哈希生成方法。通过分析不同实现方式及其产生的差异,提供了一种使用Microsoft .NET Framework的解决方案。 ... [详细]
  • 主调|大侠_重温C++ ... [详细]
  • Django Token 认证详解与 HTTP 401、403 状态码的区别
    本文详细介绍了如何在 Django 中配置和使用 Token 认证,并解释了 HTTP 401 和 HTTP 403 状态码的区别。通过具体的代码示例,帮助开发者理解认证机制及权限控制。 ... [详细]
  • 本文将详细探讨 Java 中提供的不可变集合(如 `Collections.unmodifiableXXX`)和同步集合(如 `Collections.synchronizedXXX`)的实现原理及使用方法,帮助开发者更好地理解和应用这些工具。 ... [详细]
  • CentOS 7.6环境下Prometheus与Grafana的集成部署指南
    本文旨在提供一套详细的步骤,指导读者如何在CentOS 7.6操作系统上成功安装和配置Prometheus 2.17.1及Grafana 6.7.2-1,实现高效的数据监控与可视化。 ... [详细]
  • 序列化与反序列化是数据处理中的重要技术,特别是在网络通信和数据存储中。它们允许将复杂的数据结构转换为可传输或存储的格式,再从这些格式恢复原始数据。本文探讨了序列化与反序列化的基本概念,以及它们在不同协议模型中的角色。 ... [详细]
  • Java之HashMap在多线程情况下导致死循环的问题
    PS:不得不说Java编程思想这本书是真心强大..学习内容:1.HashMap<K,V>在多线程的情况下出现的死循环现象当初学Java的时候只是知道HashMap< ... [详细]
  • 深入解析动态代理模式:23种设计模式之三
    在设计模式中,动态代理模式是应用最为广泛的一种代理模式。它允许我们在运行时动态创建代理对象,并在调用方法时进行增强处理。本文将详细介绍动态代理的实现机制及其应用场景。 ... [详细]
  • 本文提供了多种方法来计算给定年份和月份的起始日和结束日,并进一步探讨了如何根据年、月、周获取特定周的起始日和结束日。 ... [详细]
  • android布局基础及范例(二):人人android九宫格布局
    人人android是人人网推出的一款优秀的手机应用软件,我们在使用的时候发现他的首页布局是九宫格模式的,让人觉得很别致,因为现在很多的android软件很少使用这种布局模式,人人andr ... [详细]
author-avatar
boybeta
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有