热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Java数据结构源码分析HashMap

1.HashMap1.1Map接口在开始介绍HashMap的源码前,我们先来了解下HashMap的在内存的数据组织方式:整个结构分为两部分,第一部分是一个Entry[]数组,其数组

1.HashMap

1.1 Map接口

在开始介绍HashMap的源码前,我们先来了解下HashMap的在内存的数据组织方式:
整个结构分为两部分,第一部分是一个Entry[]数组,其数组的索引就是hash之后的slot位置。 第二部分是一个链表,每个Entry对象都会有一个Entry next的引用指向下一个Entry对象,如此当出现冲突时,只需要将冲突的数据加入到链表中就行了
《Java数据结构源码分析-HashMap》
接下来,我们来看看Map的接口形式,其定义了构造Map最关键的两个核心接口和方法,Map和Entry,不同类型的Map会使用不同的Entry来实现。

package java.util;
public interface Map {
interface Entry {
K getKey();
V getValue();
V setValue(V value);
boolean equals(Object o);
int hashCode();
}
void clear();
boolean containsKey(Object key);
boolean containsValue(Object value);
Set<Map.Entry> entrySet();
boolean equals(Object o);
V get(Object key);
int hashCode();
boolean isEmpty();
Set keySet();
V put(K key, V value);
void putAll(Map m);
V remove(Object key);
int size();
Collection values();
}

1.2 HashMap源码分析

在开始HashMap具体方法之前我们先来看看,其中几个比较重要的内部类的作用

public class HashMap<K,V> extends AbstractMap<K,V> implements Map<K,V>, Cloneable, Serializable{
static class Entry<K,V> implements Map.Entry<K,V> {
final K key;
V value;
Entry next;
int hash;
}
private abstract class HashIterator<E> implements Iterator<E> {
Entry next; // next entry to return
int expectedModCount; // For fast-fail
int index; // current slot
Entry current; // current entry
}
}
类:Entry
该类是用于构造HaspMap数据结构的核心类。其主要用于保存数据
类:HashIterator
该类用于遍历HashMap的Entry,按照列的顺序,从数组的第一列的所有Entry到最后一列的Entry

接下来我们分析HashMap的使用过程:

1.HashMap的内存分配过程
Map map1=new HashMap(10,0.8);
上述过程中并不会立即对Map进行分配内存,即table任然是EMPTY_TABLE;
transient Entry<K,V>[] table = (Entry<K,V>[]) EMPTY_TABLE;
static final Entry[] EMPTY_TABLE = {};
其内存的分配是第一次调用put方法向容器中插入数据的时候。内存分配的大小是大于initialCapacity的最小2的幂级数。例如此处为2^4>=10
2.threshold为threshold = (int) Math.min(capacity * loadFactor, MAXIMUM_CAPACITY + 1); 即其是table分配大小*loadFactor
Threshold和HashMap中table的重新分配大小有关,当table中原始大于threshold,并且该次插入数据的位置产生了冲突,那么将会按照现有Map的大小的2倍进行重新分配,并进行新的hashseed的重新计算和现存元素的重新hash.
3.HashMap在插入数据时遇到冲突,会将冲突的数据插入到链表的表头位置,对于key为null的数据对,会别插入到table[0]的位置
4.modCount表示HashMap被修改的次数,在每次调用put、remove、clear等方法时,都会加一

1.3 插入操作

public V put(K key, V value) {
if (table == EMPTY_TABLE) {
inflateTable(threshold);
}
if (key == null)
return putForNullKey(value);
int hash = hash(key);
int i = indexFor(hash, table.length);
for (Entry e = table[i]; e != null; e = e.next) {
Object k;
if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
V oldValue = e.value;
e.value = value;
e.recordAccess(this);
return oldValue;
}
}
modCount++;
addEntry(hash, key, value, i);
return null;
}
private V putForNullKey(V value) {
for (Entry e = table[0]; e != null; e = e.next) {
if (e.key == null) {
V oldValue = e.value;
e.value = value;
e.recordAccess(this);
return oldValue;
}
}
modCount++;
addEntry(0, null, value, 0);
return null;
}
void addEntry(int hash, K key, V value, int bucketIndex) {
if ((size >= threshold) && (null != table[bucketIndex])) {
resize(2 * table.length);
hash = (null != key) ? hash(key) : 0;
bucketIndex = indexFor(hash, table.length);
}
createEntry(hash, key, value, bucketIndex);
}
void createEntry(int hash, K key, V value, int bucketIndex) {
Entry e = table[bucketIndex];
table[bucketIndex] = new Entry<>(hash, key, value, e);
size++;
}

对于put方法:首先会通过hash(key)和indexFor方法去获取key在table中slot的位置,然后通for循环去遍历链表,如果存在现有key则替换,返回旧值。否则addEntry去插入数据。
在addEntry方法中会首先判断HashMap的load是否超过阈值threshold,如果是扩大一倍内存,并rehash原有数据,并重新计算slot的位置。然后通过设置Entry的hash、key、value、next几个字段,并使用链表的表头插入方法插入数据。

1.3 删除操作

public V remove(Object key) {
//真正删除元素的位置
Entry e = removeEntryForKey(key);
return (e == null ? null : e.value);
}
final Entry removeEntryForKey(Object key) {
if (size == 0) {
return null;
}
int hash = (key == null) ? 0 : hash(key);
int i = indexFor(hash, table.length);
Entry prev = table[i];
Entry e = prev;
//循环更新prev和e,根据删除的数据是否在表头分开考虑
while (e != null) {
Entry next = e.next;
Object k;
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k)))) {
modCount++;
size--;
if (prev == e)
table[i] = next;
else
prev.next = next;
e.recordRemoval(this);
return e;
}
prev = e;
e = next;
}
return e;
}
//如果找到要删除的key,则返回value,否则返回为null
//清空方法,只需要把table的各个位置引用赋值为空,则gc负责回收栈上的对象空间
public void clear() {
modCount++;
Arrays.fill(table, null);
size = 0;
}

1.4 其他操作

//双层循环查找是否存在value
public boolean containsValue(Object value) {
if (value == null)
return containsNullValue();
Entry[] tab = table;
for (int i = 0; i for (Entry e = tab[i] ; e != null ; e = e.next)
if (value.equals(e.value))
return true;
return false;
}
public Object clone() {
HashMap result = null;
try {
result = (HashMap)super.clone();
} catch (CloneNotSupportedException e) {
// assert false;
}
if (result.table != EMPTY_TABLE) {
result.inflateTable(Math.min(
(int) Math.min(
size * Math.min(1 / loadFactor, 4.0f),
// we have limits...
HashMap.MAXIMUM_CAPACITY),
table.length));
}
result.entrySet = null;
result.modCount = 0;
result.size = 0;
result.init();
result.putAllForCreate(this);
return result;
}
//首先clone HashMap对象本身,然后通过result.inflateTable方法clone HashMap中的table对象,
//其次putAllForCreate取出HashMap中的Entry对象,并构造新的Entry对象并将Key和Value的引用传递给新的Entry,
//从而实现元素的浅拷贝。
//注意:HashMap的clone只是clone了HashMap的table对象,而table中的元素并没有被拷贝,其拷贝的是对象的引用。因此其是浅层的拷贝,
//如果想就行深层次拷贝可以通过使用seriablize手段来实现
public Object clone() {
HashMap result = null;
try {
result = (HashMap)super.clone();
} catch (CloneNotSupportedException e) {
// assert false;
}
if (result.table != EMPTY_TABLE) {
result.inflateTable(Math.min(
(int) Math.min(
size * Math.min(1 / loadFactor, 4.0f),
// we have limits...
HashMap.MAXIMUM_CAPACITY),
table.length));
}
result.entrySet = null;
result.modCount = 0;
result.size = 0;
result.init();
result.putAllForCreate(this);
return result;
}
//HashMap的持久化
//从持久化的对象字段可以看出,其主要分为如下两部分:
//1、写入table相关的属性包括threshold、size、length用于重建table
//2、table中保存的对象的持久化,分别持久化key和value字段,
//要求改类对象都实现了Seriablizable接口,否则会报错
private void writeObject(java.io.ObjectOutputStream s)
throws IOException
{
// Write out the threshold, loadfactor, and any hidden stuff
s.defaultWriteObject();
// Write out number of buckets
if (table==EMPTY_TABLE) {
s.writeInt(roundUpToPowerOf2(threshold));
} else {
s.writeInt(table.length);
}
// Write out size (number of Mappings)
s.writeInt(size);
// Write out keys and values (alternating)
if (size > 0) {
for(Map.Entry e : entrySet0()) {
s.writeObject(e.getKey());
s.writeObject(e.getValue());
}
}
}
private void readObject(java.io.ObjectInputStream s)
throws IOException, ClassNotFoundException
{
// Read in the threshold (ignored), loadfactor, and any hidden stuff
s.defaultReadObject();
if (loadFactor <= 0 || Float.isNaN(loadFactor)) {
throw new InvalidObjectException("Illegal load factor: " +
loadFactor);
}
// set other fields that need values
table = (Entry[]) EMPTY_TABLE;
// Read in number of buckets
s.readInt(); // ignored.
// Read number of mappings
int mappings = s.readInt();
if (mappings <0)
throw new InvalidObjectException("Illegal mappings count: " +
mappings);
// capacity chosen by number of mappings and desired load (if >= 0.25)
int capacity = (int) Math.min(
mappings * Math.min(1 / loadFactor, 4.0f),
// we have limits...
HashMap.MAXIMUM_CAPACITY);
// allocate the bucket array;
if (mappings > 0) {
inflateTable(capacity);
} else {
threshold = capacity;
}
init(); // Give subclass a chance to do its thing.
// Read the keys and values, and put the mappings in the HashMap
for (int i = 0; i K key = (K) s.readObject();
V value = (V) s.readObject();
putForCreate(key, value);
}
}

注意:
out = new ObjectOutputStream(memoryBuffer);
out.writeObject(src);
在调用如上方法进行序列化时,其要求src必须实现serizable接口,并且其字段也必须实现了serizable接口,并且对于每个对象如果实现了writeObject方法,那么在序列化该对象的时候回调用该对象的writeObject方法。writeObject方法主要是用于个性化定制该对象的序列化方法

private void writeSerialData(Object obj, ObjectStreamClass desc)
throws IOException
{
ObjectStreamClass.ClassDataSlot[] slots = desc.getClassDataLayout();
for (int i = 0; i ObjectStreamClass slotDesc = slots[i].desc;
//通过反射判断是否有writeObject方法,有则使用该方法序列化对象
if (slotDesc.hasWriteObjectMethod()) {
PutFieldImpl oldPut = curPut;
curPut = null;
SerialCallbackContext oldCOntext= curContext;
if (extendedDebugInfo) {
debugInfoStack.push(
"custom writeObject data (class \"" +
slotDesc.getName() + "\")");
}
try {
curCOntext= new SerialCallbackContext(obj, slotDesc);
bout.setBlockDataMode(true);
slotDesc.invokeWriteObject(obj, this);
bout.setBlockDataMode(false);
bout.writeByte(TC_ENDBLOCKDATA);
} finally {
curContext.setUsed();
curCOntext= oldContext;
if (extendedDebugInfo) {
debugInfoStack.pop();
}
}
curPut = oldPut;
} else {
//否则调用默认方法序列化对象
defaultWriteFields(obj, slotDesc);
}
}
}

推荐阅读
  • Explore a common issue encountered when implementing an OAuth 1.0a API, specifically the inability to encode null objects and how to resolve it. ... [详细]
  • 本文详细介绍了Java中org.neo4j.helpers.collection.Iterators.single()方法的功能、使用场景及代码示例,帮助开发者更好地理解和应用该方法。 ... [详细]
  • 本文深入探讨了 Java 中的 Serializable 接口,解释了其实现机制、用途及注意事项,帮助开发者更好地理解和使用序列化功能。 ... [详细]
  • 优化ListView性能
    本文深入探讨了如何通过多种技术手段优化ListView的性能,包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]
  • 本文详细介绍了 GWT 中 PopupPanel 类的 onKeyDownPreview 方法,提供了多个代码示例及应用场景,帮助开发者更好地理解和使用该方法。 ... [详细]
  • 本文详细介绍了Java中org.eclipse.ui.forms.widgets.ExpandableComposite类的addExpansionListener()方法,并提供了多个实际代码示例,帮助开发者更好地理解和使用该方法。这些示例来源于多个知名开源项目,具有很高的参考价值。 ... [详细]
  • 深入解析JVM垃圾收集器
    本文基于《深入理解Java虚拟机:JVM高级特性与最佳实践》第二版,详细探讨了JVM中不同类型的垃圾收集器及其工作原理。通过介绍各种垃圾收集器的特性和应用场景,帮助读者更好地理解和优化JVM内存管理。 ... [详细]
  • 本文将介绍如何编写一些有趣的VBScript脚本,这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例,帮助您了解VBScript的基本语法和功能。 ... [详细]
  • Explore how Matterverse is redefining the metaverse experience, creating immersive and meaningful virtual environments that foster genuine connections and economic opportunities. ... [详细]
  • 本文详细介绍如何使用Python进行配置文件的读写操作,涵盖常见的配置文件格式(如INI、JSON、TOML和YAML),并提供具体的代码示例。 ... [详细]
  • 本文探讨了Hive中内部表和外部表的区别及其在HDFS上的路径映射,详细解释了两者的创建、加载及删除操作,并提供了查看表详细信息的方法。通过对比这两种表类型,帮助读者理解如何更好地管理和保护数据。 ... [详细]
  • Java 类成员初始化顺序与数组创建
    本文探讨了Java中类成员的初始化顺序、静态引入、可变参数以及finalize方法的应用。通过具体的代码示例,详细解释了这些概念及其在实际编程中的使用。 ... [详细]
  • 本文介绍了Java并发库中的阻塞队列(BlockingQueue)及其典型应用场景。通过具体实例,展示了如何利用LinkedBlockingQueue实现线程间高效、安全的数据传递,并结合线程池和原子类优化性能。 ... [详细]
  • 深入解析Spring Cloud Ribbon负载均衡机制
    本文详细介绍了Spring Cloud中的Ribbon组件如何实现服务调用的负载均衡。通过分析其工作原理、源码结构及配置方式,帮助读者理解Ribbon在分布式系统中的重要作用。 ... [详细]
  • 前言--页数多了以后需要指定到某一页(只做了功能,样式没有细调)html ... [详细]
author-avatar
手机用户2602902855
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有