程序猿的日常——HashMap的相关知识

作者：zgshenxz_474 | 来源：互联网 | 2023-08-21 16:58

背景知识哈希冲突哈希是指通过某种方法把数据转变成特定的数值，数值根据mod对应到不同的单元上。比如在Java中，字符串就是通过每个字符的编码来计算、数字是本身对应的值等等，不过就算是再好的哈希方法，也

背景知识

哈希冲突

哈希是指通过某种方法把数据转变成特定的数值，数值根据mod对应到不同的单元上。比如在Java中，字符串就是通过每个字符的编码来计算、数字是本身对应的值等等，不过就算是再好的哈希方法，也有可能出现两个不同的对象hash值相同的情况。如果在HashMap中，hashcode相同，它们就会被分配到对应的存储位置，此时就会出现冲突——也叫做哈希冲突。

解决哈希冲突的方法有很多种：

开放地址探测法：即如果出现哈希冲突，则按照一定的规则继续选择位置，如线性探测法再、二次探测再、伪随机探测等等。
链地址法：如果出现冲突，则在冲突的位置后面形成链表进行存储。HashMap就是通过这种方式实现的
再哈希法：这种方法是再换另一个哈希方法寻找存储的位置。

hashCode和equals

首先hashcode是经过一定的方法映射出的数值，而equals如果没有重写的话，是对比了每个内部的属性。总结的来说，如果两个对象hashcode相同，它们未必相等；如果hashcode不同，肯定不等。从另一个角度说，如果两个对象equals相等，它们肯定相等；如果equals不同，则它们不同。

那么肯定会有人疑问，那还要hashcode干嘛咧？Hashcode其实就是在hashMap或者hashset进行快速比较的时候有用，可以快速的判断对像是否不同，如果hashcode相同，则再继续对比equals方法。这样可以节省大量的时间。

HashMap

HashMap允许null的key和value，HashMap根HashTable很像，只不过非线程安全并且允许Null值。

有两个参数会影响Map的性能，分别是初始容量initial capacity和负载参数load facotr(确定了什么时间增加hash table的容量)。当容量超过load factor*initial capacity时，就会进行扩容，然后执行rehash操作。

默认load factor时0.75，它基本已经能提供一个不错的性能效果了。不过在使用的初期可以预估一下数据量，直接设置一个比较适合的初始值。

注意：HashMap不是线程安全的，可以通过

Map m = Collections.synchronizedMap(new HashMap(...))

实现线程安全的map.

创建

transient Node[] table;
transient Set> entrySet;
int threshold;
final float loadFactor;

新增

如果key之前出现过，那么将会用新的value代替旧的value

public V put(K key, V value) {
    return putVal(hash(key), key, value, false, true);
}
static final int hash(Object key) {
    int h;
    return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

主要的代码在这里：

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,boolean evict) {
    Node[] tab; Node p; int n, i;
    if ((tab = table) == null || (n = tab.length) == 0)
        n = (tab = resize()).length;
    if ((p = tab[i = (n - 1) & hash]) == null)
        tab[i] = newNode(hash, key, value, null);
    else {
        Node e; K k;
        if (p.hash == hash &&
            ((k = p.key) == key || (key != null && key.equals(k))))
            e = p;
        else if (p instanceof TreeNode)
            e = ((TreeNode)p).putTreeVal(this, tab, hash, key, value);
        else {
            for (int binCount = 0; ; ++binCount) {
                if ((e = p.next) == null) {
                    p.next = newNode(hash, key, value, null);
                    // 如果每个链表长度超过8，那么就转为红黑树
                    if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                        treeifyBin(tab, hash);
                    break;
                }
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    break;
                p = e;
            }
        }
        if (e != null) { // existing mapping for key
            V oldValue = e.value;
            if (!onlyIfAbsent || oldValue == null)
                e.value = value;
            afterNodeAccess(e);
            return oldValue;
        }
    }
    ++modCount;
    if (++size > threshold)
        resize();
    afterNodeInsertion(evict);
    return null;
}

对于写操作的场景：

先会经过hash计算hashcode然后与size进行&操作，判断存储的位置
如果存储的位置没有节点，则直接写入
如果存储的位置有节点，且是树节点，则向树中插入节点
如果存储的位置有节点，不是树节点（而是普通的链表），则进行头插。但是会判断当前链表的长度，如果超过设置的阈值（默认是8），就会把链表转化成树。

更新的时候也是上面的操作流程，只不过在对比hashcode相同时，还会检查key是否equals

读取和删除基本上也是上面的套路。

为什么非线程安全
这个主要是因为在rehash的时候由于table[]后面接的是链表，而hashMap还是采用头插的形式。因此如果有不同的线程同时进行rehash，就可能导致链表形成环形，造成死循环。

具体的可以参考网上的文章：https://coolshell.cn/articles/9606.html

推荐阅读

tree
新浪笔试题

1:有如下一段程序：packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]

蜡笔小新 2024-12-27 19:32:17
get
java1.7集合源码赏析系列：HashTable、ConcurrentHashMap、HashMap差异分析

HashTable与ConcurrentHashMap均可实现HashMap的功能，对外提供了键值对存储的数据结构。但是在内部结构及实现上有何区别，性能上的差异到底在哪里又是如何导致的 ... [详细]

蜡笔小新 2023-09-14 08:45:47
tree
Java HashSet和HashMap源码剖析

转载自：http:www.blogjava.netCarpenterLeearchive20160427430268.html总体介绍之所以把HashSet和HashMa ... [详细]

蜡笔小新 2023-09-10 22:23:41
java
类 Hashtable及与HashMap的区别

类Hashtable<K,V>所有已实现的接口：Serializable,Cloneable,Map<K,V>此类实现一个哈希表，该哈希表将键映 ... [详细]

蜡笔小新 2023-09-10 09:48:30
get
Java中怎么对HashMap按键值排序

本篇文章给大家分享的是有关Java中怎么对HashMap按键值排序，小编觉得挺实用的，因此分享给大家学习，希望大家阅读完这篇文章后可以有所收获，话 ... [详细]

蜡笔小新 2023-09-09 14:01:50
get
集合框架--Map集合之HashMap存储自定义对象

将学生对象和学生的归属地通过键与值存储到map集合中。importjava.util.HashMap;importjava.util.Iterator;importjava.uti ... [详细]

蜡笔小新 2023-09-09 04:43:44
get
Map集合Map map = new HashMap();

01Map集合概述A:Map集合概述:我们通过查看Map接口描述,发现Map接口下的集合与Collection接口下的集合，它们存储数据的形式不同a:Collection中的集合 ... [详细]

蜡笔小新 2023-09-06 21:09:58
tree
Java面试 HashMap、HashSet源码解析

本章所有源代码基于JDK1.8版本HashMap和HashSet是JavaCollectionFramework的两个重要成员，其中HashMap是Map接口的常用实现类，Hash ... [详细]

蜡笔小新 2023-09-05 08:27:05
tree
对象作为HashMap的键

写这篇文章起源于一道面试题，如何将自定义的类对象作为key存储到HashMap中，即考虑怎么判断key的唯一性。首先，我们看以下HashMap中put(…)方法的源码：public ... [详细]

蜡笔小新 2023-09-02 08:14:05
get
优化ListView性能

本文深入探讨了如何通过多种技术手段优化ListView的性能，包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]

蜡笔小新 2024-12-28 10:36:30
get
使用Hashmap值作为索引以在Java

我有3个来自RESEARCHS的映射值，指定要使用参考数据集填充的行中的范围。该研究 ... [详细]

蜡笔小新 2023-09-16 13:15:05
get
关于LinkedHashMap实现LRU缓存算法

缓存这个东西就是为了提高运行速度的，由于缓存是在寸土寸金的内存里面，不是在硬盘里面，所以容量是很有限的。LRU这个算法就是把最近一次使用时间离现在时间最远的数据删除掉。先说说List：每 ... [详细]

蜡笔小新 2023-09-10 10:48:58
get
java编程心得(十三)——哈希表根据value值排序

***功能：排序*privatestaticvoidoutputRegionStatistics(HashMap<String,Integer>regionMap){ ... [详细]

蜡笔小新 2023-09-09 10:09:25
get
手写HashMap，快手面试官直呼内行

手写HashMap，快手面试官直呼内行-手写HashMap？这么狠，面试都卷到这种程度了？第一次见到这个面试题，是在某个不方便透露姓名的Offer收割机大佬的文章：这……我当 ... [详细]

蜡笔小新 2023-09-05 19:32:25
java
HashMap 和Hashtable 的区别?

hashmap线程不安全允许有null的键和值效率高一点、方法不是Synchronize的要提供外同步有containsvalue和containsKey方法HashMap是Java1 ... [详细]

蜡笔小新 2023-08-30 01:25:20

zgshenxz_474

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章

程序猿的日常——HashMap的相关知识

背景知识

哈希冲突

hashCode和equals

创建 transient Node[] table;transient Set> entrySet;int threshold;final float loadFactor;

创建
`transient Node[] table; transient Set> entrySet; int threshold; final float loadFactor;`