java提高篇（二三）HashMap

作者：薇薇llfnc | 来源：互联网 | 2023-09-07 17:14

java提高篇（二三）-----HashMap,Go语言社区,Golang程序员人脉社

>>>>>>>>>>原文参见：http://cmsblogs.com/?p=176

HashMap也是我们使用非常多的Collection，它是基于哈希表的 Map 接口的实现，以key-value的形式存在。在HashMap中，key-value总是会当做一个整体来处理，系统会根据hash算法来来计算key-value的存储位置，我们总是可以通过key快速地存、取value。下面就来分析HashMap的存取。

一、定义

HashMap实现了Map接口，继承AbstractMap。其中Map接口定义了键映射到值的规则，而AbstractMap类提供 Map 接口的骨干实现，以最大限度地减少实现此接口所需的工作，其实AbstractMap类已经实现了Map，这里标注Map LZ觉得应该是更加清晰吧！

public class HashMap
    extends AbstractMap
    implements Map, Cloneable, Serializable

二、构造函数

HashMap提供了三个构造函数：

HashMap()：构造一个具有默认初始容量 (16) 和默认加载因子 (0.75) 的空 HashMap。

HashMap(int initialCapacity)：构造一个带指定初始容量和默认加载因子 (0.75) 的空 HashMap。

HashMap(int initialCapacity, float loadFactor)：构造一个带指定初始容量和加载因子的空 HashMap。

在这里提到了两个参数：初始容量，加载因子。这两个参数是影响HashMap性能的重要参数，其中容量表示哈希表中桶的数量，初始容量是创建哈希表时的容量，加载因子是哈希表在其容量自动增加之前可以达到多满的一种尺度，它衡量的是一个散列表的空间的使用程度，负载因子越大表示散列表的装填程度越高，反之愈小。对于使用链表法的散列表来说，查找一个元素的平均时间是O(1+a)，因此如果负载因子越大，对空间的利用更充分，然而后果是查找效率的降低；如果负载因子太小，那么散列表的数据将过于稀疏，对空间造成严重浪费。系统默认负载因子为0.75，一般情况下我们是无需修改的。

HashMap是一种支持快速存取的数据结构，要了解它的性能必须要了解它的数据结构。

三、数据结构

我们知道在Java中最常用的两种结构是数组和模拟指针(引用)，几乎所有的数据结构都可以利用这两种来组合实现，HashMap也是如此。实际上HashMap是一个“链表散列”，如下是它数据结构：

从上图我们可以看出HashMap底层实现还是数组，只是数组的每一项都是一条链。其中参数initialCapacity就代表了该数组的长度。下面为HashMap构造函数的源码：

public HashMap(int initialCapacity, float loadFactor) {
        //初始容量不能<0
        if (initialCapacity <0)
            throw new IllegalArgumentException("Illegal initial capacity: "
                    + initialCapacity);
        //初始容量不能 > 最大容量值，HashMap的最大容量值为2^30
        if (initialCapacity > MAXIMUM_CAPACITY)
            initialCapacity = MAXIMUM_CAPACITY;
        //负载因子不能 <0
        if (loadFactor <= 0 || Float.isNaN(loadFactor))
            throw new IllegalArgumentException("Illegal load factor: "
                    + loadFactor);

        // 计算出大于 initialCapacity 的最小的 2 的 n 次方值。
        int capacity = 1;
        while (capacity



 从源码中可以看出，每次新建一个HashMap时，都会初始化一个table数组。table数组的元素为Entry节点。

static class Entry implements Map.Entry {
        final K key;
        V value;
        Entry next;
        final int hash;

        /**
         * Creates new entry.
         */
        Entry(int h, K k, V v, Entry n) {
            value = v;
            next = n;
            key = k;
            hash = h;
        }
        .......
    }
 其中Entry为HashMap的内部类，它包含了键key、值value、下一个节点next，以及hash值，这是非常重要的，正是由于Entry才构成了table数组的项为链表。
 上面简单分析了HashMap的数据结构，下面将探讨HashMap是如何实现快速存取的。

 四、存储实现：put(key,vlaue)
 首先我们先看源码

public V put(K key, V value) {
        //当key为null，调用putForNullKey方法，保存null与table第一个位置中，这是HashMap允许为null的原因
        if (key == null)
            return putForNullKey(value);
        //计算key的hash值
        int hash = hash(key.hashCode());                  ------(1)
        //计算key hash 值在 table 数组中的位置
        int i = indexFor(hash, table.length);             ------(2)
        //从i出开始迭代 e,找到 key 保存的位置
        for (Entry e = table[i]; e != null; e = e.next) {
            Object k;
            //判断该条链上是否有hash值相同的(key相同)
            //若存在相同，则直接覆盖value，返回旧value
            if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
                V oldValue = e.value;    //旧值 = 新值
                e.value = value;
                e.recordAccess(this);
                return oldValue;     //返回旧值
            }
        }
        //修改次数增加1
        modCount++;
        //将key、value添加至i位置处
        addEntry(hash, key, value, i);
        return null;
    }
 通过源码我们可以清晰看到HashMap保存数据的过程为：首先判断key是否为null，若为null，则直接调用putForNullKey方法。若不为空则先计算key的hash值，然后根据hash值搜索在table数组中的索引位置，如果table数组在该位置处有元素，则通过比较是否存在相同的key，若存在则覆盖原来key的value，否则将该元素保存在链头（最先保存的元素放在链尾）。若table在该处没有元素，则直接保存。这个过程看似比较简单，其实深有内幕。有如下几点：
 1、 先看迭代处。此处迭代原因就是为了防止存在相同的key值，若发现两个hash值（key）相同时，HashMap的处理方式是用新value替换旧value，这里并没有处理key，这就解释了HashMap中没有两个相同的key。
 2、 在看（1）、（2）处。这里是HashMap的精华所在。首先是hash方法，该方法为一个纯粹的数学计算，就是计算h的hash值。

static int hash(int h) {
        h ^= (h >>> 20) ^ (h >>> 12);
        return h ^ (h >>> 7) ^ (h >>> 4);
    }
 我们知道对于HashMap的table而言，数据分布需要均匀（最好每项都只有一个元素，这样就可以直接找到），不能太紧也不能太松，太紧会导致查询速度慢，太松则浪费空间。计算hash值后，怎么才能保证table元素分布均与呢？我们会想到取模，但是由于取模的消耗较大，HashMap是这样处理的：调用indexFor方法。

static int indexFor(int h, int length) {
        return h & (length-1);
    }
 HashMap的底层数组长度总是2的n次方，在构造函数中存在：capacity <<= 1;这样做总是能够保证HashMap的底层数组长度为2的n次方。当length为2的n次方时，h&(length - 1)就相当于对length取模，而且速度比直接取模快得多，这是HashMap在速度上的一个优化。至于为什么是2的n次方下面解释。
 我们回到indexFor方法，该方法仅有一条语句：h&(length - 1)，这句话除了上面的取模运算外还有一个非常重要的责任：均匀分布table数据和充分利用空间。
 这里我们假设length为16(2^n)和15，h为5、6、7。


 当n=15时，6和7的结果一样，这样表示他们在table存储的位置是相同的，也就是产生了碰撞，6、7就会在一个位置形成链表，这样就会导致查询速度降低。诚然这里只分析三个数字不是很多，那么我们就看0-15。


 从上面的图表中我们看到总共发生了8此碰撞，同时发现浪费的空间非常大，有1、3、5、7、9、11、13、15处没有记录，也就是没有存放数据。这是因为他们在与14进行&运算时，得到的结果最后一位永远都是0，即0001、0011、0101、0111、1001、1011、1101、1111位置处是不可能存储数据的，空间减少，进一步增加碰撞几率，这样就会导致查询速度慢。而当length
 = 16时，length – 1 = 15 即1111，那么进行低位&运算时，值总是与原来hash值相同，而进行高位运算时，其值等于其低位值。所以说当length = 2^n时，不同的hash值发生碰撞的概率比较小，这样就会使得数据在table数组中分布较均匀，查询速度也较快。
 这里我们再来复习put的流程：当我们想一个HashMap中添加一对key-value时，系统首先会计算key的hash值，然后根据hash值确认在table中存储的位置。若该位置没有元素，则直接插入。否则迭代该处元素链表并依此比较其key的hash值。如果两个hash值相等(e.hash == hash && ((k = e.key) == key || key.equals(k))),则用新的Entry的value覆盖原来节点的value。如果两个hash值不等
 ，则将该节点插入该链表的链头。具体的实现过程见addEntry方法，如下：

void addEntry(int hash, K key, V value, int bucketIndex) {
        //获取bucketIndex处的Entry
        Entry e = table[bucketIndex];
        //将新创建的 Entry 放入 bucketIndex 索引处，并让新的 Entry 指向原来的 Entry 
        table[bucketIndex] = new Entry(hash, key, value, e);
        //若HashMap中元素的个数超过极限了，则容量扩大两倍
        if (size++ >= threshold)
            resize(2 * table.length);
    }
 这个方法中有两点需要注意：

一是链的产生。这是一个非常优雅的设计。系统总是将新的Entry对象添加到bucketIndex处。如果bucketIndex处已经有了对象，那么新添加的Entry对象将指向原有的Entry对象，形成一条Entry链，但是若bucketIndex处没有Entry对象，也就是e==null,那么新添加的Entry对象指向null，也就不会产生Entry链了。
 
二、扩容问题。
 随着HashMap中元素的数量越来越多，发生碰撞的概率就越来越大，所产生的链表长度就会越来越长，这样势必会影响HashMap的速度，为了保证HashMap的效率，系统必须要在某个临界点进行扩容处理。该临界点在当HashMap中元素的数量等于table数组长度*加载因子。但是扩容是一个非常耗时的过程，因为它需要重新计算这些数据在新table数组中的位置并进行复制处理。所以如果我们已经预知HashMap中元素的个数，那么预设元素的个数能够有效的提高HashMap的性能。

 五、读取实现：get(key)
 相对于HashMap的存而言，取就显得比较简单了。通过key的hash值找到在table数组中的索引处的Entry，然后返回该key对应的value即可。

public V get(Object key) {
        // 若为null，调用getForNullKey方法返回相对应的value
        if (key == null)
            return getForNullKey();
        // 根据该 key 的 hashCode 值计算它的 hash 码  
        int hash = hash(key.hashCode());
        // 取出 table 数组中指定索引处的值
        for (Entry e = table[indexFor(hash, table.length)]; e != null; e = e.next) {
            Object k;
            //若搜索的key与查找的key相同，则返回相对应的value
            if (e.hash == hash && ((k = e.key) == key || key.equals(k)))
                return e.value;
        }
        return null;
    }
 在这里能够根据key快速的取到value除了和HashMap的数据结构密不可分外，还和Entry有莫大的关系，在前面就提到过，HashMap在存储过程中并没有将key，value分开来存储，而是当做一个整体key-value来处理的，这个整体就是Entry对象。同时value也只相当于key的附属而已。在存储的过程中，系统根据key的hashcode来决定Entry在table数组中的存储位置，在取的过程中同样根据key的hashcode取出相对应的Entry对象。


>>>>>>欢迎各位关注我的个人站点：http://cmsblogs.com/




    
        
                        程序员
                        java
                        hash
                        go
                        http
                        io
                        key
                        算法
                        clone
                    
    



    
        写下你的评论吧 !
        
            
                吐个槽吧,看都看了
            
            
                
                                        会员登录 | 用户注册
                                    
                
            
        

        
    

    
        推荐阅读
        
            
                                
                    
                        instance
                        PHP 对象生命周期与内存管理
                    

                    
                                                
                        本文详细介绍了 PHP 中对象的生命周期、内存管理和魔术方法的使用，包括对象的自动销毁、析构函数的作用以及各种魔术方法的具体应用场景。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-11-12 13:35:26
                    

                

                
                                
                    
                        join
                        Python基础：使用NLTK和Python构建机器学习应用
                    

                    
                                                
                        本文节选自《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书的第1章第1.2节，作者Nitin Hardeniya。本文将带领读者快速了解Python的基础知识，为后续的机器学习应用打下坚实的基础。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-11-13 21:23:34
                    

                

                                
                    
                    
                
                
                                
                    
                        join
                        浅析python实现布隆过滤器及Redis中的缓存穿透原理_python
                    

                    
                                                
                            
                        
                                                
                        本文带你了解了位图的实现，布隆过滤器的原理及Python中的使用，以及布隆过滤器如何应对Redis中的缓存穿透，相信你对布隆过滤 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-11-13 16:43:07
                    

                

                
                                
                    
                        instance
                        Java反射机制详解及应用场景
                    

                    
                                                
                        本文详细介绍了Java反射机制的基本概念、获取Class对象的方法、反射的主要功能及其在实际开发中的应用。通过具体示例，帮助读者更好地理解和使用Java反射。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-11-13 16:08:08
                    

                

                
                                
                    
                        post
                        在范围[0..n-1]中产生m个不同的随机数 - Generating m distinct random numbers in the range [0..n-1]
                    

                    
                                                
                        Ihavetwomethodsofgeneratingmdistinctrandomnumbersintherange[0..n-1]我有两种方法在范围[0.n-1]中生 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-11-13 09:49:14
                    

                

                
                                
                    
                        io
                        Java 并发编程：深入解析 AtomicInteger 和 CAS 无锁算法
                    

                    
                                                
                        在多线程并发环境中，普通变量的操作往往是线程不安全的。本文通过一个简单的例子，展示了如何使用 AtomicInteger 类及其核心的 CAS 无锁算法来保证线程安全。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-11-12 16:40:04
                    

                

                
                                
                    
                        io
                        字节流(InputStream和OutputStream)，字节流读写文件，字节流的缓冲区，字节缓冲流
                    

                    
                                                
                            
                        
                                                
                        字节流抽象类InputStream和OutputStream是字节流的顶级父类所有的字节输入流都继承自InputStream，所有的输出流都继承子OutputStreamInput ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-11-12 14:07:25
                    

                

                
                                
                    
                        io
                        如何在Java中使用DButils类
                    

                    
                                                
                            
                        
                                                
                        这期内容当中小编将会给大家带来有关如何在Java中使用DButils类，文章内容丰富且以专业的角度为大家分析和叙述，阅读完这篇文章希望大家可以有所收获。D ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-11-12 13:46:11
                    

                

                
                                
                    
                        split
                        剑指Offer 44. 反转字符串中的单词
                    

                    
                                                
                        题目描述：牛客网新员工Fish每天早上都会拿着一本英文杂志，在本子上写下一些句子。他的同事Cat对这些句子非常感兴趣，但发现这些句子的单词顺序被反转了。例如，“student. a am I”实际上是“I am a student.”。Cat请求你帮助他恢复这些句子的正常顺序。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-11-13 19:40:26
                    

                

                
                                
                    
                        io
                        三角测量计算三维坐标的代码_双目三维重建——层次化重建思考
                    

                    
                                                
                            
                        
                                                
                        双目三维重建——层次化重建思考FesianXu2020.7.22atANTFINANCIALintern前言本文是笔者阅读[1]第10章内容的笔记，本文从宏观的角度阐 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-11-13 19:31:37
                    

                

                
                                
                    
                        io
                        Spring 3.0.5 中获取 MySQL 表的自增主键
                    

                    
                                                
                        本文介绍了如何在 Spring 3.0.5 中使用 JdbcTemplate 插入数据并获取 MySQL 表中的自增主键。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-11-13 18:00:32
                    

                

                
                                
                    
                        io
                        利用OpenCV和线性SVM实现人脸识别
                    

                    
                                                
                        本文介绍如何使用OpenCV和线性支持向量机（SVM）模型来开发一个简单的人脸识别系统，特别关注在只有一个用户数据集时的处理方法。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-11-13 14:50:37
                    

                

                
                                
                    
                        io
                        图像相似度对比的多种方法
                    

                    
                                                
                        本文介绍了几种常用的图像相似度对比方法，包括直方图方法、图像模板匹配、PSNR峰值信噪比、SSIM结构相似性和感知哈希算法。每种方法都有其优缺点，适用于不同的应用场景。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-11-13 11:04:56
                    

                

                
                                
                    
                        io
                        杜甫《喜晴》的两种英译比较
                    

                    
                                                
                        本文对比了杜甫《喜晴》的两种英文翻译版本：a. Pleased with Sunny Weather 和 b. Rejoicing in Clearing Weather。a 版由 alexcwlin 翻译并经 Adam Lam 编辑，b 版则由哈佛大学的宇文所安教授 (Prof. Stephen Owen) 翻译。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-11-12 15:02:28
                    

                

                
                                
                    
                        io
                        思科IOS XE与ISE集成实现TACACS认证配置
                    

                    
                                                
                            
                        
                                                
                        本文详细介绍了如何在思科IOS XE设备上配置TACACS认证，并通过ISE（Identity Services Engine）进行用户管理和授权。配置包括网络拓扑、设备设置和ISE端的具体步骤。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-11-12 13:17:06

















    

    
        
            
            
                
                
            

            
                薇薇llfnc            

            
                这个家伙很懒，什么也没留下！            


        
    

    
    

    
    

    
        Tags | 热门标签
        
            
                                
                    ascii
                
                                
                    dll
                
                                
                    cpython
                
                                
                    perl
                
                                
                    netty
                
                                
                    express
                
                                
                    random
                
                                
                    chat
                
                                
                    heap
                
                                
                    shell
                
                                
                    case
                
                                
                    controller
                
                                
                    default
                
                                
                    copy
                
                                
                    require
                
                                
                    request
                
                                
                    main
                
                                
                    const
                
                                
                    io
                
                                
                    split
                
                                
                    emoji
                
                                
                    metadata
                
                                
                    join
                
                                
                    post
                
                                
                    expression
                
                                
                    cSharp
                
                                
                    actionscrip
                
                                
                    typescript
                
                                
                    window
                
                                
                    instance
                
                                
            
        
    

    
    
        
            
            
        
        RankList | 热门文章
        
            
                                
                    1解决mysql启动时出现系统错误2的方法
                
                                
                    2Oracle 完整数据库副本
                
                                
                    3word文档查重_论文查重应该提交什么格式？
                
                                
                    4拷贝HttpRequestBase对象
                
                                
                    5软件工程—个人作业（5）
                
                                
                    6服务器监控系统大概多少钱,服务器监控系统 报价
                
                                
                    7JavaScript字符串包含
                
                                
                    8kubernetes二进宫系列——k8s整体架构与核心组件详解2
                
                                
                    9精准创业实战第13章 不要堆积功能
                
                                
                    10微软云平台 Azure简介 （四）Windows Azure 存储之Blob
                
                                
                    11Word批量打印软件/工具
                
                                
                    12C语言解题——指针解析（牛客网题目）
                
                                
                    13查漏补缺_半夜思考之查漏补缺 , Spring 中 Bean 之间的依赖问题
                
                                
                    14说说如何写分析类文章
                
                                
                    15H3C/锐捷 路由、交换 网御防火墙 一些配置要点