当前位置: 开发笔记 > 编程语言 > 正文

【转】由HashMap哈希算法引出的求余%和与运算&转换问题

作者：合约100年 | 来源：互联网 | 2023-08-29 15:08

目录1、引出问题2、结论3、分析过程4、总结回到顶部1、引出问题在前面讲解HashMap的源码实现时，有

1、引出问题
2、结论
3、分析过程
4、总结

回到顶部

1、引出问题

　　在前面讲解 HashMap 的源码实现时，有如下几点：

　　①、初始容量为 1<<4，也就是2⁴ = 16

　　②、负载因子是0.75，当存入HashMap的元素占比超过整个容量的75%时，进行扩容，而且在不超过int类型的范围时，进行2次幂的扩展(指长度扩为原来2倍)

　　扩大一倍

　　③、新添加一个元素时，计算这个元素在HashMap中的位置，也就是本篇文章的主角哈希运算。分为三步：

　　第一步：取 hashCode 值： key.hashCode()

　　第二步：高位参与运算：h>>>16

　　第三步：取模运算：(n-1) & hash

1     static final int hash(Object key) {
2         int h;
3         return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
4     }
5 
6     tab[i = (n - 1) & hash]；

　　ps：第 6 行代码是我自己加的。

　　我们知道一个好的哈希算法能够使得元素分布的更加均匀，从而减少哈希冲突。HashMap 在这块的处理就很巧妙：

　　首先第一步取得 hashCode，该方法是一个用native修饰的本地方法，返回的是一个 int 类型的值（根据内存地址换算出来的一个值），通常我们都会重写该方法。

　　第二步将取得的哈希值无符号右移16位，高位补0。并与前面第一步获得的hash码进行按位异或^ 运算。这是为了当length比较小的时候，也能保证考虑到高低Bit位都参与到Hash的计算中，同时不会有太大的开销。

　　本文的重点是第三步，将经过前面两步获取的 hash 值，与HashMap的集合长度减 1 进行按位与 & 运算：(n-1) & hash。但是其实很多哈希算法，为了使元素分布均匀，都是用的取模运算，用一个值去模上总长度，即 n%hash。我们知道在计算机中 & 的效率比 % 高很多，那么如何将 % 转换为 & 运算呢？在HashMap 中，是用的 (n - 1) & hash 进行运算的，那么这是为什么呢？

　　这就是本篇博客我们将要明白的问题。

回到顶部

2、结论

　　我们先给出结论：

　　当 lenth = 2ⁿ 时，X % length = X & (length - 1)

　　也就是说，长度为2的n次幂时，模运算 % 可以变换为按位与 & 运算。

　　比如：9 % 4 = 1，9的二进制是 1001 ,4-1 = 3,3的二进制是 0011。 9 & 3 = 1001 & 0011 = 0001 = 1

　　再比如：12 % 8 = 4,12的二进制是 1100,8-1 = 7,7的二进制是 0111。12 & 7 = 1100 & 0111 = 0100 = 4

　　上面两个例子4和8都是2的n次幂，结论是成立的，那么当长度不为2的n次幂呢？

　　比如：9 % 5 = 4，9的二进制是 1001，5-1 = 4,4的二进制是0100。9 & 4 = 1001 & 0100 = 0000 = 0。显然是不成立的。

　　为什么是这样？下面我们来详细分析。

回到顶部

3、分析过程

　　首先我们要知道如下规则：

　　①、"<<" 左移：右边空出的位上补0，左边的位将从字头挤掉，左移一位其值相当于乘2。

　　②、">>"右移：右边的位被挤掉，右移一位其值相当于除以2。对于左边移出的空位，如果是正数则空位补0，若为负数，可能补0或补1，这取决于所用的计算机系统。

　　③、">>>"无符号右移，右边的位被挤掉，对于左边移出的空位一概补上0。

　　根据二进制数的特点，相信大家很好理解。

　　对于给定一个任意的十进制数X_nX_n-1X_n-2....X₁X₀，我们将其用二进制的表示方法分解：

　　X_nX_n-1X_n-2....X₁X₀ = X_n*2ⁿ+X_n-1*2^n-1+......+X₁*2¹+X₀*2⁰ 3-1公式

　　这里的十进制数只有三位，同理当有N位时，后面2的幂次方依次从 0 开始递增到 N 。

　　回到上面的结论： lenth = 2ⁿ 时，X % length = X & (length - 1)

　　以及对于除法，被除数是满足分配率的（除数不满足）：

　　成立：（a+b）÷c=a÷c+b÷c 3-2公式

　　不成立：a÷（b+c）≠a÷c+b÷c

　　通过 3-1公式以及 3-2 公式，我们可以得出当任意一个十进制除以一个2^k的数时，我们可以将这个十进制转换成3-1公式的表示形式：

　　(X_nX_n-1X_n-2....X₁X₀) / 2^k = (X_n*2ⁿ+X_n-1*2^n-1+......+X₁*2¹+X₀*2⁰) / 2^k = X_n*2ⁿ / 2^k +X_n-1*2^n-1 / 2^k+......+ X₁*2¹/ 2^k+ X₀*2⁰ / 2^k

　　如果我们想求上面公式的余数，相信大家一眼就能看出来：

　　①、当 0<= k <= n 时，余数为 X_k*2^k+X_k-1*2^k-1+......+X₁*2¹+X₀*2⁰,也就是说比 k 大的 n次幂，我们都舍掉了（大的都能整除 2^k），比k小的我们都留下来了(小的不能整除2^k)。那么留来下来即为余数。

　　②、当 k > n 时，余数即为整个十进制数。

　　看到这里，我们离证明结论已经很近了。再回到上面说的二进制的移位操作，向右移 n 位，表示除以 2ⁿ 次方，由此我们得到一个很重要的结论：

　　一个十进制数对一个2ⁿ 的数取余，我们可以将这个十进制转换为二进制数，将这个二进制数右移n位，移掉的这 n 位数即是余数。

　　知道怎么算余数了，那么我们怎么去获取这移掉的 n 为数呢？

　　我们再看2⁰,2¹,2²....2ⁿ用二进制表示如下：

　　0001，0010，0100，1000，10000......

　　我们把上面的数字减一：

　　0000，0001，0011，0111，01111......

　　根据与运算符&的规律，当位上都是 1 时，结果才是 1，否则为 0。所以任意一个二进制数对 2^k 取余时，我们可以将这个二进制数与（2^k-1）进行按位与运算，保留的即使余数。

　　这就完美的证明了前面给出的结论：

　　当 lenth = 2ⁿ 时，X % length = X & (length - 1)

　　注意，一定要是2ⁿ次方，才满足上面的公式，否则就是错误的。

回到顶部

4、总结

　　通过上面的分析过程了，我们完美了证明了公式的正确性。在回到 HashMap 的实现过程，我们知道HashMap的初始容量为啥是 1<<4 了吧，而且每次扩容都是扩大一倍。因为必须要完美的满足 hash 算法。

推荐阅读

native
Java面试题解析

本文详细介绍了Java编程语言中的核心概念和常见面试问题，包括集合类、数据结构、线程处理、Java虚拟机（JVM）、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题，帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]

蜡笔小新 2024-12-27 13:55:14
native
Java HashSet和HashMap源码剖析

转载自：http:www.blogjava.netCarpenterLeearchive20160427430268.html总体介绍之所以把HashSet和HashMa ... [详细]

蜡笔小新 2023-09-10 22:23:41
main
关于LinkedHashMap实现LRU缓存算法

缓存这个东西就是为了提高运行速度的，由于缓存是在寸土寸金的内存里面，不是在硬盘里面，所以容量是很有限的。LRU这个算法就是把最近一次使用时间离现在时间最远的数据删除掉。先说说List：每 ... [详细]

蜡笔小新 2023-09-10 10:48:58
main
Handling Null Object Encoding in OAuth 1.0a API Implementation

Explore a common issue encountered when implementing an OAuth 1.0a API, specifically the inability to encode null objects and how to resolve it. ... [详细]

蜡笔小新 2024-12-28 08:54:34
web
Java集合详解5：深入理解LinkedHashMap和LRU缓存

Java集合详解5：深入理解LinkedHashMap和LRU缓存今天我们来深入探索一下LinkedHashMap的底层原理，并且使用linkedhashmap来实现LRU缓存。具体代码在我的 ... [详细]

蜡笔小新 2023-09-23 10:53:28
web
java1.7集合源码赏析系列：HashTable、ConcurrentHashMap、HashMap差异分析

HashTable与ConcurrentHashMap均可实现HashMap的功能，对外提供了键值对存储的数据结构。但是在内部结构及实现上有何区别，性能上的差异到底在哪里又是如何导致的 ... [详细]

蜡笔小新 2023-09-14 08:45:47
c语言
Java之HashMap在多线程情况下导致死循环的问题

PS：不得不说Java编程思想这本书是真心强大..学习内容:1.HashMap<K,V>在多线程的情况下出现的死循环现象当初学Java的时候只是知道HashMap< ... [详细]

蜡笔小新 2023-09-11 03:05:31
main
集合框架--Map集合之HashMap存储自定义对象

将学生对象和学生的归属地通过键与值存储到map集合中。importjava.util.HashMap;importjava.util.Iterator;importjava.uti ... [详细]

蜡笔小新 2023-09-09 04:43:44
main
Map集合Map map = new HashMap();

01Map集合概述A:Map集合概述:我们通过查看Map接口描述,发现Map接口下的集合与Collection接口下的集合，它们存储数据的形式不同a:Collection中的集合 ... [详细]

蜡笔小新 2023-09-06 21:09:58
main
Java面试 HashMap、HashSet源码解析

本章所有源代码基于JDK1.8版本HashMap和HashSet是JavaCollectionFramework的两个重要成员，其中HashMap是Map接口的常用实现类，Hash ... [详细]

蜡笔小新 2023-09-05 08:27:05
main
深入理解org.neo4j.helpers.collection.Iterators.single()方法及其应用

本文详细介绍了Java中org.neo4j.helpers.collection.Iterators.single()方法的功能、使用场景及代码示例，帮助开发者更好地理解和应用该方法。 ... [详细]

蜡笔小新 2024-12-28 10:51:55
bit
优化ListView性能

本文深入探讨了如何通过多种技术手段优化ListView的性能，包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]

蜡笔小新 2024-12-28 10:36:30
main
类 Hashtable及与HashMap的区别

类Hashtable<K,V>所有已实现的接口：Serializable,Cloneable,Map<K,V>此类实现一个哈希表，该哈希表将键映 ... [详细]

蜡笔小新 2023-09-10 09:48:30
main
Java中怎么对HashMap按键值排序

本篇文章给大家分享的是有关Java中怎么对HashMap按键值排序，小编觉得挺实用的，因此分享给大家学习，希望大家阅读完这篇文章后可以有所收获，话 ... [详细]

蜡笔小新 2023-09-09 14:01:50
main
手写HashMap，快手面试官直呼内行

手写HashMap，快手面试官直呼内行-手写HashMap？这么狠，面试都卷到这种程度了？第一次见到这个面试题，是在某个不方便透露姓名的Offer收割机大佬的文章：这……我当 ... [详细]

蜡笔小新 2023-09-05 19:32:25

合约100年

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章