Java中String的hash函数分析

作者：其穗茹 | 来源：互联网 | 2023-05-17 23:51

JDK6的源码：***Returnsahashcodeforthisstring.Thehashcodefora*<code>Str

JDK6的源码：

    /**
     * Returns a hash code for this string. The hash code for a
     * String object is computed as
     * 
     * s[0]*31^(n-1) + s[1]*31^(n-2) + ... + s[n-1]
     * 

     * using int arithmetic, where s[i] is the
     * ith character of the string, n is the length of
     * the string, and ^ indicates exponentiation.
     * (The hash value of the empty string is zero.)
     *
     * @return  a hash code value for this object.
     */
    public int hashCode() {
int h = hash;
if (h == 0) {
    int off = offset;
    char val[] = value;
    int len = count;

            for (int i = 0; i                 h = 31*h + val[off++];
            }
            hash = h;
        }
        return h;
    }

以字符串"123"为例：

字符'1'的ascii码是49

hashCode = （49*31 + 50）*31 + 51

或者这样看：

hashCode=（'1' * 31 + '2' ） * 31 + '3'

可见实际可以看作是一种权重的算法，在前面的字符的权重大。

这样有个明显的好处，就是前缀相同的字符串的hash值都落在邻近的区间。

好处有两点：

1.可以节省内存，因为hash值在相邻，这样hash的数组可以比较小。比如当用HashMap，以String为key时。

2.hash值相邻，如果存放在容器，比好HashSet，HashMap中时，实际存放的内存的位置也相邻，则存取的效率也高。（程序局部性原理）

以31为倍数，原因了31的二进制全是1，则可以有效地离散数据。

最后看下，两个字符串，由Eclipse生成的代码是如何计算hash值的：

public class Name{
String firstName;
String lastName;
@Override
public int hashCode() {
final int prime = 31;
int result = 1;
result = prime * result
+ ((firstName == null) ? 0 : firstName.hashCode());
result = prime * result
+ ((lastName == null) ? 0 : lastName.hashCode());
return result;
}

@Override
public boolean equals(Object obj) {
if (this == obj)
return true;
if (obj == null)
return false;
if (getClass() != obj.getClass())
return false;
Name other = (Name) obj;
if (firstName == null) {
if (other.firstName != null)
return false;
} else if (!firstName.equals(other.firstName))
return false;
if (lastName == null) {
if (other.lastName != null)
return false;
} else if (!lastName.equals(other.lastName))
return false;
return true;
}
}

可见，还是以31为倍数， hashCode = firstName.hashCode() * 31 + lastName.hashCode() 。

BTW：Java的字符串的hash做了缓存，第一次才会真正算，以后都是取缓存值。

eclipse生成的equals函数质量也很高，各种情况都考虑到了。

总结：字符串hash函数，不仅要减少冲突，而且要注意相同前缀的字符串生成的hash值要相邻。

推荐阅读

数组
关于LinkedHashMap实现LRU缓存算法

缓存这个东西就是为了提高运行速度的，由于缓存是在寸土寸金的内存里面，不是在硬盘里面，所以容量是很有限的。LRU这个算法就是把最近一次使用时间离现在时间最远的数据删除掉。先说说List：每 ... [详细]

蜡笔小新 2023-09-10 10:48:58
object
Java HashSet和HashMap源码剖析

转载自：http:www.blogjava.netCarpenterLeearchive20160427430268.html总体介绍之所以把HashSet和HashMa ... [详细]

蜡笔小新 2023-09-10 22:23:41
hash
如何利用Java 5 Executor框架高效构建和管理线程池

Java 5 引入了 Executor 框架，为开发人员提供了一种高效管理和构建线程池的方法。该框架通过将任务提交与任务执行分离，简化了多线程编程的复杂性。利用 Executor 框架，开发人员可以更灵活地控制线程的创建、分配和管理，从而提高服务器端应用的性能和响应能力。此外，该框架还提供了多种线程池实现，如固定线程池、缓存线程池和单线程池，以适应不同的应用场景和需求。 ... [详细]

蜡笔小新 2024-11-07 17:05:32
case
深入解析Java事件处理机制及其应用

本文详细探讨了Java事件处理机制的核心概念与实现原理，内容浅显易懂，适合初学者逐步掌握。通过具体的示例和详细的解释，读者可以深入了解Java事件模型的工作方式及其在实际开发中的应用。 ... [详细]

蜡笔小新 2024-11-06 18:08:38
hash
java-HashMap默认机制

HashMap:键值对（key-value）:通过对象来对对象进行索引，用来索引的对象叫做key,其对应的对象叫做value.默认是1:1关系:存在则覆盖，当key已经存在，则利用新的va ... [详细]

蜡笔小新 2023-10-10 14:29:36
hash
比较Map的性能

单线程化的ConcurrentHashMap的性能要比同步的HashMap的性能稍好一些，而且在并发应用中，这种作用就十分明显了。ConcurrentHashMap的实现，假定大多数常用的操 ... [详细]

蜡笔小新 2023-09-23 15:40:25
php
Java集合详解5：深入理解LinkedHashMap和LRU缓存

Java集合详解5：深入理解LinkedHashMap和LRU缓存今天我们来深入探索一下LinkedHashMap的底层原理，并且使用linkedhashmap来实现LRU缓存。具体代码在我的 ... [详细]

蜡笔小新 2023-09-23 10:53:28
数组
java1.7集合源码赏析系列：HashTable、ConcurrentHashMap、HashMap差异分析

HashTable与ConcurrentHashMap均可实现HashMap的功能，对外提供了键值对存储的数据结构。但是在内部结构及实现上有何区别，性能上的差异到底在哪里又是如何导致的 ... [详细]

蜡笔小新 2023-09-14 08:45:47
object
Java中不同类型的常量池（字符串常量池、Class常量池和运行时常量池）的对比与关联分析

在研究Java虚拟机的过程中，笔者发现存在多种类型的常量池，包括字符串常量池、Class常量池和运行时常量池。通过查阅CSDN、博客园等相关资料，对这些常量池的特性、用途及其相互关系进行了详细探讨。本文将深入分析这三种常量池的差异与联系，帮助读者更好地理解Java虚拟机的内部机制。 ... [详细]

蜡笔小新 2024-11-08 10:38:37
case
Scala学习指南：从零开始掌握基础

本指南从零开始介绍Scala编程语言的基础知识，重点讲解了Scala解释器REPL（读取-求值-打印-循环）的使用方法。REPL是Scala开发中的重要工具，能够帮助初学者快速理解和实践Scala的基本语法和特性。通过详细的示例和练习，读者将能够熟练掌握Scala的基础概念和编程技巧。 ... [详细]

蜡笔小新 2024-11-07 18:07:59
case
Java 曾经有过配对类吗？—— 探讨 Java 中 Pair 类的历史与现状

本文探讨了 Java 中 Pair 类的历史与现状。虽然 Java 标准库中没有内置的 Pair 类，但社区和第三方库提供了多种实现方式，如 Apache Commons 的 Pair 类和 JavaFX 的 javafx.util.Pair 类。这些实现为需要处理成对数据的开发者提供了便利。此外，文章还讨论了为何标准库未包含 Pair 类的原因，以及在现代 Java 开发中使用 Pair 类的最佳实践。 ... [详细]

蜡笔小新 2024-11-06 18:56:35
php
深入解析Spring AOP框架中的代理对象生成机制

在前文探讨了Spring如何为特定的bean选择合适的通知器后，本文将进一步深入分析Spring AOP框架中代理对象的生成机制。具体而言，我们将详细解析如何通过代理技术将通知器（Advisor）中包含的通知（Advice）应用到目标bean上，以实现切面编程的核心功能。 ... [详细]

蜡笔小新 2024-11-06 10:11:10
数组
Redis哈希数据结构入门指南

Redis的哈希数据结构与Java中的HashMap类似，采用数组加链表的方式实现。数组用于存储哈希值的位置，而链表则用于处理哈希冲突的情况。此外，Redis的哈希数据结构还支持高效的字段操作和内存优化，适用于多种应用场景，如缓存和会话管理。 ... [详细]

蜡笔小新 2024-11-05 14:17:44
object
android布局基础及范例（二）：人人android九宫格布局

人人android是人人网推出的一款优秀的手机应用软件，我们在使用的时候发现他的首页布局是九宫格模式的，让人觉得很别致，因为现在很多的android软件很少使用这种布局模式，人人andr ... [详细]

蜡笔小新 2023-09-23 11:36:21
hash
使用Hashmap值作为索引以在Java

我有3个来自RESEARCHS的映射值，指定要使用参考数据集填充的行中的范围。该研究 ... [详细]

蜡笔小新 2023-09-16 13:15:05

其穗茹

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章