为什么这个hashCode()方法被认为很差？

作者：荆灬樊小姐_526 | 来源：互联网 | 2023-05-28 14:56

如何解决《为什么这个hashCode()方法被认为很差？》经验，为你挑选了1个好方法。

这是" 在Java 8中使用Java 7 HashMap "的后续问题.有一些有趣的评论.有些我很清楚; 其他人少.

为什么这种hashCode()方法被认为很差？

乍一看,我觉得这很合理.也许17可以增加到31.否则,它似乎遵循普遍接受的公式Arrays.hashCode(Object[]).一个猜测:它适用于一般情况,其中项目数量相对较小(小于10.000),但对于非常大的集合(1.000.000或更高)表现不佳.

这是原始代码:(包含所有内容以提供一些上下文.)

import java.util.HashMap;
import java.util.Map;
import java.util.Random;

public class Test1 {

static int max_k1 = 500;
static int max_k2 = 500;

static Map map;
static Random random = new Random();

public static void main(String[] args) {
    for (int i = 0; i <15; i++) {
        long start = System.nanoTime();
        run();
        long end = System.nanoTime();
        System.out.println((end - start) / 1000_000);
    }
}

private static void run() {
    map = new HashMap<>();
    for (int i = 0; i <10_000_000; i++) {
        Node key = new Node(random.nextInt(max_k1), random.nextInt(max_k2));
        Node val = getOrElseUpdate(key);
    }
}

private static Node getOrElseUpdate(Node key) {
    Node val;
    if ((val = map.get(key)) == null) {
        val = key;
        map.put(key, val);
    }
    return val;
}

private static class Node {

    private int k1;
    private int k2;

    public Node(int k1, int k2) {
        this.k1 = k1;
        this.k2 = k2;
    }

    @Override
    public int hashCode() {
        int result = 17;
        result = 31 * result + k1;
        result = 31 * result + k2;
        return result;
    }

    @Override
    public boolean equals(Object obj) {
        if (this == obj)
            return true;

        if (!(obj instanceof Node))
            return false;

        Node other = (Node) obj;

        return k1 == other.k1 && k2 == other.k2;
    }
  }
}

RealSkeptic.. 6

我是其中一个告诉你它很穷的人.我告诉你原因:"250,000个可能的Node值它只有15969个哈希码."

如果您的Node项目应该在0≤ k1<500和0≤ k2<500范围内或多或少均匀分布,那么您有250,000个可能的节点值.

一个好的哈希函数应该为你提供这些250,000个值尽可能唯一的哈希码.也就是说,理想情况下,一个好的哈希函数应该给你的每个组合不同的价值k1和k2.

散列函数不需要是唯一的,因为在许多情况下这是不可能的 - 如果你的对象具有数万亿和数万亿的可能组合,当然你不能将所有这些组合映射到不同的整数.

您使用的标准哈希函数适用于该类对象.如果你有均匀分布的对象具有很多可能性,那么这种散列函数最终将使用所有可能的整数值,这是它能做的最好的.

但在您的特定情况下,您有250,000个组合,可以使用该函数轻松表示为单个整数500 * k1 + k2.完全独特的哈希函数是理想的选择.

你使用的"标准"哈希函数表现不佳,因为在这么小的整数范围内,它将它们中的许多映射到相同的值,你最终只有15,969个唯一的哈希码.这意味着您的许多Node对象将映射到相同的哈希码.(250,000/15,969对于每个代码!).所以你将会遇到很多哈希冲突.

您拥有的哈希冲突越多,哈希映射的性能就越差,因为大多数哈希映射的良好性能依赖于相同哈希桶中尽可能少的密钥.并且散列桶由散列码确定.

1> RealSkeptic..：

我是其中一个告诉你它很穷的人.我告诉你原因:"250,000个可能的Node值它只有15969个哈希码."

如果您的Node项目应该在0≤ k1<500和0≤ k2<500范围内或多或少均匀分布,那么您有250,000个可能的节点值.

一个好的哈希函数应该为你提供这些250,000个值尽可能唯一的哈希码.也就是说,理想情况下,一个好的哈希函数应该给你的每个组合不同的价值k1和k2.

散列函数不需要是唯一的,因为在许多情况下这是不可能的 - 如果你的对象具有数万亿和数万亿的可能组合,当然你不能将所有这些组合映射到不同的整数.

您使用的标准哈希函数适用于该类对象.如果你有均匀分布的对象具有很多可能性,那么这种散列函数最终将使用所有可能的整数值,这是它能做的最好的.

但在您的特定情况下,您有250,000个组合,可以使用该函数轻松表示为单个整数500 * k1 + k2.完全独特的哈希函数是理想的选择.

您拥有的哈希冲突越多,哈希映射的性能就越差,因为大多数哈希映射的良好性能依赖于相同哈希桶中尽可能少的密钥.并且散列桶由散列码确定.

@kevinarpe他的解释写得很好.:)也许你应该选择它作为答案.

推荐阅读

list
从 .NET 转 Java 的自学之路：IO 流基础篇

本文详细介绍了 Java 中的 IO 流，包括字节流和字符流的基本概念及其操作方式。探讨了如何处理不同类型的文件数据，并结合编码机制确保字符数据的正确读写。同时，文中还涵盖了装饰设计模式的应用，以及多种常见的 IO 操作实例。 ... [详细]

蜡笔小新 2024-12-26 17:37:25
list
Java 中的不可变集合与同步集合详解

本文将详细探讨 Java 中提供的不可变集合（如 `Collections.unmodifiableXXX`）和同步集合（如 `Collections.synchronizedXXX`）的实现原理及使用方法，帮助开发者更好地理解和应用这些工具。 ... [详细]

蜡笔小新 2024-12-20 15:34:31
list
java-HashMap默认机制

HashMap:键值对（key-value）:通过对象来对对象进行索引，用来索引的对象叫做key,其对应的对象叫做value.默认是1:1关系:存在则覆盖，当key已经存在，则利用新的va ... [详细]

蜡笔小新 2023-10-10 14:29:36
list
使用Hashmap值作为索引以在Java

我有3个来自RESEARCHS的映射值，指定要使用参考数据集填充的行中的范围。该研究 ... [详细]

蜡笔小新 2023-09-16 13:15:05
list
关于LinkedHashMap实现LRU缓存算法

缓存这个东西就是为了提高运行速度的，由于缓存是在寸土寸金的内存里面，不是在硬盘里面，所以容量是很有限的。LRU这个算法就是把最近一次使用时间离现在时间最远的数据删除掉。先说说List：每 ... [详细]

蜡笔小新 2023-09-10 10:48:58
list
Java中怎么对HashMap按键值排序

本篇文章给大家分享的是有关Java中怎么对HashMap按键值排序，小编觉得挺实用的，因此分享给大家学习，希望大家阅读完这篇文章后可以有所收获，话 ... [详细]

蜡笔小新 2023-09-09 14:01:50
list
Java并发编程：LinkedBlockingQueue的实际应用

本文介绍了Java并发库中的阻塞队列（BlockingQueue）及其典型应用场景。通过具体实例，展示了如何利用LinkedBlockingQueue实现线程间高效、安全的数据传递，并结合线程池和原子类优化性能。 ... [详细]

蜡笔小新 2024-12-27 18:51:49
string
Java中访问器与修改器的深入解析

本文详细介绍了Java中的访问器（getter）和修改器（setter），探讨了它们在保护数据完整性、增强代码可维护性方面的重要作用。通过具体示例，展示了如何正确使用这些方法来控制类属性的访问和更新。 ... [详细]

蜡笔小新 2024-12-26 17:25:24
string
Scala 实现 UTF-8 编码属性文件读取与克隆

本文介绍如何使用 Scala 以 UTF-8 编码方式读取属性文件，并实现属性文件的克隆功能。通过这种方式，可以确保配置文件在多线程环境下的一致性和高效性。 ... [详细]

蜡笔小新 2024-12-26 08:25:19
list
Python——对象自省

对象自省自省在计算机编程领域里，是指在运行时判断一个对象的类型和能力。dir能够返回一个列表，列举了一个对象所拥有的属性和方法。my_list[ ... [详细]

蜡笔小新 2024-12-23 12:55:35
spring
深入解析Java枚举及其高级特性

本文详细介绍了Java枚举的概念、语法、使用规则和应用场景，并探讨了其在实际编程中的高级应用。所有相关内容已收录于GitHub仓库[JavaLearningmanual](https://github.com/Ziphtracks/JavaLearningmanual)，欢迎Star并持续关注。 ... [详细]

蜡笔小新 2024-12-22 14:46:52
list
深入解析Spring启动过程

本文详细介绍了Spring框架的启动流程，帮助开发者理解其内部机制。通过具体示例和代码片段，解释了Bean定义、工厂类、读取器以及条件评估等关键概念，使读者能够更全面地掌握Spring的初始化过程。 ... [详细]

蜡笔小新 2024-12-21 17:33:44
list
深入解析Android中的SQLite数据库使用

本文详细介绍了如何在Android应用中使用SQLite数据库进行数据存储。通过自定义类继承SQLiteOpenHelper，实现数据库的创建与版本管理，并提供了具体的学生信息管理示例代码。 ... [详细]

蜡笔小新 2024-12-18 10:09:40
list
每日30秒，轻松掌握Python编程技巧

在Python编程学习过程中，许多初学者常遇到各种功能实现难题。虽然这些问题往往并不复杂，但找到高效解决方案却能显著提升编程效率。本文将介绍一个名为‘30-seconds-of-python’的优质资源，帮助大家快速掌握实用的Python技巧。 ... [详细]

蜡笔小新 2024-12-17 10:22:07
string
类 Hashtable及与HashMap的区别

类Hashtable<K,V>所有已实现的接口：Serializable,Cloneable,Map<K,V>此类实现一个哈希表，该哈希表将键映 ... [详细]

蜡笔小新 2023-09-10 09:48:30

荆灬樊小姐_526

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章