热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

JavaHashMap实现原理0——从hashCode,equals说起

Java集合类中常见的hashSet,hashMap,hashTable(现已很少用,几乎都采用hashMap替代)的实现都离不开散列表,而散列表的优势在于O(1)级别的查找,而has

Java集合类中常见的hashSet,hashMap,hashTable(现已很少用,几乎都采用hashMap替代)的实现都离不开散列表,而散列表的优势在于O(1)级别的查找,而hashCode()是其中的关键支撑。

什么是hashCode()?

hashCode() 是获取哈希码函数,返回一个整数,确定对象在哈希表中的索引位置。hashCode() 定义在Object类中,Java中的任何类都包含有hashCode() 函数,Object类的hashCode()方法返回这个对象存储的内存地址的编号。虽然每个Java类都包含hashCode() 函数。但是在散列表相关的类中才有用(确定对象在散列表中的位置),在其它情况下基本没用。什么是散列表就不介绍了,基础的数据结构

什么是equals()?

很多文章会将equals()和hashCode()放在一起解释,两者的相同点是都在Object类中定义,以及两个对象equals,则两个对象hashCode()相同(推荐的设计原则)等。所以重写equals之后也要重写hashCode()。和equals一起考察的还有==,==常用来和equals比较区别:==判断两个对象是不是同一个对象,即它们的内存地址是否一致;equals比较两个对象是否相等,即是否是同一个类型,对象内容是否一致。所以由==可以推出equals。而equals又可以推出hashCode()相等。

hashCode()遇上hashMap

使用hashMap泛型类时,将其实例化的类,要重写类的equals和hashCode()方法,才能达到我们对hashMap定义的效果。为什么这么说呢?得参考下hashMap的部分源代码。

public V put(K key, V value) {
// HashMap允许存放null键和null值。
// 当key为null时,调用putForNullKey方法,将value放置在数组第一个位置。
if (key == null)
return putForNullKey(value);
// 根据key的hashCode重新计算hash值。
int hash = hash(key.hashCode());
// 搜索指定hash值所对应table中的索引。
int i = indexFor(hash, table.length);
// 如果 i 索引处的 Entry 不为 null,通过循环不断遍历 e 元素的下一个元素。
for (Entry e = table[i]; e != null; e = e.next) {
Object k;
if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
V oldValue = e.value;
e.value = value;
e.recordAccess(this);
return oldValue;
}
}
// 如果i索引处的Entry为null,表明此处还没有Entry。
// modCount记录HashMap中修改结构的次数
modCount++;
// 将key、value添加到i索引处。
addEntry(hash, key, value, i);
return null;
}

注意到,hashMap中存放健值对的位置,是由key的hashCode经过hash()操作后生成的。hash函数如下

static int hash(int h) {
h ^= (h >>> 20) ^ (h >>> 12);
return h ^ (h >>> 7) ^ (h >>> 4);
}

  从put()代码可以看出hashMap的插入流程:先调用hashCode方法得到该元素的hashCode值,hash()重新计算hashCode,然后查看table中是否存在该hashCode值,如果存在则调用equals方法重新确定是否存在该元素,如果存在,则更新value值,否则将新的元素添加到HashMap中。从这里可以看出,hashCode方法的存在是为了减少equals方法的调用次数,从而提高查找效率。
  hash()函数是一个单调函数,返回值和h参数之间是一一映射的关系。所以如果满足equals()的两个对象,hashCode()不同,在hashMap中会被当作两个不同的对象分别插入,语义上就会造成偏差。下面的代码具体反映了偏差

class People{
private String name;
private int age;
public People(String name,int age) {
this.name = name;
this.age = age;
}
public void setAge(int age){
this.age = age;
}
@Override
public boolean equals(Object obj) {
return this.name.equals(((People)obj).name) && this.age== ((People)obj).age;
}
}
public class Main {
public static void main(String[] args) {
HashMap hashMap = new HashMap();
People p1 = new People("Jack", 12);
//System.out.println(p1.hashCode());
hashMap.put(p1, 1);
System.out.println(hashMap.get(new People("Jack", 12)));
}
}

发现,插入了p1,但是在get()和p1 equals的对象时,返回的却为空。因为new People(“Jack”,12)和p1的hashCode没有在People类中重写,返回的是对象默认的内存地址,而两个对象的内存地址不同,所以hashCode不同,查找hashMap时返回为null。

重写hashCode,equals原则

  1. 同一个对象调用多次,hashCode方法必须始终如一地返回同一个整数。
  2. 如果两个对象equals比较是相等的,那么调用两个对象的hashCode方法必须返回相同的整数结果。
  3. 如果两个对象根据equals比较是不等的,hashCode方法不一定得返回不同的整数。

对于第一点,要防止自定义的hashCode依赖对象自身的字段,比如同一个对象,如果只是修改字段的值,hashCode不应该改变。

遵守以上三点原则,在hashMap(包括hashSet,hashTable)中,就不会出现违背hashMap定义的情况

最后

本文参考了浅谈Java中的hashcode方法,深入Java集合学习系列:HashMap的实现原理。
很惭愧,做了一点微小的贡献!


推荐阅读
  • 本文提供了使用Java实现Bellman-Ford算法解决POJ 3259问题的代码示例,详细解释了如何通过该算法检测负权环来判断时间旅行的可能性。 ... [详细]
  • 本文详细介绍如何在VSCode中配置自定义代码片段,使其具备与IDEA相似的代码生成快捷键功能。通过具体的Java和HTML代码片段示例,展示配置步骤及效果。 ... [详细]
  • 实体映射最强工具类:MapStruct真香 ... [详细]
  • 本文探讨了在Java中实现系统托盘最小化的两种方法:使用SWT库和JDK6自带的功能。通过这两种方式,开发者可以创建跨平台的应用程序,使窗口能够最小化到系统托盘,并提供丰富的交互功能。 ... [详细]
  • 在 Flutter 开发过程中,开发者经常会遇到 Widget 构造函数中的可选参数 Key。对于初学者来说,理解 Key 的作用和使用场景可能是一个挑战。本文将详细探讨 Key 的概念及其应用场景,并通过实例帮助你更好地掌握这一重要工具。 ... [详细]
  • 深入理解Redis的数据结构与对象系统
    本文详细探讨了Redis中的数据结构和对象系统的实现,包括字符串、列表、集合、哈希表和有序集合等五种核心对象类型,以及它们所使用的底层数据结构。通过分析源码和相关文献,帮助读者更好地理解Redis的设计原理。 ... [详细]
  • 开发笔记:9.八大排序
    开发笔记:9.八大排序 ... [详细]
  • 本文详细探讨了HTML表单中GET和POST请求的区别,包括它们的工作原理、数据传输方式、安全性及适用场景。同时,通过实例展示了如何在Servlet中处理这两种请求。 ... [详细]
  • 本文详细解析了Java中hashCode()和equals()方法的实现原理及其在哈希表结构中的应用,探讨了两者之间的关系及其实现时需要注意的问题。 ... [详细]
  • 本文详细探讨了JDBC(Java数据库连接)的内部机制,重点分析其作为服务提供者接口(SPI)框架的应用。通过类图和代码示例,展示了JDBC如何注册驱动程序、建立数据库连接以及执行SQL查询的过程。 ... [详细]
  • 本文探讨了在Java多线程环境下,如何确保具有相同key值的线程能够互斥执行并按顺序输出结果。通过优化代码结构和使用线程安全的数据结构,我们解决了线程同步问题,并实现了预期的并发行为。 ... [详细]
  • 数组元素逆序排列的实现
    本文介绍了一种简单有效的方法,用于将整数数组中的元素进行逆序排列。通过折半交换对应位置的元素,可以高效地完成这一任务。 ... [详细]
  • 本文介绍如何在Linux Mint系统上搭建Rust开发环境,包括安装IntelliJ IDEA、Rust工具链及必要的插件。通过详细步骤,帮助开发者快速上手。 ... [详细]
  • 深入解析Redis内存对象模型
    本文详细介绍了Redis内存对象模型的关键知识点,包括内存统计、内存分配、数据存储细节及优化策略。通过实际案例和专业分析,帮助读者全面理解Redis内存管理机制。 ... [详细]
  • 对象自省自省在计算机编程领域里,是指在运行时判断一个对象的类型和能力。dir能够返回一个列表,列举了一个对象所拥有的属性和方法。my_list[ ... [详细]
author-avatar
Resolve
愿你的生活,既有软肋又有盔甲!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有