如何解决hash冲突

作者：潘景洪Phant_255 | 来源：互联网 | 2021-12-12 09:49

上篇文章为什么哈希存取比较快？使用它需要付出什么代价只是简单介绍了使用hash所带来的利与弊。并未涉及hash的技术细节，本文则着重学习一下如何解决哈希编址的冲突问题。

1)冲突是如何产生的？

　　上文中谈到，哈希函数是指如何对关键字进行编址的规则，这里的关键字的范围很广，可视为无限集，如何保证无限集的原数据在编址的时候不会出现重复呢？规则本身无法实现这个目的。举一个例子，仍然用班级同学做比喻，现有如下同学数据
张三，李四，王五，赵刚，吴露.....
假如我们编址规则为取姓氏中姓的开头字母在字母表的相对位置作为地址，则会产生如下的哈希表

位置	字母	姓名
0	a
1	b
2	c

...

李四

...

王五，吴露

张三，赵刚

我们注意到，灰色背景标示的两行里面，关键字王五，吴露被编到了同一个位置，关键字张三，赵刚也被编到了同一个位置。老师再拿号来找张三，座位上有两个人，"你们俩谁是张三？"

2)如何解决冲突问题

既然不能避免冲突，那么如何解决冲突呢，显然需要附加的步骤。通过这些步骤，以制定更多的规则来管理关键字集合，通常的办法有:

a)开放地址法

开放地执法有一个公式:Hi=(H(key)+di) MOD m i=1,2,...,k(k<=m-1)
其中，m为哈希表的表长。di 是产生冲突的时候的增量序列。如果di值可能为1,2,3,...m-1，称线性探测再散列。
如果di取1，则每次冲突之后，向后移动1个位置.如果di取值可能为1,-1,2,-2,4,-4,9,-9,16,-16,...k*k,-k*k(k<=m/2)
称二次探测再散列。如果di取值可能为伪随机数列。称伪随机探测再散列。仍然以学生排号作为例子，
现有两名同学，李四，吴用。李四与吴用事先已排好序，现新来一名同学，名字叫王五，对它进行编制

10..	....	22	..	..	25
李四..	....	吴用	..	..	25

　　赵刚未来之前

10..	..	22	23	25
李四..		吴用	王五

　　(a)线性探测再散列对赵刚进行编址，且di=1

10...	20	22	..	25
李四..	王五	吴用

　　(b)二次探测再散列，且di=-2

1...	10...	22	..	25
王五..	李四..	吴用

　　(c)伪随机探测再散列,伪随机序列为:5,3,2

b)再哈希法

当发生冲突时，使用第二个、第三个、哈希函数计算地址，直到无冲突时。缺点：计算时间增加。
比如上面第一次按照姓首字母进行哈希，如果产生冲突可以按照姓字母首字母第二位进行哈希，再冲突，第三位，直到不冲突为止

c)链地址法

将所有关键字为同义词的记录存储在同一线性链表中。如下：

//img.jbzj.com/file_images/article/201606/2016616144625001.jpg

因此这种方法，可以近似的认为是筒子里面套筒子

d)建立一个公共溢出区

假设哈希函数的值域为[0,m-1],则设向量HashTable[0..m-1]为基本表，另外设立存储空间向量OverTable[0..v]用以存储发生冲突的记录。
经过以上方法，基本可以解决掉hash算法冲突的问题。

注:之所以会简单得介绍了hash，是为了更好的学习lzw算法，学习lzw算法是为了更好的研究gif文件结构，最后，我将详细的阐述一下gif文件是如何构成的，如何高效操作此种类型文件。

以上就是本文的全部内容，希望能给大家一个参考，也希望大家多多支持。

算法

推荐阅读

算法
SQL基础入门与数据库体系概述

本文介绍了数据库体系的基础知识，涵盖关系型数据库（如MySQL）和非关系型数据库（如MongoDB）的基本操作及高级功能。通过三个阶段的学习路径——基础、优化和部署，帮助读者全面掌握数据库的使用和管理。 ... [详细]

蜡笔小新 2024-12-22 19:17:15
机器人
智能车间调度研究进展

本文综述了基于强化学习的智能车间调度策略，探讨了车间调度问题在资源有限条件下的优化方法。通过数学规划、智能算法和强化学习等手段，解决了作业车间、流水车间和加工车间中的静态与动态调度挑战。重点讨论了不同场景下的求解方法及其应用前景。 ... [详细]

蜡笔小新 2024-12-22 19:02:54
算法
Memcached内存管理机制解析

本文深入探讨了Memcached的内存管理机制，特别是其采用的Slab Allocator技术。该技术通过预分配不同大小的内存块来有效解决内存碎片问题，并确保高效的数据存储与检索。文中详细描述了Slab Allocator的工作原理、内存分配流程以及相关的优化策略。 ... [详细]

蜡笔小新 2024-12-22 13:10:20
人工智能
华为智慧屏：超越屏幕尺寸的智能进化

继全球发布后，华为智慧屏于9月26日在上海正式亮相，推出65英寸和75英寸版本。该产品不仅在屏幕尺寸上有所突破，更在性能和智能化方面实现了显著提升。 ... [详细]

蜡笔小新 2024-12-22 12:40:05
算法
使用栈实现字符串中括号匹配的C++程序

本文介绍如何利用栈数据结构在C++中判断字符串中的括号是否匹配。通过顺序栈和链栈两种方式实现，并详细解释了算法的核心思想和具体实现步骤。 ... [详细]

蜡笔小新 2024-12-22 11:44:35
算法
Redux入门指南

本文介绍Redux的基本概念和工作原理，帮助初学者理解如何使用Redux管理应用程序的状态。Redux是一个用于JavaScript应用的状态管理库，特别适用于React项目。 ... [详细]

蜡笔小新 2024-12-22 10:04:31
算法
Mathematica 12.3.1 中英文版正式发布，附新功能介绍

历经三十年的开发，Mathematica 已成为技术计算领域的标杆，为全球的技术创新者、教育工作者、学生及其他用户提供了一个领先的计算平台。最新版本 Mathematica 12.3.1 增加了多项核心语言、数学计算、可视化和图形处理的新功能。 ... [详细]

蜡笔小新 2024-12-22 09:34:59
机器学习
机器学习核心概念与技术

本文系统梳理了机器学习的关键知识点，涵盖模型评估、正则化、线性模型、支持向量机、决策树及集成学习等内容，并深入探讨了各算法的原理和应用场景。 ... [详细]

蜡笔小新 2024-12-22 09:15:30
算法
如何用ping测试网络连接

如何使用Ping命令来测试网络连接？当网卡安装和有关参数配置完成后，可以使用ping命令来测试一下网络是否连接成功。以winXP为例1、打开XP下DOS窗口具体操作是点击“开始”菜 ... [详细]

蜡笔小新 2024-12-22 07:41:31
算法
提升代码可读性的关键要素

本文总结了优化代码可读性的核心原则与技巧，通过合理的变量命名、函数和对象的结构化组织，以及遵循一致性等方法，帮助开发者编写更易读、维护性更高的代码。 ... [详细]

蜡笔小新 2024-12-22 02:51:51
深度
深入解析Java虚拟机（JVM）架构与原理

本文旨在为读者提供对Java虚拟机（JVM）的全面理解，涵盖其主要组成部分、工作原理及其在不同平台上的实现。通过详细探讨JVM的结构和内部机制，帮助开发者更好地掌握Java编程的核心技术。 ... [详细]

蜡笔小新 2024-12-21 23:50:40
算法
Hive中日期与字符串互转的常用函数详解

本文详细介绍了Hive中用于日期和字符串相互转换的多种函数，包括从时间戳到日期格式的转换、日期到时间戳的转换，以及如何处理不同格式的日期字符串。通过这些函数，用户可以轻松实现日期和字符串之间的灵活转换，满足数据处理中的各种需求。 ... [详细]

蜡笔小新 2024-12-21 20:34:59
算法
SQL Server 相关

1.执行sqlsever存储过程，消息：SQLServer阻止了对组件“AdHocDistributedQueries”的STATEMENT“OpenRowsetOpenDatas ... [详细]

蜡笔小新 2024-12-21 20:05:21
算法
深入解析：Android 视频处理开源框架

本文将详细介绍多个流行的 Android 视频处理开源框架，包括 ijkplayer、FFmpeg、Vitamio、ExoPlayer 等。每个框架都有其独特的优势和应用场景，帮助开发者更高效地进行视频处理和播放。 ... [详细]

蜡笔小新 2024-12-21 19:49:35
算法
PHP编程笔记：深入理解if-elseif-else多条件分支结构

本文详细介绍了PHP中的多条件分支结构，包括if、elseif和else语句的使用方法。通过具体示例，解释了如何根据不同的条件执行相应的代码块，并确保每个条件只能触发一次。 ... [详细]

蜡笔小新 2024-12-21 19:44:20

潘景洪Phant_255

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章