python链表添加多个值_详解SkipList跳跃链表「含代码」

作者：时刻要有危机感01 | 来源：互联网 | 2023-07-01 12:32

今天继续介绍分布式系统当中常用的数据结构，今天要介绍的数据结构非常了不起，和之前介绍的布隆过滤器一样，是一个功能强大原理简单的数据结构。并

今天继续介绍分布式系统当中常用的数据结构&＃xff0c;今天要介绍的数据结构非常了不起&＃xff0c;和之前介绍的布隆过滤器一样&＃xff0c;是一个功能强大原理简单的数据结构。并且它的缺点和短板更少&＃xff0c;应用更加广泛&＃xff0c;比如广泛使用的Redis就有用到它。

SkipList简介

SkipList是一个实现快速查找、增删数据的数据结构&＃xff0c;可以做到 O(logN)复杂度的增删查。从时间复杂度上来看&＃xff0c;似乎和平衡树差不多&＃xff0c;但是和平衡树比较起来&＃xff0c;它的编码复杂度更低&＃xff0c;实现起来更加简单。学过数据结构的同学应该都有了解&＃xff0c;平衡树经常需要旋转操作来维护两边子树的平衡&＃xff0c;不仅编码复杂&＃xff0c;理解困难&＃xff0c;而且debug也非常不方便。SkipList克服了这些缺点&＃xff0c;原理简单&＃xff0c;实现起来也非常方便。

原理

SkipList的本质是List&＃xff0c;也就是链表。我们都知道&＃xff0c;链表是线性结构的&＃xff0c;每次只能移动一个节点&＃xff0c;这也是为什么链表获取元素和删除元素的复杂度都是 O(n)。

如果我们要优化这个问题&＃xff0c;可以在当中一般的节点上增加一个指针&＃xff0c;指向后面两个的元素。这样我们遍历的速度可以提升一倍&＃xff0c;最快就可以在 O(n/2)的时间内遍历完整个链表了。

同样的道理&＃xff0c;如果我们继续增加节点上指针的个数&＃xff0c;那么这个速度还可以进一步加快。理论上来说&＃xff0c;如果我们设置log n个指针&＃xff0c;完全可以在 log n的时间内完成元素的查找&＃xff0c;这也是SkipList的精髓。

但是有一个问题是我们光实现快速查找是不够的&＃xff0c;我们还需要保证元素的有序性&＃xff0c;否则查找也就无从谈起。但是元素添加的顺序并不一定是有序的&＃xff0c;我们怎么保证节点分配到的指针数量合理呢&＃xff1f;

为了解决这个问题&＃xff0c;SkipList引入了随机深度的机制&＃xff0c;也就是一个节点能够拥有的指针数量是随机的。同样这种策略来保证元素尽可能分散均匀&＃xff0c;使得不会发生数据倾斜的情况。

我觉得这个图放出来应该都能看懂&＃xff0c;可以把每一个节点想象成一栋小楼。每个节点的多个指针可以看成是小楼的各个楼层&＃xff0c;很显然&＃xff0c;由于所有的小楼都排成一排&＃xff0c;所以每栋楼的每一层都只能看到同样高度最近的一栋。

比如上图当中的2只有一层&＃xff0c;那么它只能看到最近的一楼也就是3的位置。4有三层&＃xff0c;它的第一层只能看到5&＃xff0c;但是第二和第三层可以看到6。6也有三层&＃xff0c;由于6之后没有节点有超过两层的&＃xff0c;所以它的第三层可以直接看到结尾。

由于每个节点的高度是随机的&＃xff0c;所以每个节点能看到的情况是分散的&＃xff0c;可以防止数据聚集不平均等问题&＃xff0c;从而可以保证运行效率。

实现Node

数据结构的原理我想大家都可以看懂&＃xff0c;但是想要上手实现的话会发现还是有些困难&＃xff0c;会有很多细节和边界问题。这是正常的&＃xff0c;我个人的经验是可以先从简单的部分开始写&＃xff0c;把困难的部分留到最后。随着进度的推进&＃xff0c;对于问题的理解和解决问题的能力都会提升&＃xff0c;这样受到的痛苦最小&＃xff0c;半途而废的可能性最低。

在接下来的内容当中&＃xff0c;我们也遵守这个原则&＃xff0c;从简单的部分开始说起。

定义节点结构

整个SkipList本质是一个链表&＃xff0c;既然是链表&＃xff0c;当然存在节点&＃xff0c;所以我们可以先从定义节点的结构开始。由于我们需要一个字段来查找&＃xff0c;一个字段存储结果&＃xff0c;所以显然key和value是必须的字段。另外就是每个节点会有一个指针列表&＃xff0c;记录可以指向的位置。于是这个Node类型的结构就出来了&＃xff1a;

可能会有同学看不明白方法上面的注解&＃xff0c;这里做一个简单的介绍。这是Python当中面向对象的规范&＃xff0c;因为Python不像C&＃43;&＃43;或者是Java做了public和private字段的区分&＃xff0c;在Python当中所有的字段都是public的。显然这是不安全的&＃xff0c;有时候我们并不希望调用方可以获取我们所有的信息。所以在Python当中&＃xff0c;大家规定变量名前面添加下划线表示private变量&＃xff0c;这样无论是调用方还是阅读代码的开发者&＃xff0c;都会知道这是一个private变量。

在Java当中&＃xff0c;我们默认会为需要用到的private变量提供public的get和set方法&＃xff0c;Python当中也是一样。不过Python当中提供了强大的注解器&＃xff0c;我们可以通过添加&＃64;property和&＃64;param.setter注解来简化代码的编写&＃xff0c;有了注解之后&＃xff0c;Python会自动将方法名和注解名映射起来。比如我们类内部定义的变量名是_key&＃xff0c;但是通过注解&＃xff0c;我们在类外部一样可以处通过node.key来调用&＃xff0c;Python的解释器会自动执行我们加了注解的方法。以及我们在为它赋值的时候&＃xff0c;也一样会调用对应的方法。

比如当我们运行: node.key &＃61; 3&＃xff0c;Python内部实际上是执行了node.key(3)。当然我们也可以不用注解自己写set和get&＃xff0c;这只是习惯问题&＃xff0c;并没有什么问题。

添加节点方法

我们定义完了Node结构之后并没有结束&＃xff0c;因为在这个问题当中我们需要访问节点第n个指针&＃xff0c;当然我们也可以和上面一样为_next添加注解&＃xff0c;然后通过注解和下标进行访问。但是这样毕竟比较麻烦&＃xff0c;尤其是我们还会涉及到节点是否是None&＃xff0c;以及是否能够看到tail的等等判断&＃xff0c;为了方便代码的编写&＃xff0c;我们可以将它们抽象成Node类的方法。

我们在Node类当中添加以下方法&＃xff1a;

这三个方法应该都不难看懂&＃xff0c;唯一有点问题的是query_key_by_depth这个方法&＃xff0c;在这个方法当中&＃xff0c;我们对不存在的情况范围了无穷大。这里返回无穷大的逻辑我们可以先放一放&＃xff0c;等到后面实现skiplist的部分就能明白。

把这三个方法添加上去之后&＃xff0c;我们Node类就实现好了&＃xff0c;就可以进行下面SkipList主体的编写了。

实现SkipList

接下来就到了重头戏了&＃xff0c;我们一样遵循先易后难的原则&＃xff0c;先来实现其中比较简单的部分。

首先我们来实现SkipList的构造函数&＃xff0c;以及随机生成节点深度的函数。关于节点深度&＃xff0c;SkipList当中会设计一个概率p。每次随机一个0-1的浮点值&＃xff0c;如果它大于p&＃xff0c;那么深度加一&＃xff0c;否则就返回当前深度&＃xff0c;为了防止极端情况深度爆炸&＃xff0c;我们也会设定一个最大深度。

在SkipList当中除了需要定义head节点之外&＃xff0c;还需要节点tail节点&＃xff0c;它表示链表的结尾。由于我们希望SkipList来实现快速查询&＃xff0c;所以SkipList当中的元素是有序的&＃xff0c;为了保证有序性&＃xff0c;我们把head的key设置成无穷小&＃xff0c;tail的key设置成无穷大。以及我们默认head的后向指针是满的&＃xff0c;全部指向tail。这些逻辑理清楚之后&＃xff0c;代码就不难了&＃xff1a;

到这里&＃xff0c;我们又往前迈进了一步&＃xff0c;距离最终实现只剩下增删查三个方法了。改和查的逻辑基本一致&＃xff0c;并且在这类数据结构当中&＃xff0c;一般不会实现修改&＃xff0c;因为修改可以通过删除和添加来代替&＃xff0c;并且对于大数据的场景而言&＃xff0c;也很少会出现修改。

query方法

这三个方法当中&＃xff0c;query是最简单的&＃xff0c;因为我们之前已经理解了查找的逻辑。是一个类似于贪心的算法&＃xff0c;说起来也很简单&＃xff0c;我们每次都尝试从最高的楼层往后看&＃xff0c;如果看到的数值小于当前查找的key&＃xff0c;那么就跳跃过去&＃xff0c;否则说明我们一下看得太远了&＃xff0c;我们应该看近一些&＃xff0c;于是往楼下走&＃xff0c;再重复上述过程。

比如上图当中&＃xff0c;假设我们要查找20&＃xff0c;首先我们在head的位置的最高点往后看&＃xff0c;直接看到了正无穷&＃xff0c;它是大于20的&＃xff0c;说明我们看太远了&＃xff0c;应该往下走一层。于是我们走到4层&＃xff0c;这次我们看到了17&＃xff0c;它是小于20的&＃xff0c;所以就移动过去。

移动到了17之后&＃xff0c;我们还是从4层开始看起&＃xff0c;然后发现每一层看到的元素都大于等于20&＃xff0c;那么说明17就是距离20最近的元素(有可能20不存在)。那么我们从17开始往后移动一格&＃xff0c;就是20可能出现的位置&＃xff0c;如果这个位置不是20&＃xff0c;那么说明20不存在。

这个逻辑应该很好理解&＃xff0c;结合我们之前Node当中添加的几个工具方法&＃xff0c;代码只有几行&＃xff1a;

delete方法

query方法实现了&＃xff0c;delete就不远了。因为我们要删除节点&＃xff0c;显然需要先找到节点&＃xff0c;所以我们可以复用查找的代码来找到待删除的节点可能存在的位置。

找到了位置并不是一删了之&＃xff0c;我们删除它可能会影响其他的元素。

还拿上图举个例子&＃xff0c;假设我们要删除掉25这个元素。那么会发生什么&＃xff1f;

对于25以后的元素其实并不会影响&＃xff0c;因为节点之后后向指针&＃xff0c;会影响的是指向25的这些节点&＃xff0c;在这个例子当中是17这个节点。由于25被删除&＃xff0c;17的指针需要穿过25的位置继续往后&＃xff0c;指向后面的元素&＃xff0c;也就是55和31 。

比较容易想明白的是如果我们找到这些指向25的指针&＃xff0c;它们修改之后的位置是比较容易确定的&＃xff0c;因为其实就是25这个元素指向的位置。但是这些指向25的元素怎么获取呢&＃xff1f;

如果光想似乎没有头绪&＃xff0c;但是结合一下图&＃xff0c;不难想明白&＃xff0c;还记得我们查找的时候&＃xff0c;每次都看得尽量远的贪心法吗&＃xff1f;我们每次发生”下楼“操作的元素不就是最近的一个能看到25的位置吗&＃xff1f;也就是说我们把查找过程中发生下楼的位置都记录下来即可。

想明白了&＃xff0c;代码也就呼之欲出&＃xff0c;和query的代码基本一样&＃xff0c;无非多了几行关于这点的处理。

insert 方法

最后是插入元素的insert方法了&＃xff0c;在insert之前&＃xff0c;我们也同样需要查找&＃xff0c;因为我们要将元素放到正确的位置。

如果这个位置已经有元素了&＃xff0c;那么我们直接修改它的value&＃xff0c;其实这就是修改操作了&＃xff0c;如果设计成禁止修改&＃xff0c;也可以返回失败。插入的过程同样会影响其他元素的指针指向的内容&＃xff0c;我们分析一下就会发现&＃xff0c;插入的过程和删除其实是相反的。删除的过程当中我们需要将指向x的指向x指向的位置&＃xff0c;而插入则是相反&＃xff0c;我们要把指向x后面的指针指向x&＃xff0c;并且也需要更新x指向的位置&＃xff0c;如果能理解delete&＃xff0c;那么理解insert其实是板上钉钉的。

我们直接来看代码&＃xff1a;

到这里&＃xff0c;整个代码就结束了。怎么说呢&＃xff0c;虽然它的原理不难理解&＃xff0c;但是代码写起来由于涉及到了指针的操作和运算&＃xff0c;所以还是挺麻烦的&＃xff0c;想要写对并且调试出来不容易。但相比于臭名昭著的各类平衡树而言&＃xff0c;已经算是非常简单的了。

SkipList在各类分布式系统和应用当中广泛使用&＃xff0c;算是非常重要的基础构建&＃xff0c;因此非常值得我们学习。并且我个人觉得&＃xff0c;这个数据结构非常巧妙&＃xff0c;无论是原理还是编码都很有意思&＃xff0c;希望大家也能喜欢。

今天的文章就是这些&＃xff0c;如果觉得有所收获&＃xff0c;请顺手点个关注或转发吧&＃xff0c;你们的举手之劳对我来说很重要。

推荐阅读

开发者
Python 的 10 个开发技巧！太实用了

1.如何在运行状态查看源代码？查看函数的源代码，我们通常会使用IDE来完成。比如在PyCharm中，你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢？当我们想使用一个函 ... [详细]

蜡笔小新 2024-12-27 18:36:54
开发者
数据库内核开发入门 | 搭建研发环境的初步指南

本课程将带你从零开始，逐步掌握数据库内核开发的基础知识和实践技能，重点介绍如何搭建OceanBase的开发环境。 ... [详细]

蜡笔小新 2024-12-27 16:38:48
foreach
Akka BackoffSupervisor的深入解析与实践

本文详细介绍了Akka中的BackoffSupervisor机制，探讨其在处理持久化失败和Actor重启时的应用。通过具体示例，展示了如何配置和使用BackoffSupervisor以实现更细粒度的异常处理。 ... [详细]

蜡笔小新 2024-12-27 15:04:09
foreach
Android 模拟用户交互：点击与滑动操作的实现

本文介绍如何在 Android 中通过代码模拟用户的点击和滑动操作，包括参数说明、事件生成及处理逻辑。详细解析了视图（View）对象、坐标偏移量以及不同类型的滑动方式。 ... [详细]

蜡笔小新 2024-12-28 12:12:22
post
深入解析Android自定义View面试题

本文探讨了Android Launcher开发中自定义View的重要性，并通过一道经典的面试题，帮助开发者更好地理解自定义View的实现细节。文章不仅涵盖了基础知识，还提供了实际操作建议。 ... [详细]

蜡笔小新 2024-12-28 11:15:04
const
深入理解org.neo4j.helpers.collection.Iterators.single()方法及其应用

本文详细介绍了Java中org.neo4j.helpers.collection.Iterators.single()方法的功能、使用场景及代码示例，帮助开发者更好地理解和应用该方法。 ... [详细]

蜡笔小新 2024-12-28 10:51:55
byte
优化ListView性能

本文深入探讨了如何通过多种技术手段优化ListView的性能，包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]

蜡笔小新 2024-12-28 10:36:30
install
Python配置文件读写指南

本文详细介绍如何使用Python进行配置文件的读写操作，涵盖常见的配置文件格式（如INI、JSON、TOML和YAML），并提供具体的代码示例。 ... [详细]

蜡笔小新 2024-12-28 08:39:55
object
解决Uploadify在IE浏览器中的兼容性问题

本文详细介绍了如何解决Uploadify插件在Internet Explorer（IE）9和10版本中遇到的点击失效及JQuery运行时错误问题。通过修改相关JavaScript代码，确保上传功能在不同浏览器环境中的一致性和稳定性。 ... [详细]

蜡笔小新 2024-12-27 22:07:40
object
导航栏样式练习：项目实例解析

本文详细介绍了如何创建一个具有动态效果的导航栏，包括HTML、CSS和JavaScript代码的实现，并附有详细的说明和效果图。 ... [详细]

蜡笔小新 2024-12-27 19:42:28
byte
词根词缀解析：greg、hap、helio及其他词源故事

本文基于刘洪波老师的《英文词根词缀精讲》，深入探讨了多个重要词根词缀的起源及其相关词汇，帮助读者更好地理解和记忆英语单词。 ... [详细]

蜡笔小新 2024-12-27 18:59:50
default
深入解析ExpandableComposite.addExpansionListener()方法及其应用

本文详细介绍了Java中org.eclipse.ui.forms.widgets.ExpandableComposite类的addExpansionListener()方法，并提供了多个实际代码示例，帮助开发者更好地理解和使用该方法。这些示例来源于多个知名开源项目，具有很高的参考价值。 ... [详细]

蜡笔小新 2024-12-27 16:11:49
const
深入解析Spring Cloud Ribbon负载均衡机制

本文详细介绍了Spring Cloud中的Ribbon组件如何实现服务调用的负载均衡。通过分析其工作原理、源码结构及配置方式，帮助读者理解Ribbon在分布式系统中的重要作用。 ... [详细]

蜡笔小新 2024-12-27 16:01:25
split
深入理解Python的os和sys模块

本文详细解析了Python中的os和sys模块，介绍了它们的功能、常用方法及其在实际编程中的应用。 ... [详细]

蜡笔小新 2024-12-26 22:04:19
split
掌握远程执行Linux脚本和命令的技巧

本文将详细介绍如何利用Python的Paramiko库实现远程执行Linux脚本和命令，帮助读者快速掌握这一实用技能。通过具体的示例和详尽的解释，让初学者也能轻松上手。 ... [详细]

蜡笔小新 2024-12-26 19:47:05

时刻要有危机感01

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章