热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

【Redis学习笔记】20180320压缩列表概念

作者:李乐顺风车运营研发团队压缩列表是列表键和哈希键的底层实现之一。当一个列表键只包含少量列表项,并且每个列表项要么是小整数,要么是长度较

作者:李乐 顺风车运营研发团队
压缩列表是列表键和哈希键的底层实现之一。

当一个列表键只包含少量列表项,并且每个列表项要么是小整数,要么是长度较短的字符串时,Redis就会使用压缩列表来作为列表键的底层实现;

当一个哈希键只包含少量键值对,并且每个键值对的键和值要么就是小整数值要么就是长度较短的字符串时,Redis就会使用压缩列表来作为哈希键的底层实现;

  1. 压缩列表结构(ziplist)

压缩列表是为了节约内存而开发的,其就是一个字节数组(char *);

而一个压缩列表可以包含任意多个节点(entry),每个节点可以保存一个字节数组或一个整数;

zlbytes:4字节,压缩列表的长度;因此压缩列表最大(2^32)-1字节;

zltail:4字节,尾节点偏移量;

zllen:2字节,压缩列表节点数目,其最大只能表示65535个节点;当压缩列表节点数目超过65535后,此字段无就没有任何意义了;

entryX:节点

zlend:压缩列表结尾标志,固定为0xFF;

假设char * zl指向压缩列表首地址;

注意:zl指针的类型为char*,因此通过zl获取相应字段时,首先需要强制类型转换;

zl指向zlbytes字段;((uint32_t) zl)取出zlbytes字段内容;

zl+4指向zltail字段;((uint32_t) (zl+4))取出zltail字段内容;

((uint32_t) (zl+4)) + zl (就是zl+zltail)指向最后一个节点首地址

zl+8指向zllen字段;((uint16_t) (zl+8))取出zllen字段内容;

zl + ((uint32_t) zl) (就是zl+zlbytes)指向zlend字段

  1. 节点(entry)结构

了解了压缩列表结构,我们可以很容易获得压缩列表空间大小,压缩列表拥有节点数目,压缩列表开始和结束位置指针;

那么如何遍历压缩列表的所有节点呢?

对于每一个entry节点,存储的可能是字节数组或整数值;

假设我们知道节点首地址指针,我们如何知道存储的是什么类型?对于字节数组,我们又如何知道字节数组的长度?

redis是对每一个entry是这样编码的:

2.1 首先回答上面一个问题:压缩列表如何遍历所有节点?

答案就在previous_entry_length字段,其表示前一个节点的长度(单位字节);

假如我知道当前节点的首地址为p,那么(p-previous_entry_length)就是前一个节点的首地址;通过这种方式实现了从尾到头的遍历;

previous_entry_length字段为1个或者5个字段(为了节约内存);

当前一个节点的长度小于254字节时,previous_entry_length字段用一个字段表示;

当前一个节点的长度大于等于254时,previous_entry_length字段用5个字节来表示;而这时候previous_entry_length的第一个字节是固定的标志0xFE,后面4个字节才真正表示前一个节点的长度;

假设当前节点首地址为p;p[0]为第一个字节内容;

当p[0]<0xFE时&#xff0c;说明previous_entry_length字段只占一个字节&#xff0c;p[0]就是前一个节点的长度&#xff1b;

当p[0]&#61;0xFE时&#xff0c;说明previous_entry_length字段占5个字节&#xff0c;p[1]~p[4]表示前一个节点的长度&#xff1b;而p&#43;5则只encoding字段首地址&#xff1b;

2.2 下面回答第二个问题&#xff1a;

如何区分当前节点存储数据是什么类型&#xff0c;字节数组还是整数&#xff1f;字节数组长度&#xff1f;

最简单的方法&#xff1a;使用1个比特表示数据是字节数组还是整数&#xff0c;假如是字节数组&#xff0c;再用7&#43;4*8表示字节数组的长度&#xff1b;

但是&#xff0c;redis为了节约内存并没有这么做&#xff1b;&#xff08;减少encoding字段长度&#xff09;

字节数组分为三种&#xff0c;最大长度63字节&#xff0c;最大长度(2^14)-1&#xff0c;最大长度(2^32)-1&#xff1b;

整数分为6种&#xff1a;8比特整数&#xff0c;24比特整数&#xff0c;int16&#xff0c;int32&#xff0c;int64&#xff0c;0~12立即数&#xff1b;

而具体的数据内容存储在content字段&#xff1b;

我们发现encoding第一个字节的前2比特可以区分是字节数组&#xff08;以及字节数组类型&#xff09;还是整数&#xff1b;

是整数时&#xff0c;第3、4比特可以区分整数的类型&#xff1b;当content的前4个比特都是1时&#xff0c;后4个比特才能区分整数类型&#xff1b;

假设encoding字段首地址为p&#xff1b;p[0]为第一个字节内容&#xff1b;

p[0] & 0xc0 可以获得前两个比特bit[1:2]&#xff0c;当其不等于11B时&#xff0c;说明content是字节数组&#xff1b;再根据其是00B、01B还是10B可以知道字节数组类型&#xff0c;从而取出字节数组实际长度&#xff1b;

整数类型的判断同理可得&#xff1b;

  1. 预备知识

2.1 大端小端

redis在存取压缩列表字段&#xff08;如zlbytes、zltail时&#xff0c;会进行大小端转换&#xff1b;如果是小端不做处理&#xff0c;如果是大端&#xff0c;会转换为小端字节顺序&#xff09;&#xff1b;

大小端转换其实就是交换字节顺序&#xff1b;

void memrev32(void *p) {unsigned char *x &#61; p, t;t &#61; x[0];x[0] &#61; x[3];x[3] &#61; t;t &#61; x[1];x[1] &#61; x[2];x[2] &#61; t;
}

问题&#xff1a;为什么在存取压缩列表字段时需要做大小端转换&#xff1f;

解答&#xff1a;redis集群&#xff0c;各机器的CPU架构可能不相同&#xff1b;有些机器是大端&#xff0c;有些机器是小端&#xff1b;假如不进行大小端转换&#xff0c;当压缩列表数据在集群中机器间传递时&#xff0c;不同机器解析情况会不相同。

  1. 连锁更新

如图&#xff0c;位置p处的节点为X&#xff1b;其previous_entry_length字段为1个字节&#xff0c;0x80&#xff0c;表明前一个节点长度为128&#xff1b;假设位置p之后的所有节点的长度为253字节&#xff1b;

现在往位置p新添加一个节点&#xff0c;其长度为1024字节&#xff1b;显然节点X的previous_entry_length需要改变为5个字节&#xff0c;那么此时节点X的长度为257字节&#xff1b;

节点X的长度从253改变为257字节&#xff1b;那么节点X的后驱节点的previous_entry_length也需要从一个字节改变为5个字节&#xff1b;

以此类推&#xff1b;因为在位置P新添加了一个节点&#xff0c;可能导致P后面得所有节点都需要依次更新previous_entry_length字段长度&#xff1b;

这就是连锁更新&#xff1b;他会导致N次内存分配&#xff0c;效率很低&#xff1b;

但是需要指出的是&#xff0c;这种情况出现的概率是很低的&#xff1b;而且一般情况下压缩列表存储的节点数目比较少&#xff1b;因此redis并没有对这种情况做特殊处理&#xff1b;



推荐阅读
  • C++字符字符串处理及字符集编码方案
    本文介绍了C++中字符字符串处理的问题,并详细解释了字符集编码方案,包括UNICODE、Windows apps采用的UTF-16编码、ASCII、SBCS和DBCS编码方案。同时说明了ANSI C标准和Windows中的字符/字符串数据类型实现。文章还提到了在编译时需要定义UNICODE宏以支持unicode编码,否则将使用windows code page编译。最后,给出了相关的头文件和数据类型定义。 ... [详细]
  • Redis底层数据结构之压缩列表的介绍及实现原理
    本文介绍了Redis底层数据结构之压缩列表的概念、实现原理以及使用场景。压缩列表是Redis为了节约内存而开发的一种顺序数据结构,由特殊编码的连续内存块组成。文章详细解释了压缩列表的构成和各个属性的含义,以及如何通过指针来计算表尾节点的地址。压缩列表适用于列表键和哈希键中只包含少量小整数值和短字符串的情况。通过使用压缩列表,可以有效减少内存占用,提升Redis的性能。 ... [详细]
  • 本文介绍了解决Netty拆包粘包问题的一种方法——使用特殊结束符。在通讯过程中,客户端和服务器协商定义一个特殊的分隔符号,只要没有发送分隔符号,就代表一条数据没有结束。文章还提供了服务端的示例代码。 ... [详细]
  • 计算机存储系统的层次结构及其优势
    本文介绍了计算机存储系统的层次结构,包括高速缓存、主存储器和辅助存储器三个层次。通过分层存储数据可以提高程序的执行效率。计算机存储系统的层次结构将各种不同存储容量、存取速度和价格的存储器有机组合成整体,形成可寻址存储空间比主存储器空间大得多的存储整体。由于辅助存储器容量大、价格低,使得整体存储系统的平均价格降低。同时,高速缓存的存取速度可以和CPU的工作速度相匹配,进一步提高程序执行效率。 ... [详细]
  • 先看官方文档TheJavaTutorialshavebeenwrittenforJDK8.Examplesandpracticesdescribedinthispagedontta ... [详细]
  • This article discusses the efficiency of using char str[] and char *str and whether there is any reason to prefer one over the other. It explains the difference between the two and provides an example to illustrate their usage. ... [详细]
  • 本文由编程笔记#小编整理,主要介绍了关于数论相关的知识,包括数论的算法和百度百科的链接。文章还介绍了欧几里得算法、辗转相除法、gcd、lcm和扩展欧几里得算法的使用方法。此外,文章还提到了数论在求解不定方程、模线性方程和乘法逆元方面的应用。摘要长度:184字。 ... [详细]
  • Java容器中的compareto方法排序原理解析
    本文从源码解析Java容器中的compareto方法的排序原理,讲解了在使用数组存储数据时的限制以及存储效率的问题。同时提到了Redis的五大数据结构和list、set等知识点,回忆了作者大学时代的Java学习经历。文章以作者做的思维导图作为目录,展示了整个讲解过程。 ... [详细]
  • Java在运行已编译完成的类时,是通过java虚拟机来装载和执行的,java虚拟机通过操作系统命令JAVA_HOMEbinjava–option来启 ... [详细]
  • Windows7 64位系统安装PLSQL Developer的步骤和注意事项
    本文介绍了在Windows7 64位系统上安装PLSQL Developer的步骤和注意事项。首先下载并安装PLSQL Developer,注意不要安装在默认目录下。然后下载Windows 32位的oracle instant client,并解压到指定路径。最后,按照自己的喜好对解压后的文件进行命名和压缩。 ... [详细]
  • 本文介绍了在处理不规则数据时如何使用Python自动提取文本中的时间日期,包括使用dateutil.parser模块统一日期字符串格式和使用datefinder模块提取日期。同时,还介绍了一段使用正则表达式的代码,可以支持中文日期和一些特殊的时间识别,例如'2012年12月12日'、'3小时前'、'在2012/12/13哈哈'等。 ... [详细]
  • 本文介绍了Swing组件的用法,重点讲解了图标接口的定义和创建方法。图标接口用来将图标与各种组件相关联,可以是简单的绘画或使用磁盘上的GIF格式图像。文章详细介绍了图标接口的属性和绘制方法,并给出了一个菱形图标的实现示例。该示例可以配置图标的尺寸、颜色和填充状态。 ... [详细]
  • 在Oracle11g以前版本中的的DataGuard物理备用数据库,可以以只读的方式打开数据库,但此时MediaRecovery利用日志进行数据同步的过 ... [详细]
  • 本文讨论了在VMWARE5.1的虚拟服务器Windows Server 2008R2上安装oracle 10g客户端时出现的问题,并提供了解决方法。错误日志显示了异常访问违例,通过分析日志中的问题帧,找到了解决问题的线索。文章详细介绍了解决方法,帮助读者顺利安装oracle 10g客户端。 ... [详细]
  • 合并列值-合并为一列问题需求:createtabletab(Aint,Bint,Cint)inserttabselect1,2,3unionallsel ... [详细]
author-avatar
mobiledu2502861463
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有