热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

openGauss行存储核心架构及其页面组织详解

行存储的核心架构和页面组织是实现DML操作、可见性判断及多种管理功能的基础。作为基于磁盘的存储引擎,行存储在设计上采用了段页式结构,以优化数据的存储和访问效率。这种设计不仅确保了数据的高效存储,还为行存储的各种高级功能提供了坚实的技术支持。

行存储的Tuple结构以及页面组织,是行存储DML实现、可见性判断以及行存各种功能与管理机制的基石。

由于行存储是基于磁盘的存储引擎,因此在存储格式的设计中遵从段页式设计,存储结构需要以页面(page)作为单位,以方便与操作系统内核以及文件系统的接口进行交互。也是由于这个原因,页面的大小需要和目标系统中一个block(块)的大小对齐。在比较通用的linux内核中,页面大小默认一般为8192(8k)。一个基本的Heap(堆)页面如图9-3所示:

图9-3 Heap页面示意图

页面开头的位置为整个页面的头部信息,记录了这个页面的公用信息以及一些关键标识。

line_pointer被放置与Header后面,并向页面尾部扩展。line_pointer为指向tuple实际数据的一个指针,类似于sentinel(行指针)的作用。

这里需要一提的是,每个Tuple在系统中的唯一标识,ItemPointer,也被称为CTID,存储的是这一行所在的block number(即页面号)以及其对应的line_pointer的offset(即这个页面中第几个line_pointer)。这样由一个系统内记录的CTID,可以快速定位到这个Tuple的line_pointer,也就可以根据line_pointer的指针快速定位到Tuple的实际数据。

line_pointer的必要性也可以比较容易的总结出来。由于Tuple的数据内容本身可以是变长的,因此如果需要找到一个在页面中间的Tuple,则需要按序遍历页面结构;而line_pointer结构本身为定长,因此可以直接以常数的复杂度找到数据所在内存位置。Line_pointer sentinel的效果也十分明显:line_pointer的存在使得Tuple的对应改动局限于页面内部,而保持全局标识CTID不发生变化;如果没line_pointer,行更新需要连带更新的元信息、索引以及系统各处信息的复杂度就不言而喻了。

被line_pointer指向的行记录本身,则是从页面结尾开始向页面头部延展,这样避免的页面填充过程中可能出现的数据移动以及空间浪费。

页面头部的Header中储存了如下信息:

  1. Pd_lsn为最后一次改动此页面事务写下的WAL(系统中一般称为transaction log,简称xlog)的下一位,被xlog机制以及checkpoint机制所使用。
  2. Pd_checksum为页面中的checksum,为了检查页面的完整性和一致性使用。
  3. Pd_flags是此页面的标识位,可以让上层对此页面进行处理的接口快速识别此页面的一些特征,比如页面是否有空行/页面是否写满、页面是否已经对所有事务全部可见、页面是否被压缩等。
  4. Pd_lower和pd_upper是指向页面空闲空间起止的指针,即pd_lower指向下一个line_pointer的位置,而pd_upper指向下一个行记录数据填充的位置,这样既可以快速进行页面的填充修改,也可以方便计算页面的空闲空间。
  5. Pd_special指针用于记录一些特殊的存储管理方式以及接口所需的内存区域。
  6. pd_prune_xid记录上一次对此页面进行清理的xid。
  7. pd_xid_base以及pd_multi_base为这个页面上xid的base,即该页面上所有的记录的xid都由页面自身记录的xid(32位)与base(32位)计算得到,是64位xid的实现方式。

每个记录本身(上文Tuple的数据部分),则是数据库中最基本的数据存储单位,其自身的结构以及记录的信息也是系统中存储方式、DML、事务ACID的关键。如图9-4所示:

图9-4 数据部分结构

  1. Xmin是最初始的TransactionID(事务ID,简称XID),即插入此条记录的事务ID。
  2. Xmax是删除或更新此条记录的XID。如果此记录未被更改或删除,那么Xmax为0。
  3. T_cid记录的是command id,用于一个事务内部多步操作的一种记录与跟踪。
  4. T_ctid记录了此条记录的CTID值,或者是更新版本的CTID值。这个会在后面展开DML时讲到。
  5. 两个infomask是事务以及存储数据状态的标识位,用于快速判断。

Xmin、xmax两个事务ID、结合其transaction ID(事务ID)映射的Clog(提交日志)、CSN Log,一同构成了可见性判断的核心关键要素.


推荐阅读
  • 本文详细介绍了网络存储技术的基本概念、分类及应用场景。通过分析直连式存储(DAS)、网络附加存储(NAS)和存储区域网络(SAN)的特点,帮助读者理解不同存储方式的优势与局限性。 ... [详细]
  • Netflix利用Druid实现高效实时数据分析
    本文探讨了全球领先的在线娱乐公司Netflix如何通过采用Apache Druid,实现了高效的数据采集、处理和实时分析,从而显著提升了用户体验和业务决策的准确性。文章详细介绍了Netflix在系统架构、数据摄取、管理和查询方面的实践,并展示了Druid在大规模数据处理中的卓越性能。 ... [详细]
  • 本文详细介绍了如何通过RPM包在Linux系统(如CentOS)上安装MySQL 5.6。涵盖了检查现有安装、下载和安装RPM包、配置MySQL以及设置远程访问和开机自启动等步骤。 ... [详细]
  • 磁盘健康检查与维护
    在计算机系统运行过程中,硬件或电源故障可能会导致文件系统出现异常。为确保数据完整性和系统稳定性,定期进行磁盘健康检查至关重要。本文将详细介绍如何使用fsck和badblocks工具来检测和修复文件系统及硬盘扇区的潜在问题。 ... [详细]
  • 本文作者分享了在阿里巴巴获得实习offer的经历,包括五轮面试的详细内容和经验总结。其中四轮为技术面试,一轮为HR面试,涵盖了大量的Java技术和项目实践经验。 ... [详细]
  • 阿里云ecs怎么配置php环境,阿里云ecs配置选择 ... [详细]
  • 目录一、salt-job管理#job存放数据目录#缓存时间设置#Others二、returns模块配置job数据入库#配置returns返回值信息#mysql安全设置#创建模块相关 ... [详细]
  • 嵌入式开发环境搭建与文件传输指南
    本文详细介绍了如何为嵌入式应用开发搭建必要的软硬件环境,并提供了通过串口和网线两种方式将文件传输到开发板的具体步骤。适合Linux开发初学者参考。 ... [详细]
  • Java项目分层架构设计与实践
    本文探讨了Java项目中应用分层的最佳实践,不仅介绍了常见的三层架构(Controller、Service、DAO),还深入分析了各层的职责划分及优化建议。通过合理的分层设计,可以提高代码的可维护性、扩展性和团队协作效率。 ... [详细]
  • 本文详细介绍了如何在PHP中进行数组删除、清空等操作,并提供了在Visual Studio Code中创建PHP文件的步骤。 ... [详细]
  • 深入解析Serverless架构模式
    本文将详细介绍Serverless架构模式的核心概念、工作原理及其优势。通过对比传统架构,探讨Serverless如何简化应用开发与运维流程,并介绍当前主流的Serverless平台。 ... [详细]
  • PostgreSQL 最新动态 —— 2022年4月6日
    了解 PostgreSQL 社区的最新进展和技术分享 ... [详细]
  • 通常情况下,修改my.cnf配置文件后需要重启MySQL服务才能使新参数生效。然而,通过特定命令可以在不重启服务的情况下实现配置的即时更新。本文将详细介绍如何在线调整MySQL配置,并验证其有效性。 ... [详细]
  • 优化SQL Server批量数据插入存储过程的实现
    本文介绍了一种改进的SQL Server存储过程,用于生成批量插入语句。该方法不仅提高了性能,还支持单行和多行模式,适用于SQL Server 2005及以上版本。 ... [详细]
  • 对于许多初学者而言,遇到总线错误(bus error)或段错误(segmentation fault/core dump)是极其令人困扰的。本文详细探讨了这两种错误的成因、表现形式及解决方法,并提供了实用的调试技巧。 ... [详细]
author-avatar
手机用户2502859805
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有