热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

openGauss行存储核心架构及其页面组织详解

行存储的核心架构和页面组织是实现DML操作、可见性判断及多种管理功能的基础。作为基于磁盘的存储引擎,行存储在设计上采用了段页式结构,以优化数据的存储和访问效率。这种设计不仅确保了数据的高效存储,还为行存储的各种高级功能提供了坚实的技术支持。

行存储的Tuple结构以及页面组织,是行存储DML实现、可见性判断以及行存各种功能与管理机制的基石。

由于行存储是基于磁盘的存储引擎,因此在存储格式的设计中遵从段页式设计,存储结构需要以页面(page)作为单位,以方便与操作系统内核以及文件系统的接口进行交互。也是由于这个原因,页面的大小需要和目标系统中一个block(块)的大小对齐。在比较通用的linux内核中,页面大小默认一般为8192(8k)。一个基本的Heap(堆)页面如图9-3所示:

图9-3 Heap页面示意图

页面开头的位置为整个页面的头部信息,记录了这个页面的公用信息以及一些关键标识。

line_pointer被放置与Header后面,并向页面尾部扩展。line_pointer为指向tuple实际数据的一个指针,类似于sentinel(行指针)的作用。

这里需要一提的是,每个Tuple在系统中的唯一标识,ItemPointer,也被称为CTID,存储的是这一行所在的block number(即页面号)以及其对应的line_pointer的offset(即这个页面中第几个line_pointer)。这样由一个系统内记录的CTID,可以快速定位到这个Tuple的line_pointer,也就可以根据line_pointer的指针快速定位到Tuple的实际数据。

line_pointer的必要性也可以比较容易的总结出来。由于Tuple的数据内容本身可以是变长的,因此如果需要找到一个在页面中间的Tuple,则需要按序遍历页面结构;而line_pointer结构本身为定长,因此可以直接以常数的复杂度找到数据所在内存位置。Line_pointer sentinel的效果也十分明显:line_pointer的存在使得Tuple的对应改动局限于页面内部,而保持全局标识CTID不发生变化;如果没line_pointer,行更新需要连带更新的元信息、索引以及系统各处信息的复杂度就不言而喻了。

被line_pointer指向的行记录本身,则是从页面结尾开始向页面头部延展,这样避免的页面填充过程中可能出现的数据移动以及空间浪费。

页面头部的Header中储存了如下信息:

  1. Pd_lsn为最后一次改动此页面事务写下的WAL(系统中一般称为transaction log,简称xlog)的下一位,被xlog机制以及checkpoint机制所使用。
  2. Pd_checksum为页面中的checksum,为了检查页面的完整性和一致性使用。
  3. Pd_flags是此页面的标识位,可以让上层对此页面进行处理的接口快速识别此页面的一些特征,比如页面是否有空行/页面是否写满、页面是否已经对所有事务全部可见、页面是否被压缩等。
  4. Pd_lower和pd_upper是指向页面空闲空间起止的指针,即pd_lower指向下一个line_pointer的位置,而pd_upper指向下一个行记录数据填充的位置,这样既可以快速进行页面的填充修改,也可以方便计算页面的空闲空间。
  5. Pd_special指针用于记录一些特殊的存储管理方式以及接口所需的内存区域。
  6. pd_prune_xid记录上一次对此页面进行清理的xid。
  7. pd_xid_base以及pd_multi_base为这个页面上xid的base,即该页面上所有的记录的xid都由页面自身记录的xid(32位)与base(32位)计算得到,是64位xid的实现方式。

每个记录本身(上文Tuple的数据部分),则是数据库中最基本的数据存储单位,其自身的结构以及记录的信息也是系统中存储方式、DML、事务ACID的关键。如图9-4所示:

图9-4 数据部分结构

  1. Xmin是最初始的TransactionID(事务ID,简称XID),即插入此条记录的事务ID。
  2. Xmax是删除或更新此条记录的XID。如果此记录未被更改或删除,那么Xmax为0。
  3. T_cid记录的是command id,用于一个事务内部多步操作的一种记录与跟踪。
  4. T_ctid记录了此条记录的CTID值,或者是更新版本的CTID值。这个会在后面展开DML时讲到。
  5. 两个infomask是事务以及存储数据状态的标识位,用于快速判断。

Xmin、xmax两个事务ID、结合其transaction ID(事务ID)映射的Clog(提交日志)、CSN Log,一同构成了可见性判断的核心关键要素.


推荐阅读
  • 本文详细介绍了MySQL InnoDB存储引擎中的Redo Log和Undo Log,探讨了它们的工作原理、存储方式及其在事务处理中的关键作用。 ... [详细]
  • 汇总了2023年7月7日最新的网络安全新闻和技术更新,包括最新的漏洞披露、工具发布及安全事件。 ... [详细]
  • 本文分享了作者在使用LaTeX过程中的几点心得,涵盖了从文档编辑、代码高亮、图形绘制到3D模型展示等多个方面的内容。适合希望深入了解LaTeX高级功能的用户。 ... [详细]
  • 【MySQL】frm文件解析
    官网说明:http:dev.mysql.comdocinternalsenfrm-file-format.htmlfrm是MySQL表结构定义文件,通常frm文件是不会损坏的,但是如果 ... [详细]
  • 本文介绍了MySQL窗口函数的基本概念、应用场景及常见函数的使用方法。窗口函数在处理复杂查询时非常有用,例如计算每个用户的订单排名、环比增长率、以及动态聚合等。 ... [详细]
  • Hibernate全自动全映射ORM框架,旨在消除sql,是一个持久层的ORM框架1)、基础概念DAO(DataAccessorOb ... [详细]
  • 本文探讨了Python类型注解使用率低下的原因,主要归结于历史背景和投资回报率(ROI)的考量。文章不仅分析了类型注解的实际效用,还回顾了Python类型注解的发展历程。 ... [详细]
  • 七大策略降低云上MySQL成本
    在全球经济放缓和通胀压力下,降低云环境中MySQL数据库的运行成本成为企业关注的重点。本文提供了一系列实用技巧,旨在帮助企业有效控制成本,同时保持高效运作。 ... [详细]
  • 一、使用Microsoft.Office.Interop.Excel.DLL需要安装Office代码如下:2publicstaticboolExportExcel(S ... [详细]
  • egg实现登录鉴权(七):权限管理
    权限管理包含三部分:访问页面的权限,操作功能的权限和获取数据权限。页面权限:登录用户所属角色的可访问页面的权限功能权限:登录用户所属角色的可访问页面的操作权限数据权限:登录用户所属 ... [详细]
  • 题目描述:Balala Power! 时间限制:4000/2000 MS (Java/Other) 内存限制:131072/131072 K (Java/Other)。题目背景及问题描述详见正文。 ... [详细]
  • Gradle 是 Android Studio 中默认的构建工具,了解其基本配置对于开发效率的提升至关重要。本文将详细介绍如何在 Gradle 中定义和使用共享变量,以确保项目的一致性和可维护性。 ... [详细]
  • 本文由chszs撰写,详细介绍了Apache Mina框架的核心开发流程及自定义协议处理方法。文章涵盖从创建IoService实例到协议编解码的具体步骤,适合希望深入了解Mina框架应用的开发者。 ... [详细]
  • 本文介绍了使用Python和C语言编写程序来计算一个给定数值的平方根的方法。通过迭代算法,我们能够精确地得到所需的结果。 ... [详细]
  • Asynchronous JavaScript and XML (AJAX) 的流行很大程度上得益于 Google 在其产品如 Google Suggest 和 Google Maps 中的应用。本文将深入探讨 AJAX 在 .NET 环境下的工作原理及其实现方法。 ... [详细]
author-avatar
手机用户2502859805
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有