当前位置: 开发笔记 > 数据库 > 正文

深入理解Sqlserver文件存储之页和应用-mysql教程

作者：江韦亭君733 | 来源：互联网 | 2017-05-12 15:45

我们每天都在使用数据库，我们部门使用最多的关系数据库有Sqlserver，Oracle，有没有想过这些数据库是怎么存放到操作系统的文件中的？有时候为了能够设计出最优的表结构，写出高性能的Sqlserver脚本，处理海量数据并发，我们必须解底层原理。由于个人

我们每天都在使用数据库，我们部门使用最多的关系数据库有 Sqlserver ， Oracle ，有没有想过这些数据库是怎么存放到操作系统的文件中的？有时候为了能够设计出最优的表结构，写出高性能的 Sqlserver 脚本，处理海量数据并发，我们必须解底层原理。由于个人

我们每天都在使用数据库，我们部门使用最多的关系数据库有Sqlserver，Oracle，有没有想过这些数据库是怎么存放到操作系统的文件中的？有时候为了能够设计出最优的表结构，写出高性能的Sqlserver脚本，处理海量数据并发，我们必须解底层原理。由于个人兴趣最近研究了下Sqlserver的文件存储，由于水平有限，下面只讲解Sqlserver的最小存储单元-页。

什么是页，区？

什么会有一个页的概念，我们知道对于操作系统来说，文件可以认为是一个很大的线性空间，如果按地址空间顺序分配容量（也就是按段式存储），则有可能会造成很多的外部碎片，造成很多的容量很难再次使用，只有移动合并空间才能腾出更多的空间。例如：如下表所有，如果我现在要申请1024B字节的空间，显然下面的两个空间空间单个计算不够，合起来却是够用的的，只能移动合并空间。

8KB	512B	12KB	512B	8KB
已分配空间	空闲	已分配空间	空闲	已分配空间

表1

为了能够更好的利用磁盘空间，Sqlserver借鉴了操作系统的虚拟内存的概念，人为的将文件划分N个8KB的存储空间，这样每次分配时，都是按照8KB空间申请，就解决了外部碎片的问题，也就是说Sqlserver 中数据存储的基本单位，页的大小为8KB，每页的开头是96字节的标头用于存储有关页的存储信息，其中有页码、页类型、页的可用空间以及拥有该页对象的分配单元ID。上述的例子分配就成为下表所示:这样就解决了外部碎片问题。

业内分配	8kB	12KB		8KB	xxKB
页单元	8KB	8KB	8KB	8KB	空闲

表2

为什么会有区的概念，已经有了页的单位难道不够吗？主要是为了更好的管理这些空间，Sqlserver将每8个页划分为一个区（如下表所示）就像百元大钞代表着100个10元人民币一样，出去买很多东西时，用百元大钞比用很多1元钱要方面。

一个分区
页1	页2	页3	页4	页5	页6	页7	页8

表3

为了有个页有更具体的认识，下表为页头的结构：

图-1

行是怎么在页中存储的？

那么数据库中的数据到底是以什么样的形式存储在数据中的呢？Sqlserver是以行为单位存储的数据，也就是说表中的每条数据（每行数据为一个块）顺序存放在页中的，那么怎么找到行？也就是一行的开始地址和结束地址? Sqlserver在每页的末尾以2个字节为单位存放了每行的开始地址，这样我们就可以定位到行的开始，通过下一条的开始位置能够知道本条记录的结束位置，这样我们就可以取出这行数据了。

图-2

如图所示，如果我想取第二条数据，那么现将一页数据都读到内存中，然后从最后读取偏移为第3开始开始读取2个字节，怎么可以找到行2的开始位置，同理可以读取出行2的结束位置。

列是怎么在页中的存储？

现在我们已经读取到行了并且已经在内存里了，接下来怎么解析出一行中的所有列？也就是这些列是怎么存放的？数据库表中的列无非就两种情况：定长列、变长列。

首先假设只有定长列，那么很容易想到一样中的每列的之顺序存放就行了，因为是定长的，完全可以将每列的偏移放到另外一个地方单独存储，如果要取某个特定的列，每个列的位置很容易定位:如下表所示:

2字节	3字节	6字节	10字节	3字节	2字节
1	23	55	A	C	D

表-4

如果要取红色的数据，那么它的

开始位置=（行开始位置）&＃43; 2字节&＃43;3字节&＃43;6字节&＃43;10字节。

结束位置= 开始位置 &＃43; 3字节。

其中每个列的长度完全可以用另一张表存放

列	1	2	3	4	5	6
长度（字节）	2	3	6	10	3	2

表-5

具体行结构的详细信息如下：

图-3

假如设计的表结构为 :

Col1	Col2	Col3	Col4
Char(5)(not null)	Int (null)	Char(3)(null)	Char(6)(not null)

表-6

在数据库中存放数据为:

Col1	Col2	Col3	Col4
‘ABCDE’	‘123’	‘null’	‘ccc ‘

表-7

则数据在数据库文件中数据以如下形式存在:

图-4

如果其中有变长列呢，这个结构又是怎么存储的？有变长列最大的不同就是每个列的长度是不定的（同一列，每行长度都不一样），也就是不能用另外一张表存放。那么我们只能把列的长度放在行内了。这样就解决了实际长度定位的问题，上面已经说过，sqlserver有一个行偏移矩阵。

如果我们定义的表结构如下：

Col1	Col2	Col3	Col4	Col5
Char(2)(not null)	Varchar(250)(not null)	Varchar(5)(null)	Varchar(20)(not null)	Small int (null)

表-8

假如这行数据为：

Col1	Col2	Col3	Col4	Col5
‘AAA’	RELICATE(‘X’,250)	null	‘ABC’	123

表-9

则数据在数据库中实际的存放形式为:

图-5

结论：

1.数据库列中尽量不用可空类型，当&＃20540;为空时，实际不占用位置，并且也不能作为索引的键&＃20540;。导致where语句中含有 is null 或者 is not null 时只能进行全表扫描，并且可空类型也容易导致空引用异常。

2．在设计列时，只有列长度确定的才用定长，比如身份证。其他情况基本上应该用varchar边长类型，不但节省空间的同时，一个页存放的数据会变多。导致同样的数据量读取页的次数变少，减少I/O，提高性能。

3.如图-1所示，聚簇索引不是按物理顺序存放的，是按逻辑物理顺序存放的（大多数人在这里会有误解。）

4.正常情况下不要使用varchar(max),因为这个列的数据肯定放不在一个页里，为了解决这个问题，sqlserver在列里只存放了一个指针。真正的数据放在了其他多个页里。每读取一行中的列都会至少多一次I/O，影响性能。

附注,参考资料：

(1) Microsoft SQL Server 2005技术内幕：存储引擎(中文)

(2)微软MSDN: http://msdn.microsoft.com/zh-cn/library/ms190969(v=sql.105).aspx

推荐阅读

sql
PostgreSQL 中批量更新多行记录的高效方法

本文介绍了如何使用 PostgreSQL 的 `UPDATE ... FROM` 语法，通过映射表实现对多行记录进行高效的批量更新。这种方法不仅适用于单列更新，还支持多列的同时更新。 ... [详细]

蜡笔小新 2024-12-28 12:51:58
sql
PHP 编程疑难解析与知识点汇总

本文详细解答了 PHP 编程中的常见问题，并提供了丰富的代码示例和解决方案，帮助开发者更好地理解和应用 PHP 知识。 ... [详细]

蜡笔小新 2024-12-28 12:22:34
sql
构建基于BERT的中文NL2SQL模型：一个简明的基准

本文探讨了将自然语言转换为SQL语句（NL2SQL）的任务，这是人工智能领域中一项非常实用的研究方向。文章介绍了笔者在公司举办的首届中文NL2SQL挑战赛中的实践，该比赛提供了金融和通用领域的表格数据，并标注了对应的自然语言与SQL语句对，旨在训练准确的NL2SQL模型。 ... [详细]

蜡笔小新 2024-12-27 17:36:19
sql
深入解析HTML中的标签及其应用场景

本文详细介绍了HTML中标签的使用方法和作用。通过具体示例，解释了如何利用标签为网页中的缩写和简称提供完整解释，并探讨了其在提高可读性和搜索引擎优化方面的优势。 ... [详细]

蜡笔小新 2024-12-27 17:05:37
sql
数据库内核开发入门 | 搭建研发环境的初步指南

本课程将带你从零开始，逐步掌握数据库内核开发的基础知识和实践技能，重点介绍如何搭建OceanBase的开发环境。 ... [详细]

蜡笔小新 2024-12-27 16:38:48
sql
MyBatis 动态 SQL 详解与应用

本文深入探讨 MyBatis 中动态 SQL 的使用方法，包括 if/where、trim 自定义字符串截取规则、choose 分支选择、封装查询和修改条件的 where/set 标签、批量处理的 foreach 标签以及内置参数和 bind 的用法。 ... [详细]

蜡笔小新 2024-12-27 16:20:10
sql
使用C#开发SQL Server存储过程的指南

本文介绍如何利用C#在SQL Server中创建存储过程，涵盖背景、步骤和应用场景，旨在帮助开发者更好地理解和应用这一技术。 ... [详细]

蜡笔小新 2024-12-27 14:24:17
sql
探索适用于Spring Boot的Web版SQL管理工具

本文探讨了适用于Spring Boot应用程序的Web版SQL管理工具，这些工具不仅支持H2数据库，还能够处理MySQL和Oracle等主流数据库的表结构修改。 ... [详细]

蜡笔小新 2024-12-27 14:21:10
sql
网站与MySQL数据库的连接与交互

本文详细介绍了如何通过多种编程语言（如PHP、JSP）实现网站与MySQL数据库的连接，包括创建数据库、表的基本操作，以及数据的读取和写入方法。 ... [详细]

蜡笔小新 2024-12-27 14:09:23
sql
MyBatis：深入解析与应用

在当前众多持久层框架中，MyBatis（前身为iBatis）凭借其轻量级、易用性和对SQL的直接支持，成为许多开发者的首选。本文将详细探讨MyBatis的核心概念、设计理念及其优势。 ... [详细]

蜡笔小新 2024-12-27 12:17:16
sql
DataGridView 保存时，为什么当前单元格的值无法保存？

在使用 DataGridView 时，如果在当前单元格中输入内容但光标未移开，点击保存按钮后，输入的内容可能无法保存。只有当光标离开单元格后，才能成功保存数据。本文将探讨如何通过调用 DataGridView 的内置方法解决此问题。 ... [详细]

蜡笔小新 2024-12-27 09:27:14
sql
在 Linux 系统中部署 PostgreSQL 数据库

本文详细介绍了如何在 Linux 平台上安装和配置 PostgreSQL 数据库。通过访问官方资源并遵循特定的操作步骤，用户可以在不同发行版（如 Ubuntu 和 Red Hat）上顺利完成 PostgreSQL 的安装。 ... [详细]

蜡笔小新 2024-12-27 03:46:27
sql
如何在PostgreSQL中查看数据表

本文将指导您使用pgAdmin工具连接到PostgreSQL数据库，并展示如何浏览和查找其中的数据表。通过简单的步骤，您可以轻松访问所需的表结构和数据。 ... [详细]

蜡笔小新 2024-12-26 19:55:24
sql
利用存储过程构建年度日历表的详细指南

本文将介绍如何使用SQL存储过程创建一个完整的年度日历表。通过实例演示，帮助读者掌握存储过程的应用技巧，并提供详细的代码解析和执行步骤。 ... [详细]

蜡笔小新 2024-12-26 18:20:17
sql
使用 SQLiteJDBC 和 HikariCP 实现 Java 程序连接 SQLite 数据库

本文介绍了如何通过 Maven 依赖引入 SQLiteJDBC 和 HikariCP 包，从而在 Java 应用中高效地连接和操作 SQLite 数据库。文章提供了详细的代码示例，并解释了每个步骤的实现细节。 ... [详细]

蜡笔小新 2024-12-26 17:34:42

江韦亭君733

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章