当前位置: 开发笔记 > 编程语言 > 正文

理解GiST索引的空间构造原理

作者：mengziwudao | 来源：互联网 | 2024-11-16 15:34

通过空间思维解析GiST索引的构建方式及其在空间数据检索中的应用。

作者

digoal

日期

2017-08-25

背景

GiST（Generalized Search Tree）索引是一种支持多种数据类型和操作符类的通用索引方法。本文探讨了GiST索引在空间数据检索中的具体实现和优化策略。

本文是对以下两篇文档的补充：

《Greenplum 空间(GIS)数据检索 B-Tree & GiST 索引实践 - 阿里云HybridDB for PostgreSQL最佳实践》
《PostGIS空间索引(GiST、BRIN、R-Tree)选择、优化 - 阿里云RDS PostgreSQL最佳实践》

GiST索引的构造

GiST索引可以通过空间思维来理解。例如，在数据规整方面，通过减少每个堆块（heap block）的边界框（bounding box）大小，并使不同堆块之间的边界更加清晰，可以提高空间数据检索的效率。

GiST索引采用R-Tree结构来实现这一点，使得在插入数据时，空间对象能够明确地分配到相应的索引分支。随着数据的不断写入，GiST索引可能会出现分裂（split）的情况。

GiST索引对写入性能的影响

以下是创建和插入大量空间数据时，GiST索引对写入性能的影响测试：

postgres=# create unlogged table test_gist (pos geometry);
CREATE TABLE
postgres=# create index idx_test_gist_1 on test_gist using gist (pos);
CREATE INDEX
postgres=# insert into test_gist select st_setsrid(st_makepoint(random()*360-180, random()*180-90), 4326) from generate_series(1,5000000);
INSERT 0 5000000
Time: 67127.758 ms
postgres=# drop index idx_test_gist_1 ;
DROP INDEX
Time: 1056.465 ms
postgres=# create index idx_test_gist_1 on test_gist using gist (pos);
CREATE INDEX
Time: 58945.677 ms

B-Tree索引对写入性能的影响

以下是创建和插入大量空间数据时，B-Tree索引对写入性能的影响测试：

postgres=# create unlogged table test_btree (pos geometry);
CREATE TABLE
postgres=# create index idx_test_btree_1 on test_btree using btree(st_geohash(pos,11));
CREATE INDEX
postgres=# insert into test_btree select st_setsrid(st_makepoint(random()*360-180, random()*180-90), 4326) from generate_series(1,5000000);
INSERT 0 5000000
Time: 30199.098 ms
postgres=# drop index idx_test_btree_1 ;
DROP INDEX
Time: 50.565 ms
postgres=# create index idx_test_btree_1 on test_btree using btree(st_geohash(pos,11));
CREATE INDEX
Time: 7746.942 ms

BRIN索引对写入性能的影响

以下是创建和插入大量空间数据时，BRIN索引对写入性能的影响测试：

postgres=# create unlogged table test_brin (pos geometry);
CREATE TABLE
postgres=# create index idx_test_brin_1 on test_brin using brin(pos);
CREATE INDEX
postgres=# insert into test_brin select st_setsrid(st_makepoint(random()*360-180, random()*180-90), 4326) from generate_series(1,5000000);
INSERT 0 5000000
Time: 7476.996 ms
postgres=# drop index idx_test_brin_1 ;
DROP INDEX
Time: 1.604 ms
postgres=# create index idx_test_brin_1 on test_brin using brin(pos);
CREATE INDEX
Time: 1697.741 ms

GiST索引的通用性

GiST不仅支持空间数据类型，还支持其他复杂的数据类型，如SP-GiST索引。这种通用性使其成为处理多种数据类型的强大工具。

小结

GiST索引直接构建在空间列上，对性能影响较大。B-Tree索引通过表达式（st_geohash）构建，对性能影响较小。BRIN索引直接构建在空间列上，对性能影响最小。

参考

《Greenplum 空间(GIS)数据检索 B-Tree & GiST 索引实践 - 阿里云HybridDB for PostgreSQL最佳实践》
《PostGIS空间索引(GiST、BRIN、R-Tree)选择、优化 - 阿里云RDS PostgreSQL最佳实践》
Flexible Indexing with Postgres

PostgreSQL 许愿链接

您的愿望将传达给PG内核开发者、数据库厂商等，帮助提高数据库产品的质量和功能。针对非常好的提议，将提供限量版PG文化衫、纪念品、贴纸、PG热门书籍等奖励。快来许愿吧！

9.9元购买3个月阿里云RDS PostgreSQL实例

PostgreSQL 解决方案集合

德哥 / digoal's github - 公益是一辈子的事.

digoal's wechat

推荐阅读

int
sqlserver动态分区方案例子

sqlserver动态分区方案例子当我们存储的数据量比较大时，比如超过千万，上亿级别时单纯的使用索引可能效果不明显了，此时我们可以考虑采 ... [详细]

蜡笔小新 2024-12-16 13:29:29
int
Canvas漫游：碰撞检测与动画模拟

探索Canvas在Web开发中的应用，通过碰撞检测与动画模拟提升交互体验。 ... [详细]

蜡笔小新 2024-12-16 13:18:51
jsp
二维码的实现与应用

本文介绍了二维码的基本概念、分类及其优缺点，并详细描述了如何使用Java编程语言结合第三方库（如ZXing和qrcode.jar）来实现二维码的生成与解析。 ... [详细]

蜡笔小新 2024-11-21 17:10:15
int
C语言字符型数据与ASCII码表

1、字符型常量字符型常量指单个字符，是用一对单引号及其所括起来的字符表示。例如：‘A’、‘a’、‘0’、’$‘等都是字符型常量。C语言的字符使用的就是 ... [详细]

蜡笔小新 2024-12-18 19:01:19
int
Java集合框架详解：Collection体系、Comparable与Comparator区别及底层数据结构分析

本文详细介绍了Java集合框架中的Collection体系，包括集合的基本概念及其与数组的区别。同时，深入探讨了Comparable和Comparator接口的区别，并分析了各种集合类的底层数据结构。最后，提供了如何根据需求选择合适的集合类的指导。 ... [详细]

蜡笔小新 2024-12-18 18:29:09
jsp
MySQL锁机制详解

本文深入探讨了MySQL中的锁机制，包括表级锁、行级锁以及元数据锁，通过实例详细解释了各种锁的工作原理及其应用场景。同时，文章还介绍了如何通过锁来优化数据库性能，避免常见的并发问题。 ... [详细]

蜡笔小新 2024-12-18 14:24:14
int
管理类联考英语复习指南：基础语法（八）

本文探讨了谓语动词和分词在句子中的作用，包括分词作为状语、定语和宾语补足语的使用方法，以及分词的时态和语态变化。 ... [详细]

蜡笔小新 2024-12-18 11:35:57
int
SQL技巧：批量删除用户自定义表和存储过程

当面临数据库清理任务时，若无删除或重建数据库的权限，可以通过编写SQL脚本来实现批量删除用户自定义的数据表和存储过程。本文将详细介绍如何构造这样的SQL脚本。 ... [详细]

蜡笔小新 2024-12-17 13:24:06
less
UVa11212 紫书例题710：编辑书稿的IDA*算法实现

本文介绍了一道来自《紫书》的编程题目——UVa11212 编辑书稿。该问题通过迭代加深搜索（IDA*）算法解决，旨在找到将给定排列转换为升序排列所需的最少步骤。文章提供了详细的解题思路和代码实现。 ... [详细]

蜡笔小新 2024-12-16 17:28:35
int
详解 | 日志系统ViseLog的基本使用与功能

本文详细介绍了日志系统ViseLog的使用方法及其核心功能，旨在帮助开发者更好地理解和利用这一工具，提高开发效率。 ... [详细]

蜡笔小新 2024-12-16 09:12:55
instance
MySQL架构在大规模应用中的进化路径

本文探讨了随着并发需求的增长，MySQL数据库架构如何从简单的单一实例发展到复杂的分布式系统，以及每一步演进背后的原理和技术解决方案。 ... [详细]

蜡笔小新 2024-12-16 09:00:35
merge
Freemarker NodeModel 类中的 removeComments 方法详解与实例

本文详细介绍了 Java 中 freemarker.ext.dom.NodeModel 类的 removeComments 方法，并提供了多个实际使用的代码示例，帮助开发者更好地理解和应用该方法。 ... [详细]

蜡笔小新 2024-12-15 12:21:59
int
树形动态规划解决树切割问题（CodeForces 1118F2）

题目概述：给定一棵带颜色节点的树，目标是找到一种方法，通过删除某些边使得每个连通分量内的节点颜色相同。需要计算出所有可能的合法边集的数量。使用动态规划的方法，特别是树形DP来解决问题。 ... [详细]

蜡笔小新 2024-12-14 13:06:17
int
Gradle复合构建详解

自Gradle 3.3起，复合构建功能得以实现，这是一种能够整合其他独立构建的高级构建模式。本文将详细介绍复合构建与多项目构建的区别，以及如何在实际项目中应用复合构建。 ... [详细]

蜡笔小新 2024-12-14 12:48:59
search
算法与数据结构基础概览

本文概述了算法的基础概念，包括时间复杂度的计算规则，以及常见的递归算法的时间复杂度分析。同时，详细介绍了数组和链表的基本特性及其操作的时间复杂度，并提供了几个关于链表操作的具体示例。最后，探讨了栈和队列的概念及其应用，包括如何利用这些数据结构解决实际问题。 ... [详细]

蜡笔小新 2024-12-13 13:02:01

mengziwudao

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章