gbase 8a使用了有效的智能索引技术。
智能索引是一种粗粒度索引,数据存储时每 65536 行数据打成一个 DataCell(简称 DC)包,每个数据包在加载数据时自动建立智能索引,包含统计信息,
在数据查询时不需要解包就能得到统计值,可进一步降低 I/O,对复杂查询的优化效果明显。如下图所示,左侧的“SmartIndex of Col 1”即在第一列数据
上,以各数据包(DC)为单位建立的智能索引。
1)表中的所有列自动建立智能索引,不需用户手工建立和维护;
2)智能索引本身占空间少(1%左右),不会造成数据膨胀;
3)智能索引建立速度快,智能索引基于数据包建立,不受已存在数据包的影响。
与传统数据库索引技术相比,智能索引建立在数据包上(粗粒度索引),并且每个字段均自动建有索引,而传统索引建立在每行数据上(细粒度索引),
因此访问智能索引要比访问传统索引需要更少的 I/O。同时,智能索引所占空间大约是数据的百分之一,而传统数据库索引则要占到数据的 20~ 50%。