热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

使用索引的误区之四:空值对索引的影响_sqlserver

使用索引的误区之四:空值对索引的影响我们首先做一些测试数据:SQLcreatetablet(xint,yint); h

使用索引的误区之四:空值对索引的影响
我们首先做一些测试数据:

SQL> create table t(x int, y int);

 

http://www.gaodaima.com/34747.html使用索引的误区之四:空值对索引的影响_sqlserver

Table created

 

请注意,这里我对表t做了一个唯一(联合)索引:

SQL> create unique index t_idx on t(x,y);

 

Index created

 

SQL> insert into t values(1,1);

 

1 row inserted

 

SQL> insert into t values(1,NULL);

 

1 row inserted

 

SQL> insert into t values(NULL,1);

 

1 row inserted

 

SQL> insert into t values(NULL,NULL);

 

1 row inserted

 

SQL> commit;

 

Commit complete

 

下面我们分析一下索引:

SQL> analyze index t_idx validate structure;

 

Index analyzed

 

SQL> select name,lf_rows from index_stats;

 

NAME                              LF_ROWS

—————————— ———-

T_IDX                                   3

 

SQL>

然后,我们就可以看到,当前的索引中仅仅保存了3行数据。

请注意,上面我们插入并提交了四行数据。

所以,这里就有一个结论:

oracle的索引不保存全部为空的行。

 

 

我们继续插入数据,现在再插入几行全部为空的行:

SQL> insert into t values(NULL,NULL);

 

1 row inserted

 

SQL> insert into t values(NULL,NULL);

 

1 row inserted

我们看到这样的插入,居然没有违反前面我们设定的唯一约束(unique on t(x,y)),

所以,这里我们又得出一个结论:

Oracle认为 NULL<>NULL ,进而 (NULL,NULL)<>(NULL,NULL)

换句话说,Oracle认为空值(NULL)不等于任何值,包括空值也不等于空值。

 

我们看到下面的插入会违反唯一约束(DEMO.T_IDX),这个很好理解了,因为它不是全部为空的值,即它不是(NULL,NULL),只有全部为空的行才被认为是不同的行:

SQL> insert into t values(1,null);

 

insert into t values(1,null)

 

ORA-00001: 违反唯一约束条件 (DEMO.T_IDX)

 

SQL> insert into t values(null,1);

 

insert into t values(null,1)

 

ORA-00001: 违反唯一约束条件 (DEMO.T_IDX)

 

SQL>

 

请看下面的例子:

SQL> select x,y,count(*) from t group by x,y;

 

    X        Y   COUNT(*)

—– ——– ———-

                        3

             1          1

    1                   1

    1        1          1

Executed in 0.03 seconds

 

SQL> select x,y,count(*) from t where x is null and y is null group by x,y;

 

   X       Y   COUNT(*)

—- ——- ———-

                      3

 

Executed in 0.01 seconds

 

SQL>

SQL> select x,y,count(*) from t group by x,y having count(*)>1;

 

     X                    Y   COUNT(*)

—— ——————– ———-

                                     3

 

Executed in 0.02 seconds

SQL>

可以看见,完全为空的行有三行,这里我们又可以得出一个结论:

oracle在group by子句中认为完全为空的行是相同的行

换句话说,在group by子句中,oracle认为(NULL,NULL)=(NULL,NULL)

 

 

 

下面的语句,使用了复合索引(x,y)的前导列,通常这样的查询是会使用索引的,我们看看下面的例子:

select * from t where x is null;

 

PLAN_TABLE_OUTPUT

——————————————————————————–

——————————————————————–

| Id  | Operation            |  Name       | Rows  | Bytes | Cost  |

——————————————————————–

|   0 | SELECT STATEMENT     |             |       |       |       |

|*  1 |  TABLE access FULL   | T           |       |       |       |

——————————————————————–

Predicate Information (identified by operation id):

—————————————————

   1 – filter(“T”.”X” IS NULL)

Note: rule based optimization

 

14 rows selected

 

Executed in 0.06 seconds

 

我们看到上面的查询并没有使用索引,那么对比一下不使用控制的情况:

对比一下下面的查询:

select * from t where x=1;

 

PLAN_TABLE_OUTPUT

——————————————————————————–

——————————————————————–

| Id  | Operation            |  Name       | Rows  | Bytes | Cost  |

——————————————————————–

|   0 | SELECT STATEMENT     |             |       |       |       |

|*  1 |  INDEX RANGE SCAN    | T_IDX       |       |       |       |

——————————————————————–

Predicate Information (identified by operation id):

—————————————————

   1 – access(“T”.”X”=1)

Note: rule based optimization

 

14 rows selected

 

Executed in 0.04 seconds

这个查询(where x=1)如我们所希望的那样使用了t_idx(x,y)复合索引,这里我们可以得出一个结论:

在使用IS NULL 和 IS NOT NULL条件的时候,Oracle不使用索引(因为Oracle的索引不存储空值,详细请参见前面的相关内容)

 

那么我们如何使用空值的比较条件呢?

首先,尽量不在前导列上使用空值,请看下面的例子:

select * from t where x=1 and y is null;

 

PLAN_TABLE_OUTPUT

——————————————————————————–

——————————————————————–

| Id  | Operation            |  Name       | Rows  | Bytes | Cost  |

——————————————————————–

|   0 | SELECT STATEMENT     |             |       |       |       |

|*  1 |  INDEX RANGE SCAN    | T_IDX       |       |       |       |

——————————————————————–

Predicate Information (identified by operation id):

—————————————————

   1 – access(“T”.”X”=1)

       filter(“T”.”Y” IS NULL)

Note: rule based optimization

 

15 rows selected

 

select * from t where x is null and y=1;

 

PLAN_TABLE_OUTPUT

——————————————————————————–

——————————————————————–

| Id  | Operation            |  Name       | Rows  | Bytes | Cost  |

——————————————————————–

|   0 | SELECT STATEMENT     |             |       |       |       |

|*  1 |  TABLE ACCESS FULL   | T           |       |       |       |

——————————————————————–

Predicate Information (identified by operation id):

—————————————————

   1 – filter(“T”.”Y”=1 AND “T”.”X” IS NULL)

Note: rule based optimization

 

14 rows selected

 

还有一个可以变通的方法,即我们在创建表的时候,为每个列都指定为非空约束(NOT NULL),并且在必要的列上使用default值,如:

SQL> create table lunar(

  2   c1 varchar2(10) default ’empty’

  3     constraint  c1_notnull not null,

  4   c2 number(10) default 0

  5     constraint c2_notnull not null,

  6   c3 date default to_date(‘20990101′,’yyyymmdd’)

  7     constraint c3_notnull not null);

 

表已创建。

 

已用时间:  00: 00: 00.00

SQL> insert into lunar(c1) values(‘first’);

 

已创建 1 行。

 

已用时间:  00: 00: 00.00

SQL> insert into lunar(c2) values(99);

 

已创建 1 行。

 

已用时间:  00: 00: 00.00

SQL> insert into lunar(c3) values(sysdate);

 

已创建 1 行。

 

已用时间:  00: 00: 00.00

SQL> insert into lunar(c1,c3) values(‘ok’,sysdate);

 

已创建 1 行。

 

已用时间:  00: 00: 00.00

SQL> insert into lunar(c2,c1) values(999,’hello’);

 

已创建 1 行。

 

已用时间:  00: 00: 00.00

SQL> commit;

 

提交完成。

 

已用时间:  00: 00: 00.00

SQL> select * from lunar;

 

C1                 C2 C3

———- ———- ———-

first               0 01-1月 -99

empty              99 01-1月 -99

empty               0 19-10月-04

ok                  0 19-10月-04

hello             999 01-1月 -99

 

已用时间:  00: 00: 00.00

SQL> select c1,c2,to_char(c3,’yyyy-mm-yy’) from lunar;

 

C1                 C2 TO_CHAR(C3

———- ———- ———-

first               0 2099-01-99

empty              99 2099-01-99

empty               0 2004-10-04

ok                  0 2004-10-04

hello             999 2099-01-99

 

已用时间:  00: 00: 00.00

SQL>

然后我们再像使用一般的列那样,使用他们,并且合理的为他们建立索引相信就可以很好的提高应用的查询效率。

欢迎大家阅读《使用索引的误区之四:空值对索引的影响_sqlserver》,跪求各位点评,若觉得好的话请收藏本文,by



推荐阅读
  • Explain如何助力SQL语句的优化及其分析方法
    本文介绍了Explain如何助力SQL语句的优化以及分析方法。Explain是一个数据库SQL语句的模拟器,通过对SQL语句的模拟返回一个性能分析表,从而帮助工程师了解程序运行缓慢的原因。文章还介绍了Explain运行方法以及如何分析Explain表格中各个字段的含义。MySQL 5.5开始支持Explain功能,但仅限于select语句,而MySQL 5.7逐渐支持对update、delete和insert语句的模拟和分析。 ... [详细]
  • 在Oracle11g以前版本中的的DataGuard物理备用数据库,可以以只读的方式打开数据库,但此时MediaRecovery利用日志进行数据同步的过 ... [详细]
  • 本文主要介绍关于数据库,sql,sqlserver的知识点,对【数据库——概述】和【数据库到底要怎么做】有兴趣的朋友可以看下由【用编程写诗】投稿的技术文章,希望该技术和经验能帮到你解决你所遇的数据库相 ... [详细]
  • Oracle将表t_uaer的字段ID设置为自增:(用序列sequence的方法来实现)----创建表Createtablet_user(Idnumber(6),use ... [详细]
  • 本文详细介绍了在ASP.NET中获取插入记录的ID的几种方法,包括使用SCOPE_IDENTITY()和IDENT_CURRENT()函数,以及通过ExecuteReader方法执行SQL语句获取ID的步骤。同时,还提供了使用这些方法的示例代码和注意事项。对于需要获取表中最后一个插入操作所产生的ID或马上使用刚插入的新记录ID的开发者来说,本文提供了一些有用的技巧和建议。 ... [详细]
  • 本文详细介绍了Spring的JdbcTemplate的使用方法,包括执行存储过程、存储函数的call()方法,执行任何SQL语句的execute()方法,单个更新和批量更新的update()和batchUpdate()方法,以及单查和列表查询的query()和queryForXXX()方法。提供了经过测试的API供使用。 ... [详细]
  • ALTERTABLE通过更改、添加、除去列和约束,或者通过启用或禁用约束和触发器来更改表的定义。语法ALTERTABLEtable{[ALTERCOLUMNcolu ... [详细]
  • 前景:当UI一个查询条件为多项选择,或录入多个条件的时候,比如查询所有名称里面包含以下动态条件,需要模糊查询里面每一项时比如是这样一个数组条件:newstring[]{兴业银行, ... [详细]
  • 本文介绍了iOS数据库Sqlite的SQL语句分类和常见约束关键字。SQL语句分为DDL、DML和DQL三种类型,其中DDL语句用于定义、删除和修改数据表,关键字包括create、drop和alter。常见约束关键字包括if not exists、if exists、primary key、autoincrement、not null和default。此外,还介绍了常见的数据库数据类型,包括integer、text和real。 ... [详细]
  • web.py开发web 第八章 Formalchemy 服务端验证方法
    本文介绍了在web.py开发中使用Formalchemy进行服务端表单数据验证的方法。以User表单为例,详细说明了对各字段的验证要求,包括必填、长度限制、唯一性等。同时介绍了如何自定义验证方法来实现验证唯一性和两个密码是否相等的功能。该文提供了相关代码示例。 ... [详细]
  • 本文介绍了一种轻巧方便的工具——集算器,通过使用集算器可以将文本日志变成结构化数据,然后可以使用SQL式查询。集算器利用集算语言的优点,将日志内容结构化为数据表结构,SPL支持直接对结构化的文件进行SQL查询,不再需要安装配置第三方数据库软件。本文还详细介绍了具体的实施过程。 ... [详细]
  • 合并列值-合并为一列问题需求:createtabletab(Aint,Bint,Cint)inserttabselect1,2,3unionallsel ... [详细]
  • 本文介绍了在使用Laravel和sqlsrv连接到SQL Server 2016时,如何在插入查询中使用输出子句,并返回所需的值。同时讨论了使用CreatedOn字段返回最近创建的行的解决方法以及使用Eloquent模型创建后,值正确插入数据库但没有返回uniqueidentifier字段的问题。最后给出了一个示例代码。 ... [详细]
  • 十大经典排序算法动图演示+Python实现
    本文介绍了十大经典排序算法的原理、演示和Python实现。排序算法分为内部排序和外部排序,常见的内部排序算法有插入排序、希尔排序、选择排序、冒泡排序、归并排序、快速排序、堆排序、基数排序等。文章还解释了时间复杂度和稳定性的概念,并提供了相关的名词解释。 ... [详细]
  • 【Mysql】九、Mysql高级篇 索引
    MYSQL索引一、什么是索引?二、索引数据结构1、mysql数据库的四种索引2、BTREE结构三、索引分类、创建索引、查看索引1、单值索引2、复合索引3、函数索引4、 ... [详细]
author-avatar
长沙祛疤--欣奕除疤_998
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有