当前位置: 开发笔记 > 数据库 > 正文

SQLServer笔记//20111027

作者：夜半MM | 来源：互联网 | 2017-05-12 15:44

SqlServer会有以下方法来查找您需要的数据记录：1.【TableScan】：遍历整个表，查找所匹配的记录行。这个操作将会一行一行的检查，当然，效率也是最差的。2.【IndexScan】：根据索引，从表中过滤出来一部分记录，再查找所匹配的记录行，显示比第一种

Sql Server 会有以下方法来查找您需要的数据记录： 1. 【Table Scan】：遍历整个表，查找所匹配的记录行。这个操作将会一行一行的检查，当然，效率也是最差的。 2. 【Index Scan】：根据索引，从表中过滤出来一部分记录，再查找所匹配的记录行，显示比第一种

Sql Server 会有以下方法来查找您需要的数据记录：
1. 【Table Scan】：遍历整个表，查找所匹配的记录行。这个操作将会一行一行的检查，当然，效率也是最差的。
2. 【Index Scan】：根据索引，从表中过滤出来一部分记录，再查找所匹配的记录行，显示比第一种方式的查找范围要小，因此比【Table Scan】要快。
3. 【Index Seek】：根据索引，定位（获取）记录的存放位置，然后取得记录，因此，比起前二种方式会更快。
4. 【Clustered Index Scan】：和【Table Scan】一样。注意：不要以为这里有个Index，就认为不一样了。其实它的意思是说：按聚集索引来逐行扫描每一行记录，因为记录就是按聚集索引来顺序存放的。而【Table Scan】只是说：要扫描的表没有聚集索引而已，因此这二个操作本质上也是一样的。
5. 【Clustered Index Seek】：直接根据聚集索引获取记录，最快！

在Sql Server中，我们每个join命令，都会在内部执行时，采用三种更具体的方式来运行：

1. 【Nested Loops join】，如果一个联接输入很小，而另一个联接输入很大而且已在其联接列上创建了索引，则索引 Nested Loops 连接是最快的联接操作，因为它们需要的 I/O 和比较都最少。

嵌套循环联接也称为“嵌套迭代”，它将一个联接输入用作外部输入表（显示为图形执行计划中的顶端输入），将另一个联接输入用作内部（底端）输入表。外部循环逐行处理外部输入表。内部循环会针对每个外部行执行，在内部输入表中搜索匹配行。可以用下面的伪码来理解：

foreach(row r1 in outer table)
    foreach(row r2 in inner table)
        if( r1, r2 符合匹配条件 )
            output(r1, r2);

最简单的情况是，搜索时扫描整个表或索引；这称为“单纯嵌套循环联接”。如果搜索时使用索引，则称为“索引嵌套循环联接”。如果将索引生成为查询计划的一部分（并在查询完成后立即将索引破坏），则称为“临时索引嵌套循环联接”。查询优化器考虑了所有这些不同情况。

如果外部输入较小而内部输入较大且预先创建了索引，则嵌套循环联接尤其有效。在许多小事务中（如那些只影响较小的一组行的事务），索引嵌套循环联接优于合并联接和哈希联接。但在大型查询中，嵌套循环联接通常不是最佳选择。

2. 【Merge Join】，如果两个联接输入并不小但已在二者联接列上排序（例如，如果它们是通过扫描已排序的索引获得的），则合并联接是最快的联接操作。如果两个联接输入都很大，而且这两个输入的大小差不多，则预先排序的合并联接提供的性能与哈希联接相近。但是，如果这两个输入的大小相差很大，则哈希联接操作通常快得多。

合并联接要求两个输入都在合并列上排序，而合并列由联接谓词的等效 (ON) 子句定义。通常，查询优化器扫描索引（如果在适当的一组列上存在索引），或在合并联接的下面放一个排序运算符。在极少数情况下，虽然可能有多个等效子句，但只用其中一些可用的等效子句获得合并列。

由于每个输入都已排序，因此 Merge Join 运算符将从每个输入获取一行并将其进行比较。例如，对于内联接操作，如果行相等则返回。如果行不相等，则废弃值较小的行并从该输入获得另一行。这一过程将重复进行，直到处理完所有的行为止。

合并联接操作可以是常规操作，也可以是多对多操作。多对多合并联接使用临时表存储行（会影响效率）。如果每个输入中有重复值，则在处理其中一个输入中的每个重复项时，另一个输入必须重绕到重复项的开始位置。可以创建唯一索引告诉SqlServer不会有重复值。

如果存在驻留谓词，则所有满足合并谓词的行都将对该驻留谓词取值，而只返回那些满足该驻留谓词的行。

合并联接本身的速度很快，但如果需要排序操作，选择合并联接就会非常费时。然而，如果数据量很大且能够从现有 B 树索引中获得预排序的所需数据，则合并联接通常是最快的可用联接算法。

3. 【Hash Join】，哈希联接可以有效处理未排序的大型非索引输入。它们对复杂查询的中间结果很有用，因为： 1. 中间结果未经索引（除非已经显式保存到磁盘上然后创建索引），而且通常不为查询计划中的下一个操作进行适当的排序。 2. 查询优化器只估计中间结果的大小。由于对于复杂查询，估计可能有很大的误差，因此如果中间结果比预期的大得多，则处理中间结果的算法不仅必须有效而且必须适度弱化。

哈希联接可以减少使用非规范化。非规范化一般通过减少联接操作获得更好的性能，尽管这样做有冗余之险（如不一致的更新）。哈希联接则减少使用非规范化的需要。哈希联接使垂直分区（用单独的文件或索引代表单个表中的几组列）得以成为物理数据库设计的可行选项。

哈希联接有两种输入：生成输入和探测输入。查询优化器指派这些角色，使两个输入中较小的那个作为生成输入。

哈希联接用于多种设置匹配操作：内部联接；左外部联接、右外部联接和完全外部联接；左半联接和右半联接；交集；联合和差异。此外，哈希联接的某种变形可以进行重复删除和分组，例如 SUM(salary) GROUP BY department。这些修改对生成和探测角色只使用一个输入。

哈希联接又分为3个类型：内存中的哈希联接、Grace 哈希联接和递归哈希联接。

内存中的哈希联接：哈希联接先扫描或计算整个生成输入，然后在内存中生成哈希表。根据计算得出的哈希键的哈希值，将每行插入哈希存储桶。如果整个生成输入小于可用内存，则可以将所有行都插入哈希表中。生成阶段之后是探测阶段。一次一行地对整个探测输入进行扫描或计算，并为每个探测行计算哈希键的值，扫描相应的哈希存储桶并生成匹配项。

Grace 哈希联接：如果生成输入大于内存，哈希联接将分为几步进行。这称为“Grace 哈希联接”。每一步都分为生成阶段和探测阶段。首先，消耗整个生成和探测输入并将其分区（使用哈希键上的哈希函数）为多个文件。对哈希键使用哈希函数可以保证任意两个联接记录一定位于相同的文件对中。因此，联接两个大输入的任务简化为相同任务的多个较小的实例。然后将哈希联接应用于每对分区文件。

递归哈希联接：如果生成输入非常大，以至于标准外部合并的输入需要多个合并级别，则需要多个分区步骤和多个分区级别。如果只有某些分区较大，则只需对那些分区使用附加的分区步骤。为了使所有分区步骤尽可能快，将使用大的异步 I/O 操作以便单个线程就能使多个磁盘驱动器繁忙工作。

在优化过程中不能始终确定使用哪种哈希联接。因此，SQL Server 开始时使用内存中的哈希联接，然后根据生成输入的大小逐渐转换到 Grace 哈希联接和递归哈希联接。
如果优化器错误地预计两个输入中哪个较小并由此确定哪个作为生成输入，生成角色和探测角色将动态反转。哈希联接确保使用较小的溢出文件作为生成输入。这一技术称为“角色反转”。至少一个文件溢出到磁盘后，哈希联接中才会发生角色反转。

说明：您也可以显式的指定联接方式，SqlServer会尽量尊重您的选择。比如你可以这样写：inner loop join, left outer merge join, inner hash join
但是，我还是建议您不要这样做，因为SqlServer的选择基本上都是正确的，不信您可以试一下。

我们再次回到【SQL Server Management Studio】，输入以下语句，然后执行。

set statistics profile on 

select v.OrderID, v.CustomerID, v.CustomerName, v.OrderDate, v.SumMoney, v.Finished
from   OrdersView as v
where v.OrderDate >= '2010-12-1' and v.OrderDate <'2011-12-1';

注意：现在加了一句，【set statistics profile on 】，得到的结果如下：

sql
算法

推荐阅读

sql
大数据SQL优化：全面解析数据倾斜解决方案

本文深入探讨了大数据SQL优化中的数据倾斜问题，提供了多种解决策略和实际案例，旨在帮助读者理解和应对这一常见挑战。 ... [详细]

蜡笔小新 2024-11-29 13:37:00
sql
远程访问用户 Kindle通过电子书实现控制

介绍自2007年以来，亚马逊已售出数千万台Kindle，令人印象深刻。但这也意味着数以千万计的人可能会因为这些Kindle中的软件漏洞而被黑客入侵。他 ... [详细]

蜡笔小新 2024-11-29 07:58:24
sql
SQL Server 中更新操作的处理机制探讨

当尝试更新的值与数据库中已存在的值相同时，SQL Server 是否会执行实际的更新操作？本文将通过具体示例和分析，探讨这一问题，并提供详细的解答。 ... [详细]

蜡笔小新 2024-11-29 18:38:38
数据库
深入理解Redis集群机制

本文旨在深入探讨Redis集群的工作原理，包括其架构设计、数据分布策略、节点通信及故障恢复机制等方面的内容。 ... [详细]

蜡笔小新 2024-11-29 17:18:38
数据库
算法学习笔记：归并排序与逆序数计算优化

本文探讨了归并排序算法在求解逆序数问题中的应用，并对比分析了两种实现方法。第一种方法使用指针和动态数组，存在内存管理上的风险；而第二种方法通过引入临时数组简化了实现过程，提高了代码的健壮性和可读性。 ... [详细]

蜡笔小新 2024-11-29 13:57:24
数据库
深入解析Hcash的PoW+PoS混合共识机制优势

本文探讨了Hcash项目如何通过结合工作量证明(PoW)和权益证明(PoS)两种共识机制，有效解决了单一机制下的诸多问题，如资源浪费、决策集中及安全风险等，实现了更广泛的社区参与和更高的安全性。 ... [详细]

蜡笔小新 2024-11-29 13:43:36
数据库
ANSI最全介绍linux终端字体改变颜色等

ANSI最全介绍linux终端字体改变颜色等ANSI转义序列维基百科，自由的百科全书由于国内不能访问wiki而且国内关于ANSI的介绍都是简短的不能达到，不够完整所以转wiki到此 ... [详细]

蜡笔小新 2024-11-29 12:47:14
数据库
JavaScript String 类型及常用方法详解

本文深入探讨 JavaScript 中的 String 类型及其常见操作方法，包括字符串的创建、转换以及一些常用的字符串处理函数。 ... [详细]

蜡笔小新 2024-11-29 12:06:14
数据库
多语言环境下的Thrift服务性能评测与示例

本文探讨了Thrift作为一款支持多语言的服务开发框架，其在体积、功能、扩展性以及多协议支持等方面的显著优势。特别地，Thrift作为一种RPC（远程过程调用协议）框架，非常适合用于构建可扩展且低耦合的分布式服务系统。文章通过多种编程语言对Thrift服务进行了性能测试，并提供了详细的测试结果。 ... [详细]

蜡笔小新 2024-11-29 10:44:30
数据库
在Mac上安装Python第三方库的方法

通过学习《Think Python》，我对Python编程有了初步了解，但在使用第三方库方面仍感到陌生。近期因百度空间即将关闭，我打算利用Evi1m0提供的Python爬虫代码备份个人网站，过程中遇到了第三方库安装的问题。 ... [详细]

蜡笔小新 2024-11-29 10:08:32
数据库
运用DDD分层架构优化微服务代码设计

在微服务实施过程中，确定合理的代码结构至关重要。本文探讨了如何利用领域驱动设计（DDD）的分层架构来优化微服务的代码模型，确保系统的可维护性和扩展性。 ... [详细]

蜡笔小新 2024-11-29 01:22:32
数据库
快速排序算法详解及Java实现

本文详细介绍了快速排序算法的工作原理和实现步骤，包括选择基准值、分区过程以及递归调用等关键环节。通过具体的Java代码示例，帮助读者更好地理解和掌握这一高效的排序算法。 ... [详细]

蜡笔小新 2024-11-28 18:26:54
数据库
Android实用方法汇总

本文总结了几个常用的Android开发技巧，包括检测设备上是否安装特定应用、获取应用的版本名称、设置状态栏透明以及如何从一个应用跳转至另一个应用的方法。 ... [详细]

蜡笔小新 2024-11-28 17:32:27
数据库
MySQL 表分区详解及应用

本文详细介绍了MySQL表分区的概念、类型及其在实际应用中的实施方法，特别是针对Zabbix数据库的优化策略。 ... [详细]

蜡笔小新 2024-11-28 16:38:55
数据库
ETM '大众奖励计划' 启动

En-Tan-Mo再次引领创新潮流，推出全新'大众奖励计划'。作为区块链领域的先锋，En-Tan-Mo继交易所上线、发布技术白皮书及共识之夜活动后，再次展现其团队的卓越与活力。本文将详细介绍该计划的具体内容及其对参与者的重要意义。 ... [详细]

蜡笔小新 2024-11-28 16:36:13

夜半MM

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章