热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

sqlserver动态分区方案例子

sqlserver动态分区方案例子当我们存储的数据量比较大时,比如超过千万,上亿级别时单纯的使用索引可能效果不明显了,此时我们可以考虑采

sqlserver动态分区方案例子

当我们存储的数据量比较大时,比如超过千万,上亿级别时单纯的使用索引可能效果不明显了,此时我们可以考虑采用数据库分区来解决性能瓶颈问题。下面是我在工作中创建的一个动态分区思路,分区可以是固定分区,后面再扩展到动态分区。

 

1、检查你的数据库,看是否支持分区。

sqlserver数据库分区技术在2005版本就已经添加了,在这之前的版本你就别想了,赶紧升级数据库吧,如果你的数据库是2005以上的,那也不一定支持分区,因为sqlserver包含了很多选择,比如标准版,家庭版,开发版等等,有些是不支持分区的。但企业版肯定是支持分区的。

这里可以查看sqlserver数据库历史版本特性的介绍。

 

2、我们随便创建一个数据库,我这里是Test

 

3、创建一个测试表,加入这个表的数据量比较大,全国人口13亿多呢,你说大不大!!

查看复制打印?

  1. CREATE TABLE [dbo].[users](  
  2.  [id] [bigint] NOT NULL,  
  3.  [district] [varchar](12) NULL,  
  4.  [tm] [date] NULL,  
  5.  [name] [varchar](16) NULL,  
  6.  CONSTRAINT [PK_users] PRIMARY KEY CLUSTERED   
  7. (  
  8.  [id] ASC  
  9. )WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, IGNORE_DUP_KEY = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON) ON [PRIMARY]  
  10. ) ON [PRIMARY]  
  11. GO  

4、将表的主键调整为非聚集索引,因为在创建分区的表上,不能创建聚集索引



 

5、插入一批测试数据

查看复制打印?

  1. -- 先初始化一批数据  
  2. insert into users(id,district,tm,name) values(1,'深圳',CONVERT(date,'2017-07-02'),'张永辉');  
  3. insert into users(id,district,tm,name) values(2,'深圳',CONVERT(date,'2017-08-02'),'蒋福龙');  
  4. insert into users(id,district,tm,name) values(3,'深圳',CONVERT(date,'2017-08-03'),'魏吉海');  
  5. insert into users(id,district,tm,name) values(4,'深圳',CONVERT(date,'2017-09-10'),'向其星');  
  6. go  


6、我们创建两个存储过程用来检测分析数据

1)普通存储查询-存储过程

查看复制打印?

  1. USE [Test]  
  2. GO  
  3.   
  4. SET ANSI_NULLS ON  
  5. GO  
  6. SET QUOTED_IDENTIFIER ON  
  7. GO  
  8. create procedure [dbo].[proc_show_store] as   
  9. begin  
  10.   
  11.   
  12.   
  13. SELECT OBJECT_NAME(p.object_id) AS ObjectName,  
  14.       i.name                   AS IndexName,  
  15.       p.index_id               AS IndexID,  
  16.       ds.name                  AS PartitionScheme,     
  17.       p.partition_number       AS PartitionNumber,  
  18.       fg.name                  AS FileGroupName,  
  19.       prv_left.value           AS LowerBoundaryValue,  
  20.       prv_right.value          AS UpperBoundaryValue,  
  21.       CASE pf.boundary_value_on_right  
  22.             WHEN 1 THEN 'RIGHT'  
  23.             ELSE 'LEFT' END    AS Range,  
  24.       p.rows AS Rows  
  25. FROM sys.partitions                  AS p  
  26. JOIN sys.indexes                     AS i  
  27.       ON i.object_id = p.object_id  
  28.       AND i.index_id = p.index_id  
  29. JOIN sys.data_spaces                 AS ds  
  30.       ON ds.data_space_id = i.data_space_id  
  31. JOIN sys.partition_schemes           AS ps  
  32.       ON ps.data_space_id = ds.data_space_id  
  33. JOIN sys.partition_functions         AS pf  
  34.       ON pf.function_id = ps.function_id  
  35. JOIN sys.destination_data_spaces     AS dds2  
  36.       ON dds2.partition_scheme_id = ps.data_space_id   
  37.       AND dds2.destination_id = p.partition_number  
  38. JOIN sys.filegroups                  AS fg  
  39.       ON fg.data_space_id = dds2.data_space_id  
  40. LEFT JOIN sys.partition_range_values AS prv_left  
  41.       ON ps.function_id = prv_left.function_id  
  42.       AND prv_left.boundary_id = p.partition_number - 1  
  43. LEFT JOIN sys.partition_range_values AS prv_right  
  44.       ON ps.function_id = prv_right.function_id  
  45.       AND prv_right.boundary_id = p.partition_number   
  46. WHERE  
  47.       OBJECTPROPERTY(p.object_id, 'ISMSShipped') = 0  
  48.        -- and  ds.name is not null   
  49.      
  50.          
  51.        -- 普通表的存储信息  
  52. UNION ALL  
  53. SELECT  
  54.       OBJECT_NAME(p.object_id)    AS ObjectName,  
  55.       i.name                      AS IndexName,  
  56.       p.index_id                  AS IndexID,  
  57.       NULL                        AS PartitionScheme,  
  58.       p.partition_number          AS PartitionNumber,  
  59.       fg.name                     AS FileGroupName,    
  60.       NULL                        AS LowerBoundaryValue,  
  61.       NULL                        AS UpperBoundaryValue,  
  62.       NULL                        AS Boundary,   
  63.       p.rows                      AS Rows  
  64. FROM sys.partitions     AS p  
  65. JOIN sys.indexes        AS i  
  66.       ON i.object_id = p.object_id  
  67.       AND i.index_id = p.index_id  
  68. JOIN sys.data_spaces    AS ds  
  69.       ON ds.data_space_id = i.data_space_id  
  70. JOIN sys.filegroups           AS fg  
  71.       ON fg.data_space_id = i.data_space_id  
  72. WHERE  
  73.       OBJECTPROPERTY(p.object_id, 'ISMSShipped') = 0  
  74. ORDER BY  
  75.       ObjectName,  
  76.       IndexID,  
  77.       PartitionNumber  
  78.         
  79.       end  
  80.         

 

2)分区存储查询-存储过程

查看复制打印?

  1. USE [Test]  
  2. GO  
  3.   
  4. SET ANSI_NULLS ON  
  5. GO  
  6.   
  7. SET QUOTED_IDENTIFIER ON  
  8. GO  
  9.   
  10. create procedure [dbo].[proc_show_store_fq] as   
  11. begin  
  12.   
  13. SELECT OBJECT_NAME(p.object_id) AS ObjectName,  
  14.       i.name                   AS IndexName,  
  15.       p.index_id               AS IndexID,  
  16.       ds.name                  AS PartitionScheme,     
  17.       p.partition_number       AS PartitionNumber,  
  18.       fg.name                  AS FileGroupName,  
  19.       prv_left.value           AS LowerBoundaryValue,  
  20.       prv_right.value          AS UpperBoundaryValue,  
  21.       CASE pf.boundary_value_on_right  
  22.             WHEN 1 THEN 'RIGHT'  
  23.             ELSE 'LEFT' END    AS Range,  
  24.       p.rows AS Rows  
  25. FROM sys.partitions                  AS p  
  26. JOIN sys.indexes                     AS i  
  27.       ON i.object_id = p.object_id  
  28.       AND i.index_id = p.index_id  
  29. JOIN sys.data_spaces                 AS ds  
  30.       ON ds.data_space_id = i.data_space_id  
  31. JOIN sys.partition_schemes           AS ps  
  32.       ON ps.data_space_id = ds.data_space_id  
  33. JOIN sys.partition_functions         AS pf  
  34.       ON pf.function_id = ps.function_id  
  35. JOIN sys.destination_data_spaces     AS dds2  
  36.       ON dds2.partition_scheme_id = ps.data_space_id   
  37.       AND dds2.destination_id = p.partition_number  
  38. JOIN sys.filegroups                  AS fg  
  39.       ON fg.data_space_id = dds2.data_space_id  
  40. LEFT JOIN sys.partition_range_values AS prv_left  
  41.       ON ps.function_id = prv_left.function_id  
  42.       AND prv_left.boundary_id = p.partition_number - 1  
  43. LEFT JOIN sys.partition_range_values AS prv_right  
  44.       ON ps.function_id = prv_right.function_id  
  45.       AND prv_right.boundary_id = p.partition_number   
  46. WHERE  
  47.       OBJECTPROPERTY(p.object_id, 'ISMSShipped') = 0  
  48.         and  ds.name is not null  order by p.object_id   
  49.      
  50.        /*  
  51.        -- 普通表的存储信息  
  52. UNION ALL  
  53. SELECT  
  54.       OBJECT_NAME(p.object_id)    AS ObjectName,  
  55.       i.name                      AS IndexName,  
  56.       p.index_id                  AS IndexID,  
  57.       NULL                        AS PartitionScheme,  
  58.       p.partition_number          AS PartitionNumber,  
  59.       fg.name                     AS FileGroupName,    
  60.       NULL                        AS LowerBoundaryValue,  
  61.       NULL                        AS UpperBoundaryValue,  
  62.       NULL                        AS Boundary,   
  63.       p.rows                      AS Rows  
  64. FROM sys.partitions     AS p  
  65. JOIN sys.indexes        AS i  
  66.       ON i.object_id = p.object_id  
  67.       AND i.index_id = p.index_id  
  68. JOIN sys.data_spaces    AS ds  
  69.       ON ds.data_space_id = i.data_space_id  
  70. JOIN sys.filegroups           AS fg  
  71.       ON fg.data_space_id = i.data_space_id  
  72. WHERE  
  73.       OBJECTPROPERTY(p.object_id, 'ISMSShipped') = 0  
  74. ORDER BY  
  75.       ObjectName,  
  76.       IndexID,  
  77.       PartitionNumber  
  78.         
  79.       */  
  80.       end  
  81.               
  82. GO  


7、查看未分区时存储情况

执行存储过程

查看复制打印?

  1. USE [Test]  
  2. GO  
  3.   
  4. DECLARE @return_value int  
  5.   
  6. EXEC    @return_value = [dbo].[proc_show_store]  
  7.   
  8. GO  

 

这里可以看到 在users表中存储了4条数据,而这4条数据是存储在primary(默认)分组里面的。

 

此时我们来创建固定分区

分区思路:我们根据时间(tm)来进行分区,做两个固定分区(2017年8月和9月)

 

8、创建分区文件组

 

9、创建数据库文件

 

10、通过向导创建分区

1)选择要分区的表,右键选择存储》创建分区

 

2)下一步


3)选择分区列(我们根据tm进行分区,你可以根据你自己的实际业务选择)


4)选择分区函数(第一次,就创建吧,名字随便取一个)



5)选择分区方案(第一次就创建吧,名字随便取一个)


6)映射分区

这里主要是制定分区的规则,什么样的数据存储在哪个分区里面,就是通过这里配置的


说明:

设置边界:通过设置边界可以将数据快捷分配,比如选择的是时间的话,按年,按月等操作
范围:主要讲的是包含还是不包含的意思

    左边界:文件组包含这个边界值(tm如2017/8/1)的值
    右边界:文件组不包含这个边界值(tm如2017/8/1)的值
预计存储空间:设置边界后,点击【预计存储空间】按钮,可以对数据进行一个估算,但不一定是准确值,因此这里还没有进行真正的分区,users表里面现在有4条数据,而【行计数】,累计却有6条,因此不一定准啊,但我们不用管它。

 

7)点击下一步,我们直接立即运行

 

8)再次确认要执行的操作 

 

9)点击完成,执行创建分区

此时我们的分区就算创建完成了

11、查看分区后的存储情况

查看复制打印?

  1. DECLARE @return_value int  
  2. EXEC    @return_value = [dbo].[proc_show_store_fq]  
  3. GO  

到这里,我们成功的创建好了固定分区

存储结果说明

ObjectName:users表 
PartitionScheme:分区方案sm_fq_tm 
lowerBoundaryValue:分区的开始边界值 
UpperBoundaryValue:分区的结束边界值 
FileGroupName:分区的存储组 
    primary:默认文件组,存储了1条数据,如果后面再插入数据,数据不符合其他分组条件的,都会存储在这个区里面 
    filesGroup_201708:我们自己定义的分区,我们命名分区的名字和分配存储有点词不达意哈。。不要介意!!这里按名字应该准备存储8月份的数据,可实际存储的是7-1到8-1日的数据,说白了,实际存储的是7月份的数据。 
rows:实际存储的数据

 

12、动态分区

可能你也想到了,数据是实时变化的,以后会有更多的数据存储进来,而我们的分区方案是固定的,这样会导致一个问题,假如插入的数据正好是7和8月份的数据,那么可以正常分配到分区gileGroup_xxx里面去,而假如插入的是2018年或者2000年的数据,那么全部到primary分区里面了,这样会导致primary分区数据非常大。

难道我们事先在数据库里面先创建好10年,或者是100年甚至更久的分区方案??

如果你真这么做,也不是不可以,至少这样也是可行的,但我提出另外一种思路,我们来做一个动态分区
 

主要思路是这样

创建一个定时器每天执行一次,获取当前日期的月份,在数据库中查询是否有创建了分区,如果没有创建,则自动创建一个分区 

 

13、动态分区存储过程

查看复制打印?

  1. GO  
  2. SET ANSI_NULLS ON  
  3. GO  
  4. SET QUOTED_IDENTIFIER ON  
  5. GO  
  6. -- =============================================  
  7. -- Author:      jiangfl  
  8. -- Create date: 2015-8-19  
  9. -- Description: 动态分区  
  10.   
  11. -- =============================================  
  12. create PROCEDURE  [dbo].[proc_create_table_partition]  
  13.     (@now datetime)  
  14. AS  
  15. BEGIN   
  16.   
  17.     --文件组名称  
  18.     declare @fileGroupName varchar(32);  
  19.     --文件名称  
  20.     declare @fileName varchar(512);  
  21.     -- 保存201608这样的日期  
  22.     declare @yyyymm varchar(8);  
  23.     -- 保存 2015-09-01 这样的日期  
  24.     declare @yyyy_mm_dd varchar(10);  
  25.       
  26.       
  27.     set @yyyymm='_'+convert(varchar(6),@now,112);  
  28.       
  29.     set @yyyy_mm_dd= convert(varchar(7),@now,120)+'-01';  
  30.       
  31.       
  32.     --定义文件组名称  
  33.     set @fileGroupName='fileGroup'+@yyyymm;  
  34.       
  35.       
  36.     --判断组是否已经创建  
  37.     if not  exists(select 1 from sys.filegroups where name=@fileGroupName)   
  38.     begin  
  39.         --创建文件组,因为alter database 这些是不支持事务的,所以只能通过条件来控制  
  40.         exec('alter database Test add filegroup '+@fileGroupName);  
  41.           
  42.     end;  
  43.       
  44.     --print @yyyymm;  
  45.     --创建文件,并分追加到组中  
  46.     if not  exists(select 1 from sys.database_files where name='file'+@yyyymm) begin  
  47.   
  48.         --查询主文件目录  
  49.         select @fileName=substring(physical_name,1,LEN(physical_name)-4) from master.sys.master_files where type_desc='ROWS' and name='Test';  
  50.         
  51.           
  52.         --完整的文件名称  
  53.          set @fileName=@fileName+@yyyymm+'.ndf';  
  54.           
  55.         --创建文件  
  56.          exec('alter database Test add file (name=N''file'+@yyyymm+''',filename=N'''+@fileName+''',size=10Mb,filegrowth=2mb) to filegroup '+@fileGroupName);  
  57.       
  58.       
  59.         --修改分区方案(方案依赖函数,所以先修改方案)  
  60.          exec('ALTER PARTITION SCHEME sm_fq_tm  NEXT USED '+@fileGroupName);  
  61.           
  62.           
  63.         --修改分区函数,添加分区  
  64.          ALTER PARTITION FUNCTION fun_fq_tm() SPLIT RANGE(N''+@yyyy_mm_dd);  
  65.       
  66.     end  
  67.       
  68. END  

存储过程说明

1、根据传递进来的时间(月份)判断是否已经创建过分区了,如果创建过分区,就不再创建。 
2、创建文件组 
3、创建数据库文件,并绑定到文件组中 
4、重新修改分区方案,将新创建的文件组绑定到方案中 
5、重修修改分区函数,将添加一个边界

 

14、执行存储过程创建创建新分区

查看复制打印?

  1. begin  
  2. declare @now datetime;  
  3. set @now= convert(date,'2017-10-1')  
  4. --动态分区  
  5. exec dbo.proc_create_table_partition  @now;  
  6. end;  

我们添加一个10月份的新分区,执行完成后,可以查看到数据库中多了数据库文件,文件组

 

 

执行前面创建好的分区存储过程也可以查到分区情况,此时我们成功调整了分区。

查看复制打印?

  1. DECLARE @return_value int  
  2. EXEC    @return_value = [dbo].[proc_show_store_fq]  
  3. GO  

 

15、在执行计划中创建定时器执行,每天执行一次,这样就完成了动态分区效果了

查看复制打印?

  1. begin  
  2. declare @now datetime;  
  3. --每个月1号执行的时候,添加下一个月的分区  
  4. set @now=DATEADD (MONTH , 1, getdate())  
  5. --动态分区  
  6. exec dbo.proc_create_table_partition  @now;  
  7. end;  


推荐阅读
  • UNP 第9章:主机名与地址转换
    本章探讨了用于在主机名和数值地址之间进行转换的函数,如gethostbyname和gethostbyaddr。此外,还介绍了getservbyname和getservbyport函数,用于在服务器名和端口号之间进行转换。 ... [详细]
  • 前言--页数多了以后需要指定到某一页(只做了功能,样式没有细调)html ... [详细]
  • 本文详细介绍了如何构建一个高效的UI管理系统,集中处理UI页面的打开、关闭、层级管理和页面跳转等问题。通过UIManager统一管理外部切换逻辑,实现功能逻辑分散化和代码复用,支持多人协作开发。 ... [详细]
  • 实体映射最强工具类:MapStruct真香 ... [详细]
  • 本文详细介绍了Java中org.neo4j.helpers.collection.Iterators.single()方法的功能、使用场景及代码示例,帮助开发者更好地理解和应用该方法。 ... [详细]
  • 优化ListView性能
    本文深入探讨了如何通过多种技术手段优化ListView的性能,包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]
  • 本文将介绍如何编写一些有趣的VBScript脚本,这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例,帮助您了解VBScript的基本语法和功能。 ... [详细]
  • 本文详细介绍如何使用Python进行配置文件的读写操作,涵盖常见的配置文件格式(如INI、JSON、TOML和YAML),并提供具体的代码示例。 ... [详细]
  • 使用 Azure Service Principal 和 Microsoft Graph API 获取 AAD 用户列表
    本文介绍了一段通用代码示例,该代码不仅能够操作 Azure Active Directory (AAD),还可以通过 Azure Service Principal 的授权访问和管理 Azure 订阅资源。Azure 的架构可以分为两个层级:AAD 和 Subscription。 ... [详细]
  • 本文详细介绍了Java中的访问器(getter)和修改器(setter),探讨了它们在保护数据完整性、增强代码可维护性方面的重要作用。通过具体示例,展示了如何正确使用这些方法来控制类属性的访问和更新。 ... [详细]
  • 本文介绍如何使用JPA Criteria API创建带有多个可选参数的动态查询方法。当某些参数为空时,这些参数不会影响最终查询结果。 ... [详细]
  • MySQL索引详解与优化
    本文深入探讨了MySQL中的索引机制,包括索引的基本概念、优势与劣势、分类及其实现原理,并详细介绍了索引的使用场景和优化技巧。通过具体示例,帮助读者更好地理解和应用索引以提升数据库性能。 ... [详细]
  • 毕业设计:基于机器学习与深度学习的垃圾邮件(短信)分类算法实现
    本文详细介绍了如何使用机器学习和深度学习技术对垃圾邮件和短信进行分类。内容涵盖从数据集介绍、预处理、特征提取到模型训练与评估的完整流程,并提供了具体的代码示例和实验结果。 ... [详细]
  • 在多线程编程环境中,线程之间共享全局变量可能导致数据竞争和不一致性。为了解决这一问题,Linux提供了线程局部存储(TLS),使每个线程可以拥有独立的变量副本,确保线程间的数据隔离与安全。 ... [详细]
  • 本文介绍了JSP的基本概念、常用标签及其功能,并通过示例详细说明了如何在JSP页面中使用Java代码。 ... [详细]
author-avatar
mobiledu2502882843
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有