热门标签 | HotTags
当前位置:  开发笔记 > 数据库 > 正文

数据库设计及优化

数据库设计,可以使数据库通过健壮的数据库结构高效并且健康的进行工作。数据库设计原则:1、熟悉需求。2、开发符合规范的数据库。3、审核数据库设计。数据库规范1、命名规范:1、表名的单数和复数形式要统一。2、对于字段,如果主键是数字类型的,可

数据库设计 ,可以使数据库通过健壮的数据库结构高效并且健康的进行工作。 数据库设计原则: 1、熟悉需求。2、开发符合规范的数据库。3、审核数据库设计。 数据库规范 1、命名规范: 1、表名的单数和复数形式要统一。2、对于字段,如果主键是数字类型的,可

数据库设计,可以使数据库通过健壮的数据库结构高效并且健康的进行工作。

数据库设计原则:1、熟悉需求。2、开发符合规范的数据库。3、审核数据库设计。

数据库规范

1、命名规范:1、表名的单数和复数形式要统一。2、对于字段,如果主键是数字类型的,可以考虑使用_N结尾,例如USERID_N;如果是字符类型_C结尾USERNAME_C;3、如果一个单词经常出现,比如USER,则可以考虑以_U结尾,例如,USERID可以表示成ID_U,USERNAME表示为NAME_U。4、如果某一列是日期类型,则使用D_开头,起到强调的作用,例如:D_CREATEDATETIME。

2、明确现实中实体与数据表的关系。3、一张数据表不能既没有主键也没有外键。4、表要符合基本表的特征。

5、必须满足第一第二范式,尽量满足第三范式。6、比较简洁的E-R图。7、符合完整性约束。

基本表的特征:1、原子性,就是基本表中的字段是不可在分解的。2、原始性,基本表中的记录是袁术数据的记录。3、演绎性,由基本表和关系表中的数据可以派生出任何想要的数据。4、稳定性、基本表中的结构是相对稳定的,表中的记录需要长期保存。

第一范式:是对属性的原子性约束,要求属性具有原子性,不可再分。第二范式:记录的唯一性约束,要求记录有唯一标识,即实体的唯一性。第三范式:对字段冗余的约束,即任何字段不能由其他字段派生出来,要求字段没有冗余,一个表中的字段除了和主键有关外,这些字段他们之间不能有关系,也就是说这个表中的字段只能和主键相关,他们之间没有关系。

数据库设计技巧:1、在符合系统需求的前提下,表的个数越少越好,一张表中组合主键字段数越少越好,一个表中的字段越少越好。2、检查各种变化字段。3、避免使用保留字。4、数据库设计的时候多使用删除标记字段。5、避免使用触发器。6、如果发现在重复输入数据,就需要创建新的表和新的关系。7、熟练使用数据库设计工具。8、创建E-R图和数据字典。9、每个表都应该有三个有用的字段:修改记录时间、修改人、修改后的版本。10、对于地址和电话采用多个字段。

SQL查询优化

劣质SQL判断条件:1、运行时间超长。2、引发严重的等待事件。3、不能满足压力测试。4、消耗大量系统资源。

索引是对数据库表中一列或者多列的值进行排序的一种结构。使用索引可以快速访问数据库表中的特定信息。

索引存在的问题:1、索引占用表空间,创建太多索引可能会造成索引冗余。2、索引影响DML性能。

索引使用的条件:1、一个字段里包含大量的值。2、一个字段包含多个空值。3、多个字段经常出现在where查询中。4、表非常大并且查询返回数据量低于总数据的20%。

创建索引的语法:

CREATE INDEX 索引名 ON 表名(列名)
TABLESPACE 表空间名

例如:

Select identity_L from depositor where identity_L between
109000 and 110000              --未使用索引,查询值在109000到110000之间的值
CREATE INDEX DPTOR_INDEX ON DEPOSITOR(IDENTITY_L)
TABLESPACE DEMO         --使用索引查询。

索引类型,按列值是否唯一分为:非唯一索引和唯一索引。按索引列的个数分为单列索引和复合索引。按照索引的物理组织方式分为:B树索引、反向键索引、基于函数的索引、位图索引。

创建复合索引时,表指定的第一个列为主导列。

select *from depositor t where IDENTITY_L>100000 AND ACT>=500          --未使用索引
create index OP_IDACT_INDEX on DEPOSITOR(IDENTITY_L,ACT) tablespace DEMO           --使用复合索引

使用复合索引的情况:1、当SQL语句的WHERE自居中用到复合索引的主导列时。2、当某几个列在SQL语句的WHERE子句中经常通过and操作符联合在一起使用,并且这些列合在一起是选择性比各自单个列的选择性要好时。

3、当有几个查询语句都是查询相同的几个列值时。

反向键索引就是将当前列中的值反转后生成的索引。

创建反向键索引的语法:create index索引名 on 表名(列名) reverse tablespace表空间;

基于函数的索引,基于一个或者多个列上的函数或表达式创建的索引。

注意:表达式中不能包含聚合函数(SUM、COUNT、AVG、MIN、MAX)。

基于函数索引的语法:CREATE INDEX索引名 ON 表名(函数(列名)) TABLESPACE表空间;

select lower(firstname) from depositor t;             --没有使用基于函数索引的情况。
create index firstname_lower on depositor(lower(firstname)) tablespace prd;

使用基于函数的索引的情况:1、一个表中的字段经常被函数所调用,那么这个字段就可以使用基于函数的索引。

位图索引:

值\行

1

2

3

4

张三

1

0

0

1

李四

0

0

0

1

王五

0

1

0

1

小明

1

0

1

1

整个表就是针对一个列建立出来的位图索引,这个表中的列(1,2,3,4)表示的是对应的索引列的第几行。行代表的是当前行,当前被索引列的值。比如图中第一列1,张三第一列的值是1,表示在当前被索引的第一行的位置中张三这个值时存在的,并且是1。

使用位图索引的情况:主要是处理数据的聚合关系的,用于一个重复数据很多的情况。

位图索引的语法:

CREATE BITMAP INDEX 索引名 ON 表名(列名) TABLESPACE 表空间;                                                                       select count(*) from depositor t where firstname=’Luke’;
create bitmap index fn_bitmap on depositor(firstname) tablespace prd;

表分区:有利于管理非常大的表和索引。当表里面的内容或者整个表的结构非常庞大的时候,就考虑表分区。

表分区的优点:1、提高数据的可用性,当某个分区损坏不会影响整个表结构。2、减少管理负担。3、改善语句性能。

表分区的分区方式:1、区间分区。2、散列分区。3、列表分区。4、组合分区。

区间分区:往往根据一个列值的范围来划分,开发中常常使用日期字段来划分。

语法:

PARTITIONBY RANGE(列名)                 --RANGE表示分区的方式
(
       PARTITION 分区表名 VALUES LESS THAN (值)
       tablespace 表空间
)

示例:PART_1这个分区保存早于(不包括)2008年12月31日的数据

create table drawlist( dt_draw date not null)
PARTITIONBY RANGE(dt_draw)
(
       PARTITION PART_1 VALUES LESSTHAN(to_date(‘1/1/2009’,’dd/mm/yyyy’))
       tablespace DEMO,
       PARTITION PART_1 VALUES LESSTHAN(to_date(‘1/1/2011’,’dd/mm/yyyy’))
       tablespace DEMO,
       PARTITION PART_1 VALUES LESSTHAN(to_date(MAXVALUE)
       tablespace DEMO
)
insert into drawlist values(to_date(‘31/12/2008’,’dd/mm/yyyy’));
insert into drawlist values(to_date(‘01/01/2009’,’dd/mm/yyyy’));
insert into drawlist values(to_date(‘06/06/2009’,’dd/mm/yyyy’));
insert into drawlist values(to_date(‘31/12/2010’,’dd/mm/yyyy’));
insert into drawlist values(to_date(‘01/01/2011’,’dd/mm/yyyy’));
insert into drawlist values(to_date(‘04/05/2011’,’dd/mm/yyyy’));
 
select *from drawlist partition(part_2);                                                                                         显示结果:2009-1-1;2009-6-6;2010-12-31;

散列分区:会对分区键应用一个散列函数,以此确定数据应当放在N个分区中的哪个分区中。直到散列算法是将数据随机均匀的分布。为了使数据分布的更均匀,分区表的数目建议为2的幂,也就是1、4、8、16……

散列分区语法:

PARTITION BY HASH(列)(PARTITION 分区表名 tablespace表空间)
createtable hash_table (hash_no INTEGER not null )
PARTITIONBY HASH(hash_no)
(
       PARTITION PART_1 tablespace DEMO,
       PARTITION PART_2 tablespace DEMO,
       PARTITION PART_3 tablespace DEMO,
       PARTITION PART_4 tablespace DEMO,
)

对其随机插入500条测试语句

selectcount(*) from hash_table partition(part_1)
selectcount(*) from hash_table partition(part_2)
selectcount(*) from hash_table partition(part_3)
selectcount(*) from hash_table partition(part_4)

输出结果基本均匀分布,分别为:123、116、121、140。

列表分区:可以将数据按照列的值分类。列表分区语法如下:

PARTITIONBY LIST(列)
(
       PARTITION 分区表名values(指定值1,指定值2……)
)

示例:根据用户所在地区将用户存储在不同分区中

create table area( code INTEGERnot null )
PARTITION BY LIST(code)
(
     PARTITIONPART_1 values(102200,102202,102203),
     PARTITIONPART_2 values(164300,164302,164303)
)
tablespace DEMO;
insert into area values(102200);
insert into area values(102203);
insert into area values(164300);
insert into area values(164303);
select * from area partition(part_1)
select * from area partition(part_2)

查询结果:在part_1分区中数据为102200、102202;part_2分区中数据位164300、164303;

组合分区:就是区间分区与散列分区或者区间分区与列表分区的组合。

区间-散列组合分区表语法:首先按照列1的值进行区间分区,然后按照列2散列分区。

PARTITION BY RANGE(列1) SUBPARTITION BY HASH(列2)(
     PARTITION分区名 VALUES LESS THAN (值)
     TABLESPACE表空间,
)

区间-列表组合分区表语法:先按照列1的值进行区间分区,然后按照列2指定值进行列表分区

PARTITION BY RANGE(列1) SUBPARTITION BY LIST(列2)(
     PARTITION 分区名 VALUES LESS THAN (值) TABLESPACE 表空间
     (
            SUBPARTITION 子分区名 VALUES(列表指定值1……) TABLESPACE 表空间
     )
)

组合分区示例:

\

\

select *from range_list partition(part_2);

返回值为:DT_DATE 2009-1-1,2010-12-31,2010-11-21;CODE 102200,164300,164300;

select *from range_list subpartition(part2_list);

结果为:DT_DATE 2009-1-1;CODE102200;

分区维护:增加分区、删除分区、截断分区、合并分区。

增加分区的语法:

ALTER TABLE 表名 ADD PARTITION 分区表名  VALUES LESS THAN(值)

例如:

ALTERTABLE DRAWLIST ADD PARTITION PART_4 VALUES LESS
THAN(TO_DATE(‘1/1/2012’,’DD/MM/YYYY’)) TABLESPACE DEMO;

删除分区语法:

ALTER TABLE 表名 DROP PARTITION 分区表名

例如:

ALTER TABLE DRAWLIST DROPPARTITION PART_3;

截断分区是删除当前分区中的数据,但不删除当前分区,也不影响其他分区。

语法:

ALTER TABLE 表名 TRUNCATE PARTITION 已存在的分区表

如:

ALTER TABLE DRAWLI ST TRUNCATEPARTITION PART_1;

合并分区是将两个分区的数据合并成一个分区里,注意:高界限的分区不能合并到低界限的分区中。

合并分区的语法:

ALTER TABLE 表名 MERGE PARTITIONS 分区表1,分区表2 INTO PARTITION 分区表2

例如:

ALTER TABLE drawlist MERGE PARTITIONS part_2,part_4 INTO PARTITION part_4;

SQL优化途径:选择合适的Oracle优化器、选择恰当的扫描方式、善于利用共享的SQL语句。

1、选择合适的优化器。CBO优化器:基于成本的优化器,这个成本是指CPU和内存占用率。

在编写SQL时,可以使用CBO对SQL进行优化从而获得更快的响应速度。

优化器使用的模式根据目标而定,CBO的优化模式有四种分别为:1、Rule:基于规则。2、Choose:默认,表或者索引有统计信息,走CBO模式,否则,走RBO模式。3、FirstRow:表中有统计信息时,以最快方式返回查询的前几行,总体减少响应时间,4、AllRows:表中有统计信息时,以最快的方式返回表的所有行,总体提高查询吞吐量。

1、 选择合适的扫描方式。Oracle中,查询数据可以分为:全表扫描、使用ROWID、索引全扫描、快速索引扫描。

全表扫描:就是Oracle读取表中所有的行,并检查每一行是否满足WHERE语句的限制。在数据量大的表中不建议使用全表扫描,效率低下。

使用ROWID:ROWID指出该行所在的数据文件、数据块以及行在该块的位置。是Oracle存取单行数据最快的方式。

索引全扫描:只在CBO模式下有效,这种方式查询的数据必须可以从索引中直接得到。

快速索引扫描:它会扫描索引中所有的数据块,与全索引扫描类似,但这种方式不会对查询出的数据进行排序,这种方式会获得最大吞吐量,并且缩短执行时间。

3、学会利用共享的SQL语句。它存在Oracle的系统全局区中,也就是SGA,可以通过设置SGA的大小,来提高sql的执行效率。


推荐阅读
  • PHP 数组逆序排列方法及常用排序函数详解 ... [详细]
  • 在数据库事务处理中,InnoDB 存储引擎提供了多种隔离级别,其中 READ COMMITTED 和 REPEATABLE READ 是两个常用的选项。本文详细对比了这两种隔离级别的特点和差异,不仅从理论角度分析了它们对“脏读”和“幻读”的处理方式,还结合实际应用场景探讨了它们在并发控制和性能表现上的不同。特别关注了行锁机制在不同隔离级别下的行为,为开发者选择合适的隔离级别提供了参考。 ... [详细]
  • MongoDB核心概念与基础知识解析
    MongoDB 是一种基于分布式文件存储的非关系型数据库系统,主要采用 C++ 语言开发。本文将详细介绍 MongoDB 的核心概念和基础知识,包括其与传统 SQL 数据库的区别,数据库及集合的基本操作,如数据的插入、更新、删除和查询等。通过本文,读者可以全面了解 MongoDB 的基本功能及其应用场景。 ... [详细]
  • 本文详细解析了高性能通信库 NanoMsg 的框架及其应用场景。其中,BUS模式支持多对多的简单通信方式,消息会传递给所有直接连接的节点。REQREP模式则适用于构建无状态的服务集群,用于处理用户的请求,每个请求都需要一个相应的响应。 ... [详细]
  • 二叉树的直径是指树中任意两个叶节点之间最长路径上的节点数量。本文深入解析了计算二叉树直径的算法,并提出了一种优化方法,以提高计算效率和准确性。通过详细的案例分析和性能对比,展示了该优化算法在实际应用中的优势。 ... [详细]
  • 本文详细探讨了YOLO目标检测技术在实际应用中的实践与优化。通过一系列实战案例,展示了如何在不同场景下高效部署和调优YOLO模型。验证环境包括Ubuntu 18.04、NVIDIA驱动450、CUDA 11.0、cuDNN 8.0.5和OpenCV 4.4.0,确保了模型的稳定性和高性能表现。文章将持续更新,提供最新的技术进展和实践经验。 ... [详细]
  • vtkGlyph3D 是一种强大的符号化可视化工具,能够将三维数据集中的每个点用预定义的几何图形(如球体或箭头)进行表示。该工具不仅支持自定义符号的方向和缩放比例,还能够在复杂的数据场中突出显示关键特征,从而提高数据的可解释性和可视化效果。通过这种方式,用户可以更直观地理解和分析三维数据集中的重要信息。 ... [详细]
  • 为了评估精心优化的模型与策略在实际环境中的表现,Google对其实验框架进行了全面升级,旨在实现更高效、更精准和更快速的在线测试。新的框架支持更多的实验场景,提供更好的数据洞察,并显著缩短了实验周期,从而加速产品迭代和优化过程。 ... [详细]
  • 本文提出了一种高效的数据结构与算法,旨在解决超大整数(超出常规 `long` 类型范围)的加法运算问题。通过引入自定义的数据结构,该方法能够有效地存储和处理任意大小的整数,并在保证计算精度的同时,显著提升运算效率。实验结果表明,该方法在处理大规模数据时表现出色,具有较高的实用价值。 ... [详细]
  • 本文详细介绍了Java编程中的几种重要技巧,包括冒泡排序和选择排序这两种基础的数组排序算法。冒泡排序通过多次遍历数组,将较大的元素逐步移动到数组末尾;而选择排序则在每次遍历中选择最小的元素并将其放置在正确的位置。此外,文章还探讨了二分查找算法,该算法适用于已排序的数组,能够高效地进行查找操作。同时,文中还介绍了Java中的`Arrays`类及其常用方法,以及如何进行进制转换和装箱与拆箱操作,提供了丰富的示例和注意事项,帮助读者深入理解这些核心概念。 ... [详细]
  • 本文详细解析了九度编程平台上的斐波那契数列高效算法挑战(题目编号:1387)。该挑战要求在1秒的时间限制和32兆的内存限制下,设计出高效的斐波那契数列计算方法。通过多种算法的对比和性能分析,本文提供了优化方案,帮助参赛者在限定资源条件下实现高效计算。 ... [详细]
  • 解决Android应用在手机安装时出现安全风险提示的方法与对策
    解决Android应用在手机安装时出现安全风险提示的方法与对策 ... [详细]
  • 本文深入解析了计算力扣平台上汉明距离问题的官方解法,并通过优化算法提高了计算效率。具体而言,我们详细探讨了如何利用位运算技巧来高效计算数组中所有数对之间的汉明距离,从而在时间和空间复杂度上实现了显著改进。通过实例代码演示,使读者能够更直观地理解这一优化方法。 ... [详细]
  • 设计模式详解:模板方法模式的应用与实现
    模板方法模式是一种行为设计模式,通过定义一个操作中的算法骨架,将具体步骤的实现延迟到子类中。本文详细解析了模板方法模式的类图结构、实现方式以及挂钩机制,并结合实际案例进行了深入探讨。此外,文章还提供了丰富的参考资料,帮助读者更好地理解和应用这一设计模式。对于手机用户,建议横屏阅读以获得更佳的阅读体验。 ... [详细]
  • 探索聚类分析中的K-Means与DBSCAN算法及其应用
    聚类分析是一种用于解决样本或特征分类问题的统计分析方法,也是数据挖掘领域的重要算法之一。本文主要探讨了K-Means和DBSCAN两种聚类算法的原理及其应用场景。K-Means算法通过迭代优化簇中心来实现数据点的划分,适用于球形分布的数据集;而DBSCAN算法则基于密度进行聚类,能够有效识别任意形状的簇,并且对噪声数据具有较好的鲁棒性。通过对这两种算法的对比分析,本文旨在为实际应用中选择合适的聚类方法提供参考。 ... [详细]
author-avatar
lily-SweetDream_828
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有