热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

这知识我没见过MySQL服务演进

MySQL服务演进1概述当数据越来越多,且增长速度很快,尤其是并发量也越来越多时,单点的数据库会出现性能瓶颈,比如连接池

MySQL服务演进

1

概述

  • 当数据越来越多,且增长速度很快,尤其是并发量也越来越多时,单点的数据库会出现性能瓶颈,比如连接池连接数不够,很多请求处于阻塞状态,没有命中索引的查询非常耗时,物理存储也会压力倍增

  • 此时,需要对数据库进行优化,硬件层面,增加CPU、内存和存储空间在前期能解决一定的问题;

  • 更多的,需要通过软件层面来进行优化,包括:

  • SQL调优,如前面所讲,排查出慢查询,有针对性进行优化

  • 表结构优化,根据业务特性,只返回表中合理数据,或表根据业务拆分成多个表,另外,适当的冗余,也能减少join,提升查询性能

  • 读写分离,面向实际业务读多写少的实际情况,使用binlog同步实现一主多从多个数据库实例,提升性能

  • 分库分表,但数据量继续增加时,尤其是单表数据超大,比如超过500

2

业务演进...

  • 就像一个公司是从小到大,业务体量也是如此,一般的,一个业务系统正常演进如下:

  • 单业务系统--单数据库:此时,业务体量很小,数据库承载量充分并有富余

  • 多业务系统--单数据库:这个阶段,业务复杂度增大,会将复杂的业务系统拆分成很多子业务系统,数据库性能卓越,还能继续支持多业务系统

  • 多业务系统--多数据库:即按业务分库、业务量继续增大,数据库成为瓶颈,将数据库按每个业务系统单独划分独立的数据库,独立部署,增加各个系统的业务承载能力,整体业务的承载能力也增强,微服务的处理模式就是这样

  • 分库分表:业务进入持续快速增长,某些业务子系统的单个或多个业务表数据量超限,通过硬件提升、单表的SQL优化、甚至时读写分离,都不能有效提高查询或操作的性能,就需要使用分表处理了;主要有垂直分表和水平分表,垂直分表是按业务特性,单表只存放与业务相关的字段;当数据量达到足够大时,如超过500万条记录,垂直分表性能提升有限,最终还是要使用分库的水平分表

  • 垂直分表:按业务拆分成多个表结构,使表结构更聚焦于业务,减少查询返回数据量

  • 水平分表:表结构相同,基于不同维度划分数据,数据不相同;又分单库分表和多库分表,由于单库始终会有性能瓶颈,所以常见为多库分表

业务演进过程

1

单应用-单DB

  • 小型项目的常见业务形态

2

多应用-单DB

  • 企业具备多种小项目常见的业务形态,数据库服务需要性能相对较好

3

单应用-主从DB

  • 中型复杂业务系统常见的模式,将业务中的读操作、写操作针对不同的DB服务器,提升业务系统容量

  • 主、从DB服务器要有合理的数据同步机制

  • 可以直接业务中切换,也可以使用中间件

4

多应用-多DB

  • 从业务的角度将应用、DB都做切分,切分成粒度更小的多个应用+DB组合

  • 微服务就是典型的多应用-多DB的模式

5

分库分表

  • 当应用体量越来越大,部分业务的单表数据超大,如超过1000万条,此时要考虑分库分表

  • 分库分表给应用带来了很大的复杂性,一般会使用像MyCat、ShardingSphere等中间件来处理,给业务屏蔽DB的复杂性

►►►

如何分表?

  • 实现分表,核心的就是根据业务找到一个合理的分表键,一般要考虑几个条件:

  • 数据能尽量均匀的分布在不同的库或表,并考虑业务增长的特性

  • 跨度查询,尤其是跨库join查询尽量少

  • 该分表键尽量不会变动

  • 常用的分表键划分(分区)策略有按范围、hash、hash+范围等


分表带来的问题

  • 跨库关联查询,如果在单库,可以方便的使用join获取关联信息、生成需要的业务报表,但分表后可能join的数据在另外一个库中;一般使用适当冗余数据、所有库都存放全局表、使用集中数据仓库处理汇总业务,以及在业务层组装等解决

  • 分布式事务,一个库中事务好处理,跨库、跨业务的事务比较复杂;可考虑在业务层面上使用消息中间件,以及一些第三方组件Seata、TXLcn等使用两阶段提交方式处理

  • 排序、分页、汇总等函数计算问题,需要分库计算、然后汇总,或是使用第三方组件

  • 分布式ID,分库分表后,原有的表主键使用方式(如自增)可能会出现问题,主要解决方式有:UUID、号段模式、Redis缓存、雪花算法(SnowFlake)


第三方插件和中间件

  • 分库分表后,业务系统中实现对多个数据源的数据操作实际很复杂

  • 有业界的第三方插件或中间件来解决前述分库分表带来的问题


  • ShardingSphere:Apache的开源的一个项目,需要嵌入到业务系统代码中进行处理,有基于Spring Boot的工具,对代码有侵入

  • MyCat:是在业务系统与分库分表多数据源中间架设一个中间层来实现,对代码无侵入




 福利

 


推荐阅读
author-avatar
小明爱微笑_401
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有