热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

【MySQL】分库分表相关思考

一、分库分表概念1.分库随着业务的增长,数据量的增加,很多接口响应时间变得很长,经常出现Timeout,而且通过升级MyS


一、分库分表概念

在这里插入图片描述


1. 分库

随着业务的增长,数据量的增加,很多接口响应时间变得很长,经常出现 Timeout,而且通过升级 MySQL 实例配置已经无法解决问题了,这时候就要分库。

垂直分库:将不同的业务表分在不同的数据库中。

水平分库:水平分库理论上切分起来是比较麻烦的,它是将同一表数据拆分到不同数据库实例中。


2. 分表

分表的应用场景是单表数据量增长速度过快,因为大表会影响查询性能,DDL变更时间很长,影响业务的可用性,同时导致从库延迟很大。但是 MySQL 实例的负载并不高,这时候只需要分表,不需要分库。

垂直分表:表中的字段太多,需要切分字段,一般将不常用的、 数据较大、长度较长的拆分到“扩展表“。

水平分表:单表数据量太大,按某种规则将单表数据拆分到多张表中。从理论上突破了单机数据量的瓶颈,是分库分表的标准解决方案。


二、分片策略

1. 取模分片

比如按主键ID取模,将数据存储到不同的分片中。


  • 优点:数据存放比较均匀。
  • 缺点:扩容需要大量数据迁移。

2. 按范围分片

比如按日期范围进行分片。


  • 优点:扩容不需要迁移数据。
  • 缺点:数据存放不均匀,容易产生数据倾斜。

3. 自定义分片

根据业务场景,灵活定制分片策略

分片策略的选取需要考虑如何不迁移数据,实现集群动态扩缩容,同时又能保证数据分布相对均匀。可以采用整体按范围分片,不同范围包含的分片数可以不同,保证扩容时老数据不需要迁移。范围内,按照取模分片,让每个范围内的数据分布大致均匀。


三、是否应该分库分表

以下只是建议,不是绝对的要求。


  • 预估数据量:阿里建议3年内单表数据量大于500w或者单表数据文件大于2G,就需要考虑分库分表。
  • 数据增长趋势:持续高速增长的数据需要尽早考虑分库分表,并且要预留空间。
  • 预估应用场景:由于频繁变更分片键,需要同时做数据迁移,所以,对于分片键变更频繁的数据,不适合进行分库分表。
  • 预估业务复杂度:业务逻辑与分片逻辑绑定,会给SQL执行带来很多限制。所以如果对数据的查询逻辑变化非常大,通常不建议分库分表。

四、分库分表面临的问题
  • 主键唯一性:当数据被拆分到不同的表中后,主键ID将可能不再满足唯一性。
  • 分布式事务:分库分表后,就需要支持分布式事务了。数据库本身为我们提供了事务管理功能,但是分库分表之后就不适用了。如果我们自己编程协调事务,代码方面就又开始了麻烦。
  • SQL路由:一条数据插入SQL应该插入到哪个表?这个问题与选取的分片策略息息相关。
  • 结果归并:由于查询的数据可能存在于多张表、多个库中,所以需要对查询结果做归并处理。
  • 动态扩容:当数据又增长到一定阈值时,就需要考虑扩容,如何实现在不迁移或者少迁移数据的基础上实现动态扩容?
  • 联合查询困难:联合查询不仅困难,而且可以说是不可能,因为两个相关联的表可能会分布在不同的数据库,不同的服务器中。
  • 多数据源:分库分表之后可能会面临从多个数据库或多个子表中获取数据,一般的解决思路有:客户端适配和代理层适配。






推荐阅读
  • 本文介绍了如何利用 Spring Boot 和 Groovy 构建一个灵活且可扩展的动态计算引擎,以满足钱包应用中类似余额宝功能的推广需求。我们将探讨不同的设计方案,并最终选择最适合的技术栈来实现这一目标。 ... [详细]
  • 本文详细介绍了优化DB2数据库性能的多种方法,涵盖统计信息更新、缓冲池调整、日志缓冲区配置、应用程序堆大小设置、排序堆参数调整、代理程序管理、锁机制优化、活动应用程序限制、页清除程序配置、I/O服务器数量设定以及编入组提交数调整等方面。通过这些技术手段,可以显著提升数据库的运行效率和响应速度。 ... [详细]
  • 本文深入探讨了SQL数据库中常见的面试问题,包括如何获取自增字段的当前值、防止SQL注入的方法、游标的作用与使用、索引的形式及其优缺点,以及事务和存储过程的概念。通过详细的解答和示例,帮助读者更好地理解和应对这些技术问题。 ... [详细]
  • MongoDB的核心特性与架构解析
    本文深入探讨了MongoDB的核心特性,包括其强大的查询语言、灵活的文档模型以及高效的索引机制。此外,还详细介绍了MongoDB的体系结构,解释了其文档、集合和数据库的层次关系,并对比了MongoDB与传统关系型数据库(如MySQL)的逻辑结构。 ... [详细]
  • 本文深入探讨了MySQL中常见的面试问题,包括事务隔离级别、存储引擎选择、索引结构及优化等关键知识点。通过详细解析,帮助读者在面对BAT等大厂面试时更加从容。 ... [详细]
  • 本文介绍了数据库体系的基础知识,涵盖关系型数据库(如MySQL)和非关系型数据库(如MongoDB)的基本操作及高级功能。通过三个阶段的学习路径——基础、优化和部署,帮助读者全面掌握数据库的使用和管理。 ... [详细]
  • 福克斯新闻数据库配置失误导致1300万条敏感记录泄露
    由于数据库配置错误,福克斯新闻暴露了一个58GB的未受保护数据库,其中包含约1300万条网络内容管理记录。任何互联网用户都可以访问这些数据,引发了严重的安全风险。 ... [详细]
  • 简化报表生成:EasyReport工具的全面解析
    本文详细介绍了EasyReport,一个易于使用的开源Web报表工具。该工具支持Hadoop、HBase及多种关系型数据库,能够将SQL查询结果转换为HTML表格,并提供Excel导出、图表显示和表头冻结等功能。 ... [详细]
  • 深入解析Serverless架构模式
    本文将详细介绍Serverless架构模式的核心概念、工作原理及其优势。通过对比传统架构,探讨Serverless如何简化应用开发与运维流程,并介绍当前主流的Serverless平台。 ... [详细]
  • 本文详细介绍了一种通过MySQL弱口令漏洞在Windows操作系统上获取SYSTEM权限的方法。该方法涉及使用自定义UDF DLL文件来执行任意命令,从而实现对远程服务器的完全控制。 ... [详细]
  • ThinkPHP 数据库配置详解
    本文详细介绍了如何在 ThinkPHP 框架中正确配置数据库连接参数,包括数据库类型、服务器地址、数据库名称等关键配置项。 ... [详细]
  • 本文详细介绍了MySQL数据库中的Bin Log和Redo Log,阐述了它们在日志记录机制、应用场景以及数据恢复方面的区别。通过对比分析,帮助读者更好地理解这两种日志文件的作用和特性。 ... [详细]
  • 本文详细介绍了 phpMyAdmin 的安装与配置方法,适用于多个版本的 phpMyAdmin。通过本教程,您将掌握从下载到部署的完整流程,并了解如何根据不同的环境进行必要的配置调整。 ... [详细]
  • 本文详细介绍了如何在云服务器上配置Nginx、Tomcat、JDK和MySQL。涵盖从下载、安装到配置的完整步骤,帮助读者快速搭建Java Web开发环境。 ... [详细]
  • 优化Flask应用的并发处理:解决Mysql连接过多问题
    本文探讨了在Flask应用中通过优化后端架构来应对高并发请求,特别是针对Mysql 'too many connections' 错误的解决方案。我们将介绍如何利用Redis缓存、Gunicorn多进程和Celery异步任务队列来提升系统的性能和稳定性。 ... [详细]
author-avatar
兔斯基小兔子_988
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有