当前位置: 开发笔记 > 数据库 > 正文

MyBatis实现Mysql数据库分库分表操作和总结（推荐）

作者：残破的前进 | 来源：互联网 | 2022-01-13 07:02

这篇文章主要介绍了MyBatis实现Mysql数据库分库分表操作和总结,需要的朋友可以参考下

前言

作为一个数据库，作为数据库中的一张表，随着用户的增多随着时间的推移，总有一天，数据量会大到一个难以处理的地步。这时仅仅一张表的数据就已经超过了千万，无论是查询还是修改，对于它的操作都会很耗时，这时就需要进行数据库切分的操作了。

MyBatis实现分表最简单步骤

既然文章的标题都这么写了，不如直接上干货来的比较实际，我们就先来看看如何实现最简单的分表。

1、我们模拟用户表数据量超过千万（虽然实际不太可能）

2、用户表原来的名字叫做user_tab，我们切分为user_tab_0和user_tab_1（实际也可能不是这么随意的名字），这样就能把原来千万的数据分离成两个百万的数据量的两张表了。

3、如何操作这两张表呢？我们利用userId也就是用户的唯一标识进行区分。

4、userId%2 == 0的用户操作表user_tab_0，同理userId%2 == 1的用户操作表user_tab_1

5、那么在MyBatis中sql语句如何实现呢？下面是举例查询一个用户的sql语句

其中我们传入了两个参数tabIndex和userId，tabIndex就是需要操作表的标示值（0或1），这样如果需要查询userId为5的用户，那么最终出现的sql语句就会是：

SELECT userId, name 
FROM user_tab_1 
WHERE userId = 5

其他多余的DAO服务和实现我这里就不多展示了，相信聪明的你肯定会的。

以上就是最简单的实现，不需要多余的框架，不需要任何的插件也就满足了分表的要求。

上面基本上就是所有实现的内容了，下面就要开始详细说说分离的细节了，看热闹的基本可以散了。

我将从下面几个角度分别来说说。我尽可能用最简单的白话来说。

分离的方式

切分的方式主要有两种，水平切分和垂直切分。

1、水平切分

简单的说就是，把一张表分离成几张一模一样的表，然后表的名字不同。就和上面最简单的例子一样。

这种切分适合于一张表的数据量过大而导致操作时间变慢的情况，如保存的一些记录表。

2、垂直切分

把不同的业务模块分成不同的数据库，这些业务模块直接最好是0耦合（简单的说就是毫无关系）。

这主要是适合数据量普遍较大，而且业务场景比较分散，互相之间没有逻辑关系的情况。

分离的策略

具体的策略有很多种，你也可以设计你自己的，普遍的策略有下面几种，只是列举就不具体展开了。

1、“%”取模，也就是上面例子中实现的，也是最简单的一种。

2、MD5哈希

3、移位

4、日期时间（根据不同的日期分表，如一个月一张表，这个月就操作这张表，下个月就下张表）

5、枚举范围（用户1-10000操作第一张表，用户10001-20000操作第二张表）

分离的问题

下面说说最终要的点，导致的问题。

数据库肯定不是你说分就分的。（人家比较有感情的，怎么能说分就分呢？）

正经来说，我列举了下面几个分离只有会导致的问题。

1、添加时主键唯一性的问题；分离之后多张表，就会导致原有的自增长主键不唯一，所以没有办法自增长了，导致问题，解决方案的也是有的，比如单独维护一张主键表专门用来存放当前主键，或者说用别的中间件等。

2、新增时的效率问题，虽然不是个大问题，但是新增肯定会多了计算量嘛，这个问题可以忽略不计。

3、查询所带来的分页问题，分离成多张表之后，分页查询就很困难了，这也考虑到不同的分离用不同的解决方案，总之会产生问题。

4、同理，关联查询，原本一张表关联别的表或者别的表关联一张表，都很简单，但是现在分离之后就难了。

5、事务问题，多张表需要使用分布式事务才能完成原来带有事务的操作。因为原来的事务只是锁一张表现在可能要锁多张了呢。

6、扩展性问题，有的切分策略下，对数据的扩展性其实不好，之后如果有更多的数据来了，是说还能再新建表来扩展吗？

分离的原则

下面总结了几点分离的原则，主要是参考了网络上的，没有任何实际的依据（我也不是个年薪百万的DBA也碰不到那么大的数据去实际检验嘛），所以如果有任何问题也请指出。

1、能不分就不分

2、能分少就不分多

3、多冗余，不关联

4、避免使用分布式事务，主要是太难我也不会啊

5、单表千万记录以内就不分

6、现在不分以后分也来得及

7、扩展，耦合，仔细考虑

实现分离的方式

最后说说分离的方式，现在流行使用的DAO框架是MyBatis，也有很多别的框架。分离的实现主要有下面几种方式。

1、原生实现，就和最上面的例子一样，不需要其他任何的东西，利用原生的框架，自己去控制实现。

优点是：容易控制，掌握主动权。

缺点是：代码量多，需要自己很清楚，修改不方便，不支持复杂的切分，比如切分之后还需要做一些分页查询，还有上面说的主键问题等。

2、插件实现，利用框架本身开发的一些插件，去实现这些插件，然后利用插件去访问数据库，直接实现分离。

优点是：代码量少，实现简单，扩展性好。

缺点是：不易控制，分离方式有限，出现问题难以解决。没有找到特别成熟的插件。

3、中间件实现。利用一些数据库访问的中间件，在访问数据库之前做一些操作使得sql进行相应的变化从而实现分离。

优点是：耦合小，扩展性好，可以解决分布式事务的问题。

确定是：实现比较复杂，需要对中间件进行学习，成本较大。维护也是一个大问题，万一挂掉了。。

总之方式各有千秋，但是考虑到成本上面，第一种几乎是0成本，即可上手，而且比较容易控制，就如同最上面给出的例子一样，而且当前我处理的数据还没有到达那种处处要分离的地步，所以我选择第一种。也推荐使用。如果你找到比较好用的插件或者中间件也可以在评论中推荐。

总结

在实际项目中，我是因为用户的账户记录过多所以不得不进行分离，而且因为账户记录更多的只是新增没有修改和删除，查询也是少数，所以使用了最简单的方式进行分离，也选择了最简单的策略。希望上面的原则策略方式和问题的总结能对你有所帮助，有所参考。如果大家有任何疑问请给我留言，小编会及时回复大家的。在此也非常感谢大家对网站的支持！

推荐阅读

sql
数据库内核开发入门 | 搭建研发环境的初步指南

本课程将带你从零开始，逐步掌握数据库内核开发的基础知识和实践技能，重点介绍如何搭建OceanBase的开发环境。 ... [详细]

蜡笔小新 2024-12-27 16:38:48
sql
MySQL缓存机制深度解析

本文详细探讨了MySQL的缓存机制，包括主从复制、读写分离以及缓存同步策略等内容。通过理解这些概念和技术，读者可以更好地优化数据库性能。 ... [详细]

蜡笔小新 2024-12-26 15:15:06
sql
Hadoop入门与核心组件详解

本文详细介绍了Hadoop的基础知识及其核心组件，包括HDFS、MapReduce和YARN。通过本文，读者可以全面了解Hadoop的生态系统及应用场景。 ... [详细]

蜡笔小新 2024-12-26 13:12:48
oracle
对MariaDB未来发展的思考与担忧

本文探讨了MariaDB在当前数据库市场中的地位和挑战，分析其可能面临的困境，并提出了对未来发展的几点看法。 ... [详细]

蜡笔小新 2024-12-25 18:20:32
oracle
掌握Java EE的全面指南

探讨如何真正掌握Java EE，包括所需技能、工具和实践经验。资深软件教学总监李刚分享了对毕业生简历中常见问题的看法，并提供了详尽的标准。 ... [详细]

蜡笔小新 2024-12-25 13:38:29
sql
云计算的优势与应用场景

本文详细探讨了云计算为企业和个人带来的多种优势，包括成本节约、安全性提升、灵活性增强等。同时介绍了云计算的五大核心特点，并结合实际案例进行分析。 ... [详细]

蜡笔小新 2024-12-23 13:54:13
sql
PostgreSQL 中批量更新多行记录的高效方法

本文介绍了如何使用 PostgreSQL 的 `UPDATE ... FROM` 语法，通过映射表实现对多行记录进行高效的批量更新。这种方法不仅适用于单列更新，还支持多列的同时更新。 ... [详细]

蜡笔小新 2024-12-28 12:51:58
数据库
架构师：产品与人的平衡之道

探讨架构师在项目中应如何平衡对产品的关注和对团队成员的关注，以实现最佳的开发成果。 ... [详细]

蜡笔小新 2024-12-24 19:41:40
数据库
深入解析 Apache Flink 的保存点机制

在本周的白板演练中，Apache Flink 的 PMC 成员及数据工匠首席技术官 Stephan Ewen 深入探讨了如何利用保存点功能进行流处理中的数据重新处理、错误修复、系统升级和 A/B 测试。本文将详细解释保存点的工作原理及其应用场景。 ... [详细]

蜡笔小新 2024-12-24 16:57:24
数据库
技术变现之道：从日常工作中挖掘潜力

本文探讨了如何在日常工作中通过优化效率和深入研究核心技术，将技术和知识转化为实际收益。文章结合个人经验，分享了提高工作效率、掌握高价值技能以及选择合适工作环境的方法，帮助读者更好地实现技术变现。 ... [详细]

蜡笔小新 2024-12-24 15:21:23
memcached
深入理解一致性哈希算法及其应用

本文详细介绍了分布式系统中的一致性哈希算法，探讨其原理、优势及应用场景，帮助读者全面掌握这一关键技术。 ... [详细]

蜡笔小新 2024-12-24 14:08:10
oracle
Java时代的淘宝技术演进

本文探讨了2012年4月期间，淘宝在技术架构上的关键数据和发展历程。涵盖了从早期PHP到Java的转型，以及在分布式计算、存储和网络流量管理方面的创新。 ... [详细]

蜡笔小新 2024-12-24 12:12:13
数据库
2018 区块链技术峰会：专家深度解析核心技术与应用前景

2018年3月31日，CSDN、火星财经联合中关村区块链产业联盟等机构举办的2018区块链技术及应用峰会（BTA）核心分会场圆满举行。多位业内顶尖专家深入探讨了区块链的核心技术原理及其在实际业务中的应用。 ... [详细]

蜡笔小新 2024-12-24 10:56:15
数据库
深入解析网络存储技术

本文详细介绍了网络存储技术的基本概念、分类及应用场景。通过分析直连式存储（DAS）、网络附加存储（NAS）和存储区域网络（SAN）的特点，帮助读者理解不同存储方式的优势与局限性。 ... [详细]

蜡笔小新 2024-12-24 10:38:34
数据库
构建大数据生态系统：分布式存储与运算

本文探讨了大数据生态系统的构建，重点介绍其分布式存储和运算机制，并补充相关技术及应用场景。 ... [详细]

蜡笔小新 2024-12-24 09:42:44

残破的前进

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章