分库分表实践-Sharding-JDBC

作者：自娱自乐GoGo | 来源：互联网 | 2023-10-10 08:50

最近一段时间在研究分库分表的一些问题，正好周末有点时间就简单做下总结，也方便自己以后查看。关于为什么要做分库分表，什么是水平分表，垂直分表等概念，相信大家都知道，这里就不在赘述了。本文只讲述使用Sharding-JDBC做分库分表的一些实践经验，如果有错误欢迎大家指出。

最近一段时间在研究分库分表的一些问题，正好周末有点时间就简单做下总结，也方便自己以后查看。

关于为什么要做分库分表，什么是水平分表，垂直分表等概念，相信大家都知道，这里就不在赘述了。

本文只讲述使用Sharding-JDBC做分库分表的一些实践经验，如果有错误欢迎大家指出。

什么是Sharding-JDBC

Sharding-jdbc是当当网开源的一款 客户端代理 中间件。Sharding-jdbc包含分库分片和读写分离功能。对应用的代码没有侵入型，几乎没有任何改动，兼容主流orm框架，主流数据库连接池。目前属于Apache的孵化项目ShardingSphere。

Sharding-jdbc定位为轻量级 Java 框架，在Java的JDBC层提供的额外服务。它使用客户端直连数据库，以jar包形式提供服务，无需额外部署和依赖，可理解为增强版的JDBC驱动，完全兼容JDBC和各种ORM框架。

适用于任何基于JDBC的ORM框架，如：JPA, Hibernate, Mybatis, Spring JDBC Template或直接使用JDBC。

支持任何第三方的数据库连接池，如：DBCP, C3P0, BoneCP, Druid, HikariCP等。

支持任意实现JDBC规范的数据库。目前支持MySQL，Oracle，SQLServer，PostgreSQL以及任何遵循 SQL 92标准的数据库。

官方文档地址

ShardingSphere： https://shardingsphere.apache.org/

GitHub的地址： https://github.com/apache/incubator-shardingsphere

一些建议和说明

不过我这里建议大家可以简单过下官方文档，因为文档并不全面或者说感觉并不是最新的。

建议大家重点可以放在git上官方的examples

目前官方最新的版本是4.0，如果使用springboot创建，可以使用下面的依赖即可。


    org.apache.shardingsphere
    sharding-jdbc-spring-boot-starter
    4.0.0

Sharding-jdbc功能强大，但是本文重点在于下面几点，未涉及的地方可以翻阅文档查看。

1、单库分表

2、分库分表（含分库单表）

3、分表后的查询

4、分表事务处理

无论上述哪种分库亦或是分表类型，核心无非是下面几个配置：

1、配置数据源，明确你有多少个数据源

2、定义表名，分表的逻辑表名（t_order）和所有物理表名(t_order_0,t_order_1)

3、定义分库列以及分库算法

4、定义分表列以及分表算法

代码实现

单库分表

sharding-jdbc优势就是对代码没有侵入性，基本上不用动我们原来的代码，只是将相关数据库连接的配置更换为sharding的配置即可。

以我的个人实践项目为例：

原来不分表时的配置：

#项目配置
spring:
  #数据连接配置
  datasource:
    driver-class-name: com.mysql.cj.jdbc.Driver
    url: jdbc:mysql://xxx.xx.xx.xx:3306/yyms?characterEncoding=UTF-8&serverTimezOne=Asia/Shanghai
    username: xxx
    password: xxx

使用sharding后的配置

# 分表配置
spring:
  shardingsphere:
    datasource:
      names: yyms
      yyms:
        type: com.zaxxer.hikari.HikariDataSource
        driver-class-name: com.mysql.cj.jdbc.Driver
        jdbc-url: jdbc:mysql://xxx.xx.xx.xx:3306/yyms?characterEncoding=UTF-8&serverTimezOne=Asia/Shanghai
        username: xx
        password: xxx
    sharding:
      tables:
        # 表名
        sys_log:
          actual-data-nodes: yyms.sys_log_$->{0..1}
          # 分表配置，根据id分表
          table-strategy:
            inline:
              sharding-column: id
              algorithm-expression: sys_log_$->{id % 2}
          # 配置字段的生成策略，column为字段名，type为生成策略，sharding默认提供SNOWFLAKE和UUID两种，可以自己实现其他策略
          key-generator:
            column: id
            type: SNOWFLAKE
    props:
      sql:
        show: true

上面的配置基本上就实现了单库对sys_log表的拆分，根据id取模算法，拆分为sys_log_0和sys_log_1两张表。代码层面没有任何改动就实现了拆分，拆分后效果图如下。

注意哦，sys_log表拆分后是实际不存在的。

当然了，使用官方的默认配置很多时候并不能满足我们的需求。

假如拿到一条数据的id后再去计算数据在哪个库，无疑对我们日常的运维维护工作造成极大的不便。这里我们可以通过一些简单的自定义开发配置实现。

比如我想要id最后一位展示数据所处表所在序号。

多库分表

先展示个多库单表的案例

spring:
  shardingsphere:
    datasource:
      names: ds0,ds1
      ds_1:
        type: com.zaxxer.hikari.HikariDataSource
        driver-class-name: com.mysql.cj.jdbc.Driver
        jdbc-url: jdbc:mysql://xxxxxx:3306/ds1?characterEncoding=UTF-8&serverTimezOne=Asia/Shanghai
        username: xxxx
        password: xxx
      ds0:
        type: com.zaxxer.hikari.HikariDataSource
        driver-class-name: com.mysql.cj.jdbc.Driver
        jdbc-url: jdbc:mysql://xxxxx:3306/ds0?characterEncoding=UTF-8&serverTimezOne=Asia/Shanghai
        username: xxxx
        password: xxxx
    sharding:
      default-data-source-name: ds0
      default-database-strategy:
        inline:
          sharding-column: id
          algorithm-expression: ds$->{id % 2}
      tables:
        sys_log:
          actual-data-nodes: ds$->{0..1}.sys_log
          key-generator:
            column: id
            type: SNOWFLAKE
            props:
              worker:
                id: 123

把单张表拆分到多个库，同样使用sys_log。效果图如下：

其实分库分表无非就是上面两种模式的集合，具体配置的选项，可以参考官方案例配置》》》我是链接

分库分表后的查询

select * from sys_log where id='444271380247588864'

接着上面的案例，以上面的语句为例，id为分库列，sharding经过解析后定位到对应的数据源，直接执行下面的查询。

select * from sys_log where id='444271380247588864'

假如我们的查询调节不包含分库列，以下面的语句为例：

select * from sys_log where user_name='zhangsan

执行后出现两条sql语句。我们在两个库均为5条数据，查询后的结果集为10条数据，符合我们的预期。

数据库：

结果集：

结论：当搜索条件含有分库列（分表列），这时候sharing会首先调用分库分表策略类，直接找到对应的数据库和对应子表。而当搜索条件不含有分库列时，这时候引擎就不会再调用策略类了，而是会直接认定目标库为全部库或表，上述案例中目标库就是，[ds0，ds1]两个数据源，既然目标库有两个，后面生成的DataNode，TableUnits，PreparedStatementUnit 将是以前数量的两倍，所以这回，引擎最终将会发起多个sql语句的并发执行，并合并最终的结果再返回。

分库分表后的事务

Sharding-Sphere同时支持XA和柔性事务，它允许每次对数据库的访问，可以自由选择事务类型。分布式事务对业务操作完全透明，极大地降低了引入分布式事务的成本。

分布式事务我感觉在官方的文档和案例中写的已经是比较完善的了，这里大家可以参考：我是链接官方案例实现，这里就不在赘述了。

最后是项目的参考代码： https://github.com/allanzhuo/yyms

以上所述就是小编给大家介绍的《分库分表实践-Sharding-JDBC》，希望对大家有所帮助，如果大家有任何疑问请给我留言，小编会及时回复大家的。在此也非常感谢大家对我们的支持！

推荐阅读

go
理解浏览器历史记录（2）hashchange、pushState

阅读目录1.hashchange2.pushState本文也是一篇基础文章。继上文之后，本打算去研究pushState，偶然在一些信息中发现了锚点变 ... [详细]

蜡笔小新 2024-11-20 20:05:37
main
探索阿里巴巴的开源世界

从理想主义者的内心深处萌发的技术信仰，推动了云原生技术在全球范围内的快速发展。本文将带你深入了解阿里巴巴在开源领域的贡献与成就。 ... [详细]

蜡笔小新 2024-11-21 09:06:54
main
Centos7 Tomcat9 安装笔记

centos7,tom ... [详细]

蜡笔小新 2024-11-17 18:15:16
main
Java 中的十进制样式 getZeroDigit()方法，示例

Java 中的十进制样式 getZeroDigit()方法，示例 ... [详细]

蜡笔小新 2024-11-21 16:53:03
main
Singleton单例模式和DoubleChecked Locking双重检查锁定模式

问题描述现在，不管开发一个多大的系统（至少我现在的部门是这样的），都会带一个日志功能；在实际开发过程中 ... [详细]

蜡笔小新 2024-11-21 15:14:45
go
CRZ.im：一款极简的网址缩短服务及其安装指南

本文介绍了一款名为CRZ.im的极简网址缩短服务，该服务采用PHP和SQLite开发，体积小巧，约10KB。本文还提供了详细的安装步骤，包括环境配置、域名解析及Nginx伪静态设置。 ... [详细]

蜡笔小新 2024-11-21 13:50:47
main
Web动态服务器Python基本实现

Web动态服务器Python基本实现 ... [详细]

蜡笔小新 2024-11-21 08:01:30
go
设置Shadowsocks公共代理的关键步骤

本文详细介绍了如何正确设置Shadowsocks公共代理，包括调整超时设置、检查系统限制、防止滥用及遵守DMCA法规等关键步骤。 ... [详细]

蜡笔小新 2024-11-20 20:41:33
main
Jupyter Notebook多语言环境搭建指南

本文详细介绍了如何在Linux环境下为Jupyter Notebook配置Python、Python3、R及Go四种编程语言的环境，包括必要的软件安装和配置步骤。 ... [详细]

蜡笔小新 2024-11-20 18:37:27
go
深入解析WebP图片格式及其应用

随着互联网技术的发展，无论是PC端还是移动端，图片数据流量占据了很大比重。尤其在高分辨率屏幕普及的背景下，如何在保证图片质量的同时减少文件大小，成为了亟待解决的问题。本文将详细介绍Google推出的WebP图片格式，探讨其在实际项目中的应用及优化策略。 ... [详细]

蜡笔小新 2024-11-20 16:31:47
go
购物车系统V0612：用户登录与购物实现

本文档详细介绍了购物车系统V0612版中的用户登录机制及购物功能实现方法。 ... [详细]

蜡笔小新 2024-11-20 11:00:44
int
解决PHP及Web开发中的UTF-8乱码问题

本文详细探讨了在Web开发中常见的UTF-8编码问题及其解决方案，包括HTML页面、PHP脚本、MySQL数据库以及JavaScript和Flash应用中的乱码问题。 ... [详细]

蜡笔小新 2024-11-20 10:58:03
future
深入解析 Java 中 org.w3c.dom.Node.isEqualNode() 方法及其应用实例

本文详细介绍了 Java 中 org.w3c.dom.Node 类的 isEqualNode() 方法的功能、参数及返回值，并通过多个实际代码示例来展示其具体应用。此方法用于检测两个节点是否相等，而不仅仅是判断它们是否为同一个对象。 ... [详细]

蜡笔小新 2024-11-19 18:11:10
int
spring(22)JdbcTemplate

2019独角兽企业重金招聘Python工程师标准###1.导入jar包，必须jar包：c3p0、mysql-connector、beans、con ... [详细]

蜡笔小新 2024-11-18 19:49:32
int
PHP 基础与数据库操作

本文介绍了 PHP 的基本概念、服务器与客户端的工作原理，以及 PHP 如何与数据库交互。同时，还涵盖了常见的数据库操作和安全性问题。 ... [详细]

蜡笔小新 2024-11-17 15:45:08

自娱自乐GoGo

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章