分库分表ShardingJDBC(详解1/6)

作者：情之瞬 | 来源：互联网 | 2023-10-14 15:58

狂创客圈经典图书：《NettyZookeeperRedis高并发实战》面试必备+面试必备+面试必备【博客园总入口】疯狂创客圈经典图书：《SpringCloud、Nginx高并发核心

狂创客圈经典图书：《Netty Zookeeper Redis 高并发实战》面试必备 + 面试必备 + 面试必备【博客园总入口】
疯狂创客圈经典图书：《SpringCloud、Nginx高并发核心编程》大厂必备 + 大厂必备 + 大厂必备【博客园总入口】
入大厂+涨工资必备：高并发【亿级流量IM实战】实战系列【 SpringCloud Nginx秒杀】实战系列【博客园总入口】

目录：分库分表 Sharding-JDBC从入门到精通

主题	链接地址
准备1：在window安装虚拟机集群	分布式虚拟机 linux 环境制作 GO
准备2：在虚拟机的各个节点有 mysql	centos mysql 笔记（内含vagrant mysql 镜像）GO

分库分表 -Sharding-JDBC- 从入门到精通 1	Sharding-JDBC 分库、分表（入门实战) GO
分库分表 -Sharding-JDBC- 从入门到精通 2	Sharding-JDBC 基础知识 GO
分库分表 Sharding-JDBC 从入门到精通之 3	自定义主键、分布式雪花主键，原理与实战 GO
分库分表 -Sharding-JDBC- 从入门到精通 4	MYSQL集群主从复制，原理与实战 GO
分库分表 Sharding-JDBC 从入门到精通之 5	读写分离实战 GO
分库分表 Sharding-JDBC 从入门到精通之 6	Sharding-JDBC执行原理 GO
分库分表 Sharding-JDBC 从入门到精通之源码	git仓库地址GO

1.有关Sharding-JDBC

有关Sharding-JDBC介绍这里就不在多说，之前Sharding-JDBC是当当网自研的关系型数据库的水平扩展框架，现在已经捐献给Apache，其原理请参见后面的博客。

shardingsphere文档地址是：https://shardingsphere.apache.org/document/current/cn/overview/。

2 Sharding-JDBC 实战的场景

在深入了解之前，先实战一把，增加印象，激发兴趣。

一般情况下，大家都会使用水平切分库和表：将一张表水平切分成多张表，还可以放到多个库中。这就涉及到数据分片的规则，比较常见的有：Hash取模分表、数值Range分表、一致性Hash算法分表。

1、Hash取模分表

概念一般采用Hash取模的切分方式，例如：假设按goods_id分4张表。（goods_id%4 取整确定表）

优点

数据分片相对比较均匀，不容易出现热点和并发访问的瓶颈。

缺点

后期分片集群扩容时，需要迁移旧的数据很难。
容易面临跨分片查询的复杂问题。比如上例中，如果频繁用到的查询条件中不带goods_id时,将会导致无法定位数据库,从而需要同时向4个库发起查询，
再在内存中合并数据，取最小集返回给应用，分库反而成为拖累。

2、数值Range分表

概念按照时间区间或ID区间来切分。例如：将goods_id为11000的记录分到第一个表，10012000的分到第二个表，以此类推。

优点

单表大小可控
天然便于水平扩展，后期如果想对整个分片集群扩容时，只需要添加节点即可，无需对其他分片的数据进行迁移
使用分片字段进行范围查找时，连续分片可快速定位分片进行快速查询，有效避免跨分片查询的问题。

缺点

热点数据成为性能瓶颈。
例如按时间字段分片，有些分片存储最近时间段内的数据，可能会被频繁的读写，而有些分片存储的历史数据，则很少被查询

3、一致性Hash算法

一致性Hash算法能很好的解决因为Hash取模而产生的分片集群扩容时，需要迁移旧的数据的难题。至于具体原理这里就不详细说，

可以参考一篇博客：一致性哈希算法(分库分表，负载均衡等)

4、实战：简单的Hash取模分表

假设一个订单表的user_id和order_id 分布较为均匀，按照1000W的数据规模，可以使用如下的分库、分表结构来保存：

db0 ├── t_order0 └── t_order1 db1 ├── t_order0 └── t_order1

简单的进行分库分表：按照user_id %2 的规则进行分库，按照 order_id %2 的规则进行分表

3 库表的结构设计：

3.1 逻辑订单表

逻辑订单表的结构如下：

3.2 节点1 （cdh1）上的订单库

DROP TABLE IF EXISTS `t_order_0`; DROP TABLE IF EXISTS `t_order_1`; DROP TABLE IF EXISTS `t_config`; CREATE TABLE `t_order_0` (`order_id` bigInt NOT NULL, `user_id` INT NOT NULL, `status` VARCHAR(45) NULL, PRIMARY KEY (`order_id`)); CREATE TABLE `t_order_1` (`order_id` bigInt NOT NULL, `user_id` INT NOT NULL, `status` VARCHAR(45) NULL, PRIMARY KEY (`order_id`));

3.3 节点2 （cdh2）上的订单库

两个db上，都有t_order_0，和t_order_1两个表

4 Sharding-JDBC 分库分表配置

分库

本文分库样例比较简单，根据数据库表中字段user_id%2进行判断，如果user_id%2==0则使用ds0，否则使用ds1。

分表

分样例比较简单，根据数据库表中字段order_id%2进行判断，如果order_id%2==0则使用t_order_0，否则使用t_order_1。

对 t_order 表进行的如下图所示的数据表水平分库和分表,具体如下图所示：

5.4 服务层

在这里插入图片描述

更多详细内容请参见源码工程。

5.4 Controller

接下来创建一个Controller进行测试，保存方法使用了插入数据和查看数据，根据我们的规则，会每个库插入数据，同时我这里还创建了一个查询方法，查询全部订单。

package com.crazymaker.springcloud.sharding.jdbc.demo.controller; @RestController @RequestMapping("/api/sharding/") @Api(tags = "sharding jdbc 演示") public class ShardingJdbcController { @Resource JpaEntityService jpaEntityService; @PostMapping("/order/add/v1") @ApiOperation(value = "插入订单") public RestOut orderAdd(@RequestBody Order dto) { jpaEntityService.addOrder(dto); return RestOut.success(dto); } @PostMapping("/order/list/v1") @ApiOperation(value = "查询订单") public RestOut> listAll() { List list = jpaEntityService.selectAll(); return RestOut.success(list); } }
6 执行测试

6.1 打开swagger

启动应用。

然后，在浏览器或HTTP请求工具访问http://localhost:7700/sharding-jdbc-provider/swagger-ui.html，如图所示

在这里插入图片描述

6.2 加入两条数据

在这里插入图片描述

使用插入订单的接口，可以插入订单，注意 userid %2 ==0 进入 db1，注意 userid %2 ==1进入 db2，具体在哪个表呢？

因为 orderid是通过雪花算法生成的，如果orderid%2==0 ，则进入t_order_0，否则使用t_order_1。

插入之后，可以通过数据库，看结果。具体如下图：

在这里插入图片描述

6.3 查看数据

在这里插入图片描述

使用程序的查询全部的方法，shardingjdbc ，会查出所有的订单。

7 总结

使用shardingjdbc ，除了数据源的配置有些特殊的规则外，持久层程序和普通的 JPA代码，区别并不大。

当然，如果要实现特殊的分库分表逻辑，还是需要动代码的，请看后续分解。

回到◀疯狂创客圈▶

疯狂创客圈 - Java高并发研习社群，为大家开启大厂之门

推荐阅读

js
我的读书清单（持续更新）

我的读书清单（持续更新）201705311.《一千零一夜》2006（四五年级）2.《中华上下五千年》2008（初一）3.《鲁滨孙漂流记》2008（初二）4.《钢铁是怎样炼成的》20 ... [详细]

蜡笔小新 2024-11-21 13:01:23
ip
Nacos 0.3 数据持久化详解与实践

本文详细介绍了如何将 Nacos 0.3 的数据持久化到 MySQL 数据库，并提供了具体的步骤和注意事项。 ... [详细]

蜡笔小新 2024-11-14 18:26:40
js
秒建一个后台管理系统？用这5个开源免费的Java项目就够了

秒建一个后台管理系统？用这5个开源免费的Java项目就够了 ... [详细]

蜡笔小新 2024-11-12 03:21:33
ip
阿里巴巴终面技术挑战：如何利用 UDP 实现 TCP 功能？

在阿里巴巴的技术面试中，技术总监曾提出一道关于如何利用 UDP 实现 TCP 功能的问题。当时回答得不够理想，因此事后进行了详细总结。通过与总监的进一步交流，了解到这是一道常见的阿里面试题。面试官的主要目的是考察应聘者对 UDP 和 TCP 在原理上的差异的理解，以及如何通过 UDP 实现类似 TCP 的可靠传输机制。 ... [详细]

蜡笔小新 2024-11-11 11:50:49
jar
2021年Java开发实战：当前时间戳转换方法详解与实用网址推荐

在当前的就业市场中，金九银十过后，金三银四也即将到来。本文将分享一些实用的面试技巧和题目，特别是针对正在寻找新工作机会的Java开发者。作者在准备字节跳动的面试过程中积累了丰富的经验，并成功获得了Offer。文中详细介绍了如何将当前时间戳进行转换的方法，并推荐了一些实用的在线资源，帮助读者更好地应对技术面试。 ... [详细]

蜡笔小新 2024-11-08 22:43:32
tree
2019年后蚂蚁集团与拼多多面试经验详述与深度剖析

2019年后蚂蚁集团与拼多多面试经验详述与深度剖析 ... [详细]

蜡笔小新 2024-10-30 17:30:06
tree
MIT 6.824 实验笔记：MapReduce 开发指南

本文详细记录了 MIT 6.824 课程中 MapReduce 实验的开发过程，包括环境搭建、实验步骤和具体实现方法。 ... [详细]

蜡笔小新 2024-11-18 12:05:23
web
Java开发岗位及其职责详解

Java作为全球最流行的编程语言之一，应用广泛。本文将详细介绍Java开发的相关岗位及其具体职责，帮助读者更好地了解这一领域的职业发展路径。 ... [详细]

蜡笔小新 2024-11-16 09:47:03
tree
Java 网站开发指南

本文详细介绍了 Java 网站开发的相关资源和步骤，包括常用网站、开发环境和框架选择。 ... [详细]

蜡笔小新 2024-11-14 22:39:58
tree
Spring Cloud 学习指南：初学者入门篇

Spring Cloud 学习指南：初学者入门篇 ... [详细]

蜡笔小新 2024-11-11 12:40:04
tree
优化后的标题：深入探讨网关安全：将微服务升级为OAuth2资源服务器的最佳实践

本文深入探讨了如何将微服务升级为OAuth2资源服务器，以订单服务为例，详细介绍了在POM文件中添加 `spring-cloud-starter-oauth2` 依赖，并配置Spring Security以实现对微服务的保护。通过这一过程，不仅增强了系统的安全性，还提高了资源访问的可控性和灵活性。文章还讨论了最佳实践，包括如何配置OAuth2客户端和资源服务器，以及如何处理常见的安全问题和错误。 ... [详细]

蜡笔小新 2024-11-09 16:13:27
java
观察 | 求职体验：收到录用通知的公司通常不深究技术细节，而那些详细追问的公司往往没有后续进展

观察 | 求职体验：收到录用通知的公司通常不深究技术细节，而那些详细追问的公司往往没有后续进展 ... [详细]

蜡笔小新 2024-11-08 12:52:17
java
Kafka安装与配置深度解析：程序员必备指南

Kafka 是由 Apache 软件基金会开发的高性能分布式消息系统，支持高吞吐量的发布和订阅功能，主要使用 Scala 和 Java 编写。本文将深入解析 Kafka 的安装与配置过程，为程序员提供详尽的操作指南，涵盖从环境准备到集群搭建的每一个关键步骤。 ... [详细]

蜡笔小新 2024-11-07 12:22:05
web
第二章：Kafka基础入门与核心概念解析

本章节主要介绍了Kafka的基本概念及其核心特性。Kafka是一种分布式消息发布和订阅系统，以其卓越的性能和高吞吐量而著称。最初，Kafka被设计用于LinkedIn的活动流和运营数据处理，旨在高效地管理和传输大规模的数据流。这些数据主要包括用户活动记录、系统日志和其他实时信息。通过深入解析Kafka的设计原理和应用场景，读者将能够更好地理解其在现代大数据架构中的重要地位。 ... [详细]

蜡笔小新 2024-11-06 11:10:03
tree
【并发编程】全面解析 Java 内存模型，一篇文章带你彻底掌握

本文深入解析了 Java 内存模型（JMM），从基础概念到高级特性进行全面讲解，帮助读者彻底掌握 JMM 的核心原理和应用技巧。通过详细分析内存可见性、原子性和有序性等问题，结合实际代码示例，使开发者能够更好地理解和优化多线程并发程序。 ... [详细]

蜡笔小新 2024-11-02 09:09:51

情之瞬

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章