当前位置: 开发笔记 > 编程语言 > 正文

MySQL分区表和HBase的关系是什么

作者：陈陈 | 来源：互联网 | 2023-05-17 09:18

MySQL分区表和HBase的关系是什么，针对这个问题，这篇文章详细介绍了相对应的分析和解答，希望可以帮助更多想解决这个问题的小伙伴找到更简单

MySQL分区表和HBase的关系是什么，针对这个问题，这篇文章详细介绍了相对应的分析和解答，希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。

　　创建 MySQL 分区数据

　　DROP TABLE ord_order;

　　-- 创建订单分区表

　　CREATE TABLE ord_order(

　　order_id BIGINT NOT NULL AUTO_INCREMENT COMMENT &＃39;订单ID&＃39;,

　　user_id INT NOT NULL COMMENT &＃39;用户ID&＃39;,

　　goods_id INT NOT NULL COMMENT &＃39;商品ID&＃39;,

　　order_price INT NOT NULL DEFAULT 0 COMMENT &＃39;订单实际价格(分)&＃39;,

　　create_time DATETIME NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT &＃39;创建时间&＃39;,

　　PRIMARY KEY(order_id, create_time)

　　)

　　PARTITION BY LIST (YEAR(create_time)*100 + MONTH(create_time))

　　(

　　PARTITION p201601 VALUES IN (201601),

　　PARTITION p201602 VALUES IN (201602),

　　PARTITION p201603 VALUES IN (201603),

　　PARTITION p201604 VALUES IN (201604),

　　PARTITION p201605 VALUES IN (201605),

　　PARTITION p201606 VALUES IN (201606),

　　PARTITION p201607 VALUES IN (201607),

　　PARTITION p201608 VALUES IN (201608),

　　PARTITION p201609 VALUES IN (201609),

　　PARTITION p201610 VALUES IN (201610),

　　PARTITION p201611 VALUES IN (201611),

　　PARTITION p201612 VALUES IN (201612)

　　);

　　-- 插入相关数据

　　INSERT INTO ord_order VALUES

　　(NULL, 10000001, 11111111, 1000, &＃39;2016-01-13 01:00:10&＃39;),

　　(NULL, 10000001, 11111112, 2000, &＃39;2016-01-13 02:00:20&＃39;),

　　(NULL, 10000001, 11111113, 3000, &＃39;2016-01-13 03:00:30&＃39;),

　　(NULL, 10000001, 11111114, 4000, &＃39;2016-01-13 04:00:40&＃39;),

　　(NULL, 10000001, 11111115, 5000, &＃39;2016-01-13 05:00:50&＃39;),

　　(NULL, 10000001, 11111111, 1000, &＃39;2016-02-13 01:00:10&＃39;),

　　(NULL, 10000001, 11111112, 2000, &＃39;2016-02-13 02:00:20&＃39;),

　　(NULL, 10000001, 11111113, 3000, &＃39;2016-02-13 03:00:30&＃39;),

　　(NULL, 10000001, 11111114, 4000, &＃39;2016-02-13 04:00:40&＃39;),

　　(NULL, 10000001, 11111115, 5000, &＃39;2016-02-13 05:00:50&＃39;),

　　(NULL, 10000001, 11111111, 1000, &＃39;2016-03-13 01:00:10&＃39;),

　　(NULL, 10000001, 11111112, 2000, &＃39;2016-03-13 02:00:20&＃39;),

　　(NULL, 10000001, 11111113, 3000, &＃39;2016-03-13 03:00:30&＃39;),

　　(NULL, 10000001, 11111114, 4000, &＃39;2016-03-13 04:00:40&＃39;),

　　(NULL, 10000001, 11111115, 5000, &＃39;2016-03-13 05:00:50&＃39;),

　　(NULL, 10000001, 11111111, 1000, &＃39;2016-04-13 01:00:10&＃39;),

　　(NULL, 10000001, 11111112, 2000, &＃39;2016-04-13 02:00:20&＃39;),

　　(NULL, 10000001, 11111113, 3000, &＃39;2016-04-13 03:00:30&＃39;),

　　(NULL, 10000001, 11111114, 4000, &＃39;2016-04-13 04:00:40&＃39;),

　　(NULL, 10000001, 11111115, 5000, &＃39;2016-04-13 05:00:50&＃39;),

　　(NULL, 10000001, 11111111, 1000, &＃39;2016-05-13 01:00:10&＃39;),

　　(NULL, 10000001, 11111112, 2000, &＃39;2016-05-13 02:00:20&＃39;),

　　(NULL, 10000001, 11111113, 3000, &＃39;2016-05-13 03:00:30&＃39;),

　　(NULL, 10000001, 11111114, 4000, &＃39;2016-05-13 04:00:40&＃39;),

　　(NULL, 10000001, 11111115, 5000, &＃39;2016-05-13 05:00:50&＃39;),

　　(NULL, 10000001, 11111111, 1000, &＃39;2016-06-13 01:00:10&＃39;),

　　(NULL, 10000001, 11111112, 2000, &＃39;2016-06-13 02:00:20&＃39;),

　　(NULL, 10000001, 11111113, 3000, &＃39;2016-06-13 03:00:30&＃39;),

　　(NULL, 10000001, 11111114, 4000, &＃39;2016-06-13 04:00:40&＃39;),

　　(NULL, 10000001, 11111115, 5000, &＃39;2016-06-13 05:00:50&＃39;),

　　(NULL, 10000001, 11111111, 1000, &＃39;2016-07-13 01:00:10&＃39;),

　　(NULL, 10000001, 11111112, 2000, &＃39;2016-07-13 02:00:20&＃39;),

　　(NULL, 10000001, 11111113, 3000, &＃39;2016-07-13 03:00:30&＃39;),

　　(NULL, 10000001, 11111114, 4000, &＃39;2016-07-13 04:00:40&＃39;),

　　(NULL, 10000001, 11111115, 5000, &＃39;2016-07-13 05:00:50&＃39;),

　　(NULL, 10000001, 11111111, 1000, &＃39;2016-08-13 01:00:10&＃39;),

　　(NULL, 10000001, 11111112, 2000, &＃39;2016-08-13 02:00:20&＃39;),

　　(NULL, 10000001, 11111113, 3000, &＃39;2016-08-13 03:00:30&＃39;),

　　(NULL, 10000001, 11111114, 4000, &＃39;2016-08-13 04:00:40&＃39;),

　　(NULL, 10000001, 11111115, 5000, &＃39;2016-08-13 05:00:50&＃39;),

　　(NULL, 10000001, 11111111, 1000, &＃39;2016-09-13 01:00:10&＃39;),

　　(NULL, 10000001, 11111112, 2000, &＃39;2016-09-13 02:00:20&＃39;),

　　(NULL, 10000001, 11111113, 3000, &＃39;2016-09-13 03:00:30&＃39;),

　　(NULL, 10000001, 11111114, 4000, &＃39;2016-09-13 04:00:40&＃39;),

　　(NULL, 10000001, 11111115, 5000, &＃39;2016-09-13 05:00:50&＃39;),

　　(NULL, 10000001, 11111111, 1000, &＃39;2016-10-13 01:00:10&＃39;),

　　(NULL, 10000001, 11111112, 2000, &＃39;2016-10-13 02:00:20&＃39;),

　　(NULL, 10000001, 11111113, 3000, &＃39;2016-10-13 03:00:30&＃39;),

　　(NULL, 10000001, 11111114, 4000, &＃39;2016-10-13 04:00:40&＃39;),

　　(NULL, 10000001, 11111115, 5000, &＃39;2016-10-13 05:00:50&＃39;),

　　(NULL, 10000001, 11111111, 1000, &＃39;2016-11-13 01:00:10&＃39;),

　　(NULL, 10000001, 11111112, 2000, &＃39;2016-11-13 02:00:20&＃39;),

　　(NULL, 10000001, 11111113, 3000, &＃39;2016-11-13 03:00:30&＃39;),

　　(NULL, 10000001, 11111114, 4000, &＃39;2016-11-13 04:00:40&＃39;),

　　(NULL, 10000001, 11111115, 5000, &＃39;2016-11-13 05:00:50&＃39;),

　　(NULL, 10000001, 11111111, 1000, &＃39;2016-12-13 01:00:10&＃39;),

　　(NULL, 10000001, 11111112, 2000, &＃39;2016-12-13 02:00:20&＃39;),

　　(NULL, 10000001, 11111113, 3000, &＃39;2016-12-13 03:00:30&＃39;),

　　(NULL, 10000001, 11111114, 4000, &＃39;2016-12-13 04:00:40&＃39;),

　　(NULL, 10000001, 11111115, 5000, &＃39;2016-12-13 05:00:50&＃39;);

　　-- 查看分区p201601数据

　　SELECT * FROM ord_order PARTITION(p201601);

　　-- 组合成的 row key

　　SELECT CONCAT(user_id, 10000000000-UNIX_TIMESTAMP(create_time), goods_id)

　　FROM ord_order PARTITION(p201601);

　　结合HBase咯

　　创建HBase表 ord_order

　　由于版本兼容的问题，这边我需要先创建好HBase对应的表。不然会报不能自动创建 column family 的错误。

　　使用 hbase shell 创建 ord_order 表

　hbase(main):033:0> create &＃39;ord_order&＃39;, {NAME => &＃39;cf1&＃39;}

　　使用 Sqoop 将MySQL的ord_order 表的 p201601 分区的数据导入HBase表。

　　/usr/local/sqoop/bin/sqoop import \

　　--connect jdbc:mysql://192.168.137.11:3306/test \

　　--username HH \

　　--password oracle \

　　--query &＃39;SELECT CONCAT(user_id, 10000000000-UNIX_TIMESTAMP(create_time), goods_id) AS order_id, order_price, create_time FROM ord_order PARTITION(p201601) WHERE $CONDITIONS&＃39; \

　　--hbase-table ord_order \

　　--hbase-create-table \

　　--hbase-row-key order_id \

　　--split-by order_id \

　　--column-family cf1 \

　　-m 1

　　导入成功后就可以在MySQL上面将相关分区删除，并且创建之后需要的分区:

　　ALTER TABLE ord_order

　　ADD PARTITION (PARTITION p201701 VALUES IN (201701));

　　ALTER TABLE ord_order DROP PARTITION p201601;

　　查看Hbase中导入的数据

　　hbase(main):001:0> scan &＃39;ord_order&＃39;

　　ROW COLUMN+CELL

　　10000001854736755011111115 column=cf1:create_time, timestamp=1479224942888, value=2016-01-13 05:00:50.0

　　10000001854736755011111115 column=cf1:order_price, timestamp=1479224942888, value=5000

　　10000001854737116011111114 column=cf1:create_time, timestamp=1479224942888, value=2016-01-13 04:00:40.0

　　10000001854737116011111114 column=cf1:order_price, timestamp=1479224942888, value=4000

　　10000001854737477011111113 column=cf1:create_time, timestamp=1479224942888, value=2016-01-13 03:00:30.0

　　10000001854737477011111113 column=cf1:order_price, timestamp=1479224942888, value=3000

　　10000001854737838011111112 column=cf1:create_time, timestamp=1479224942888, value=2016-01-13 02:00:20.0

　　10000001854737838011111112 column=cf1:order_price, timestamp=1479224942888, value=2000

　　10000001854738199011111111 column=cf1:create_time, timestamp=1479224942888, value=2016-01-13 01:00:10.0

　　10000001854738199011111111 column=cf1:order_price, timestamp=1479224942888, value=1000

　　5 row(s) in 0.5390 seconds

　　ROW KEY 设计详解

　　HBase中的row key为 user_id, 10000000000-UNIX_TIMESTAMP(create_time), goods_id 3个字段组成。

　　这边值得注意的是 10000000000-UNIX_TIMESTAMP(create_time), 这样设计的原因是为了让订单能按时间的倒序排列, 这样就符合越新的数据越先显示

　　如: 现在需要对用户 10000001 的订单进行分页, 每页两条数据, 并且按时间的倒序排序(最新订单最先显示)

　　hbase(main):003:0> scan &＃39;ord_order&＃39;, {COLUMNS=>[&＃39;cf1:order_price&＃39;], ROWPREFIXFILTER=>&＃39;10000001&＃39;, LIMIT=>2}

　　ROW COLUMN+CELL

　　10000001854736755011111115 column=cf1:order_price, timestamp=1479224942888, value=5000

　　10000001854737116011111114 column=cf1:order_price, timestamp=1479224942888, value=4000

　　点击下一页的数据:

　　hbase(main):004:0> scan &＃39;ord_order&＃39;, {COLUMNS=>[&＃39;cf1:order_price&＃39;], LIMIT=>3, STARTROW=>&＃39;10000001854737116011111114&＃39;}

　　ROW COLUMN+CELL

　　10000001854737116011111114 column=cf1:order_price, timestamp=1479224942888, value=4000

　　10000001854737477011111113 column=cf1:order_price, timestamp=1479224942888, value=3000

　　10000001854737838011111112 column=cf1:order_price, timestamp=1479224942888, value=2000

　　3 row(s) in 0.0260 seconds

　　上面获得了三行数据，在实际展现的时候去除第一行就好了，实际展示如下:

　　10000001854737477011111113 column=cf1:order_price, timestamp=1479224942888, value=3000

　　10000001854737838011111112 column=cf1:order_price, timestamp=1479224942888, value=2000

　　点击上一页

　　hbase(main):008:0> scan &＃39;ord_order&＃39;, {COLUMNS=>[&＃39;cf1:order_price&＃39;], LIMIT=>3, STARTROW=>&＃39;10000001854737477011111113&＃39;, REVERSED=>true}

　　ROW COLUMN+CELL

　　10000001854737477011111113 column=cf1:order_price, timestamp=1479224942888, value=3000

　　10000001854737116011111114 column=cf1:order_price, timestamp=1479224942888, value=4000

　　10000001854736755011111115 column=cf1:order_price, timestamp=1479224942888, value=5000

　　3 row(s) in 0.0640 seconds

　　上面同样获得了三条数据，我们需要去除第一行，让后按数据集合倒序显示

　　10000001854737116011111114 column=cf1:order_price, timestamp=1479224942888, value=4000

　　10000001854736755011111115 column=cf1:order_price, timestamp=1479224942888, value=5000

　　↓↓↓↓↓ 上面两行是集合数据下面两行数倒序遍历集合的数据(也是最终显示的数据)

　　10000001854736755011111115 column=cf1:order_price, timestamp=1479224942888, value=5000

　　10000001854737116011111114 column=cf1:order_price, timestamp=1479224942888, value=4000

关于MySQL分区表和HBase的关系是什么问题的解答就分享到这里了，希望以上内容可以对大家有一定的帮助，如果你还有很多疑惑没有解开，可以关注编程笔记行业资讯频道了解更多相关知识。

推荐阅读

list
使用FLASK REST API的机器学习模型

在本教程中，我们将看到如何使用FLASK制作第一个用于机器学习模型的RESTAPI。我们将从创建机器学习模型开始。然后，我们将看到使用Flask创建AP ... [详细]

蜡笔小新 2023-10-17 19:13:12
main
关于cuowu类的错误提示和使用AdjustmentListener的问题

本文讨论了一个关于cuowu类的问题，作者在使用cuowu类时遇到了错误提示和使用AdjustmentListener的问题。文章提供了16个解决方案，并给出了两个可能导致错误的原因。 ... [详细]

蜡笔小新 2023-12-13 22:09:56
main
实现下拉列表，点击其他位置自动隐藏效果的三种方式比较

目录实现效果：实现环境实现方法一：基本思路主要代码JavaScript代码总结方法二主要代码总结方法三基本思路主要代码JavaScriptHTML总结实 ... [详细]

蜡笔小新 2023-12-14 15:03:14
数组
Java容器中的compareto方法排序原理解析

本文从源码解析Java容器中的compareto方法的排序原理，讲解了在使用数组存储数据时的限制以及存储效率的问题。同时提到了Redis的五大数据结构和list、set等知识点，回忆了作者大学时代的Java学习经历。文章以作者做的思维导图作为目录，展示了整个讲解过程。 ... [详细]

蜡笔小新 2023-12-14 13:53:31
list
javascript – 概述在Firefox上无法正常工作

我试图提出一些自定义大纲,以达到一些Web可访问性建议.但我不能用Firefox制作.这就是它在Chrome上的外观：而那个图标实际上是一个锚点.在Firefox上,它只概述了整个 ... [详细]

蜡笔小新 2023-12-14 10:20:38
export
FileNotFoundException: File does not exist

ubuntu用sqoop将数据从hive导入mysql时，命令： ... [详细]

蜡笔小新 2023-12-12 18:56:13
list
MyBatis多表查询与动态SQL使用

本文介绍了MyBatis多表查询与动态SQL的使用方法，包括一对一查询和一对多查询。同时还介绍了动态SQL的使用，包括if标签、trim标签、where标签、set标签和foreach标签的用法。文章还提供了相关的配置信息和示例代码。 ... [详细]

蜡笔小新 2023-12-12 17:12:51
python
Python自动提取文本中的时间（包含中文日期）及特殊时间识别方法

本文介绍了在处理不规则数据时如何使用Python自动提取文本中的时间日期，包括使用dateutil.parser模块统一日期字符串格式和使用datefinder模块提取日期。同时，还介绍了一段使用正则表达式的代码，可以支持中文日期和一些特殊的时间识别，例如'2012年12月12日'、'3小时前'、'在2012/12/13哈哈'等。 ... [详细]

蜡笔小新 2023-12-12 12:09:33
python
超级简单加解密工具的方案和功能

本文介绍了一个超级简单的加解密工具的方案和功能。该工具可以读取文件头，并根据特定长度进行加密，加密后将加密部分写入源文件。同时，该工具也支持解密操作。加密和解密过程是可逆的。本文还提到了一些相关的功能和使用方法，并给出了Python代码示例。 ... [详细]

蜡笔小新 2023-12-10 16:38:34
python
判断两个数组是否包含相同元素的Python函数

本文介绍了一个Python函数same_set，用于判断两个相等长度的数组是否包含相同的元素。函数会忽略元素的顺序和重复次数，如果两个数组包含相同的元素，则返回1，否则返回0。文章还提供了函数的具体实现代码和样例输入输出。 ... [详细]

蜡笔小新 2023-12-10 11:48:02
python
Python的参数解析argparse模块的学习

本文介绍了Python中参数解析的重要模块argparse的学习内容。包括位置参数和可选参数的定义和使用方式，以及add_argument()函数的详细参数关键字解释。同时还介绍了命令行参数的操作和可接受数量的设置，其中包括整数类型的参数。通过学习本文内容，可以更好地理解和使用argparse模块进行参数解析。 ... [详细]

蜡笔小新 2023-12-09 21:59:04
main
如何优化Webpack打包后的代码分割

本文介绍了如何通过优化Webpack的代码分割来减小打包后的文件大小。主要包括拆分业务逻辑代码和引入第三方包的代码、配置Webpack插件、异步代码的处理、代码分割重命名、配置vendors和cacheGroups等方面的内容。通过合理配置和优化，可以有效减小打包后的文件大小，提高应用的加载速度。 ... [详细]

蜡笔小新 2023-12-09 08:10:47
bit
颜色迁移（reinhard VS welsh）

不要谈什么天分，运气，你需要的是一个截稿日，以及一个不交稿就能打爆你狗头的人，然后你就会被自己的才华吓到。------ ... [详细]

蜡笔小新 2023-10-17 21:20:36
import
机器学习算法代码实现——线性回归

前言：拿到一个案例，去分析：它该是做分类还是做回归，哪部分该做分类，哪部分该做回归，哪部分该做优化，它们的目标值分别是什么。再挑影响因素，哪些和分类有关的影响因素，哪些和回归有关的 ... [详细]

蜡笔小新 2023-10-17 19:58:52
spring
SpringJdbcTemplate的使用详解

本文详细介绍了Spring的JdbcTemplate的使用方法，包括执行存储过程、存储函数的call()方法，执行任何SQL语句的execute()方法，单个更新和批量更新的update()和batchUpdate()方法，以及单查和列表查询的query()和queryForXXX()方法。提供了经过测试的API供使用。 ... [详细]

蜡笔小新 2023-12-13 14:27:11

陈陈

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章