Hbase的数据备份策略

作者：fuchen201101 | 来源：互联网 | 2023-09-18 05:14

摘自：http:qindongliang.iteye.comblog2366547Hbase的数据备份策略有：DistcpCopyTableExportImportReplicat

摘自：http://qindongliang.iteye.com/blog/2366547
Hbase的数据备份策略有：

Distcp
CopyTable
Export/Import
Replication
Snapshot

下面介绍这几种方式：
一、Distcp（离线备份）
直接备份HDFS数据，备份前需要disable表，在备份完成之前服务不可用对在线服务类业务不友好

二、CopyTable（热备）
执行命令前，需要创建表，支持时间区间、row区间，改变表名称，改变列簇名称，指定是否copy删除数据等功能，例如：

hbase org.apache.hadoop.hbase.mapreduce.CopyTable -starttime=1265875194289 --endtime=1265878794289 --peer.adr= dstClusterZK:2181:/hbase --families=myOldCf:myNewCf,cf2,cf3 TestTable

1、同一个集群不同表名称

hbase org.apache.hadoop.hbase.mapreduce.CopyTable --new.name=tableCopy srcTable

2、跨集群copy表

hbase org.apache.hadoop.hbase.mapreduce.CopyTable --peer.adr=dstClusterZK:2181:/hbase srcTable

三、Export/Import（热备+离线）
通过Export导出数据到目标集群的hdfs，再在目标集群执行import导入数据，Export支持指定开始时间和结束时间，因此可以做增量备份。

四、Replication（实时）
通过Hbase的replication机制实现Hbase集群的主从模式实时同步

五、Snapshot（备份实时，恢复需要disable）个人觉得这是备份里面最经济划算的一个，可以每天在固定时间点对hbase表数据进行快照备份，然后如果出现问题了，可以直接恢复到某个时间点上的数据，适合修复指标计算错误的场景，然后从某个时间点上重新修复。下面详细说下使用方式：

（1）先建立一个测试表 Java代码
create 'test','cf'
（2）添加数据 Java代码

> put 'test','a','cf:c1',1 > put 'test','a','cf:c2',2 > put 'test','b','cf:c1',3 > put 'test','b','cf:c2',4 > put 'test','c','cf:c1',5 > put 'test','c','cf:c2',6

（3）创建快照
hbase snapshot create -n test_snapshot -t test
（4）查看快照
list_snapshots
（5）导出到HDFS Java代码

hbase org.apache.hadoop.hbase.snapshot.ExportSnapshot -snapshot test_snapshot -copy-to hdfs://user/back/xxx

（6）从快照恢复数据到原表中
restore _snapshot 'test_snapshot'
（7）从快照中恢复到一个新表中
clone_snapshot 'test_snapshot','test_2'

推荐阅读

hadoop
HBase 数据复制与灾备同步策略

本文探讨了HBase在企业级应用中的数据复制与灾备同步解决方案，包括存量数据迁移及增量数据实时同步的方法。 ... [详细]

蜡笔小新 2024-11-21 19:20:03
hadoop
使用TabActivity实现Android顶部选项卡功能

本文介绍如何通过继承TabActivity来创建Android应用中的顶部选项卡。通过简单的步骤，您可以轻松地添加多个选项卡，并实现基本的界面切换功能。 ... [详细]

蜡笔小新 2024-11-21 17:47:42
hadoop
解决Android Studio意外崩溃及重启后Import错误问题

本文提供了一种有效的方法来解决当Android Studio因电脑意外重启而导致的所有import语句出现错误的问题。通过清除缓存和重建项目结构，可以快速恢复开发环境。 ... [详细]

蜡笔小新 2024-11-22 11:53:00
hadoop
CentOS 中 SWAP 分区的创建与管理

本文详细介绍了在 CentOS 系统中如何创建和管理 SWAP 分区，包括临时创建交换文件、永久性增加交换空间的方法，以及如何手动释放内存缓存。 ... [详细]

蜡笔小新 2024-11-21 19:01:54
js
如何在Ember.js中使用HBS模板

本文介绍了.hbs文件作为Ember.js项目中的视图层，类似于HTML文件的功能，并详细讲解了如何在Ember.js应用中集成Bootstrap框架及其相关组件的方法。 ... [详细]

蜡笔小新 2024-11-21 18:50:46
config
Maven + Spring + MyBatis + MySQL 环境搭建与实例解析

本文详细介绍如何使用MySQL数据库进行环境搭建，包括创建数据库表并插入示例数据。随后，逐步指导如何配置Maven项目，整合Spring框架与MyBatis，实现高效的数据访问。 ... [详细]

蜡笔小新 2024-11-21 18:39:23
request
Struts2 + json+ jquery 实现三级联动action和jsp代码竟然有小红叉，提示缺双引号，检查了转义符号也没缺啊，求解

publicclassBindActionextendsActionSupport{privateStringproString;privateStringcitString; ... [详细]

蜡笔小新 2024-11-21 16:25:41
tree
在OpenCV 3.1.0中实现SIFT与SURF特征检测

本文介绍如何在OpenCV 3.1.0版本中通过Python 2.7环境使用SIFT和SURF算法进行图像特征点检测。由于这些高级功能在OpenCV 3.0.0及更高版本中被移至额外的contrib模块，因此需要特别处理才能正常使用。 ... [详细]

蜡笔小新 2024-11-20 21:00:18
less
Android与JUnit集成测试实践

本文探讨了如何在Android项目中集成JUnit进行单元测试，并详细介绍了修改AndroidManifest.xml文件以支持测试的方法。 ... [详细]

蜡笔小新 2024-11-20 18:30:14
js
Vue3中如何提高开发效率

小编给大家分享一下Vue3中如何提高开发效率，相信大部分人都还不怎么了解，因此分享这篇文章给大家参考一下，希望大家阅读完这篇文章后大有收获， ... [详细]

蜡笔小新 2024-11-20 15:33:07
tree
华为鲲鹏平台适配的Redis Docker镜像构建指南

本文详细介绍如何在华为鲲鹏平台上构建和使用适配ARM架构的Redis Docker镜像，解决常见错误并提供优化建议。 ... [详细]

蜡笔小新 2024-11-19 15:04:08
request
Python Requests模块中的身份验证机制

随着Web服务的发展，身份验证成为了确保数据安全的重要环节。本文将详细介绍如何利用Python的Requests库实现不同类型的HTTP身份验证，包括基本身份验证、摘要式身份验证以及OAuth 1认证等。 ... [详细]

蜡笔小新 2024-11-19 10:58:10
request
提高MATLAB图形分辨率的方法

MATLAB是科技工作者的重要工具，以其强大的科学计算能力和简洁的编程风格而广受好评。然而，MATLAB生成的图形默认分辨率较低，这在某些情况下可能会影响图形的质量。本文将介绍如何在MATLAB中保存高分辨率的图形。 ... [详细]

蜡笔小新 2024-11-19 10:57:00
config
在Android中调用其他应用的Activity

本文介绍了如何在Android应用中通过Intent调用其他应用的Activity，并提供了详细的代码示例和注意事项。 ... [详细]

蜡笔小新 2024-11-17 17:53:47
js
vue引入echarts地图的四种方式

一、vue中引入echart1、安装echarts:npminstallecharts--save2、在main.js文件中引入echarts实例: Vue.prototype.$echartsecharts3、在需要用到echart图形的vue文件中引入: importechartsfrom&quot;echarts&quot;;4、如果用到map（地图），还 ... [详细]

蜡笔小新 2024-11-15 13:07:46

fuchen201101

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章