HBase备份还原OpenTSDB数据之Export/Import（增量+全量）

作者：千__鱼姐姐 | 来源：互联网 | 2023-05-19 00:59

前言本文基于伪分布式搭建hadoop+zookeeper+hbase+opentsdb之后，文章链接：https:www.cnblogs.comyybrhrp11128149.h

前言

　　本文基于伪分布式搭建 hadoop+zookeeper+hbase+opentsdb之后，文章链接：https://www.cnblogs.com/yybrhr/p/11128149.html，对于Hbase数据备份和恢复的几种方法已经有很多大神说明了很多（https://www.cnblogs.com/ballwql/p/hbase_data_transfer.html对hbase迁移数据的4种机制都做了说明），我就不做过多描述。本文主要实战Export 本地备份还原opentsdb数据，以及数据的迁移。

opentsdb在hbase中生成4个表（tsdb, tsdb-meta, tsdb-tree, tsdb-uid），其中tsdb这个表最重要，数据迁移时，备份还原此表即可。

1、全量备份

本文测试本地备份服务器hostname：hbase3，ip为192.168.0.214。

# 备份表：tsdb，本地存放路径/opt/soft/hbase/hbase_bak/hbase_bak_1562252298 
hbase org.apache.hadoop.hbase.mapreduce.Export -Dhbase.export.scanner.batch=2000 -D mapred.output.compress=true  tsdb file:///opt/soft/hbase/hbase_bak/hbase_bak_1562252298

2、跟踪进度

#根据提示：可以通过 http://hbase3:8088 跟踪进度

http://hbase3:8088

#问题：但是无法访问 http://hbase3:8088，但http://192.168.0.214:8088/cluster则访问

http://192.168.0.214:8088

#解决：配置hosts，映射hbase3(WIN+R——>输入:drivers——>进入子路径：/etc/hosts——>添加 192.168.0.214   hbase3)

 192.168.0.214   hbase3

# 问题

# 解決：状态与进度跟踪

# 验证

3、错误解决：

is running 17037824B beyond the 'VIRTUAL' memory limit. Current usage: 207.8 MB of 1 GB physical memory used; 2.1 GB of 2.1 GB virtual memory used. Killing container

Container killed on request. Exit code is 143

Container exited with a non-zero exit code 143

【1】错误log日志


后台日志：提示可以在web上查看

web日志：

【2】异常分析

我们在后台日志可以看到，is running 17037824B beyond the 'VIRTUAL' memory limit. Current usage: 207.8 MB of 1 GB physical memory used; 2.1 GB of 2.1 GB virtual memory used. Killing container.这句话其实就告诉了原因：

207.8 MB: 任务所占的物理内存

1 GB : 是hadoop的mapred-site.xml配置文件中设置的mapreduce.map.memory.mb 的值。

2.1 GB : 第一个2.1GB是程序占用的虚拟内存

2.1 GB : 是hadoop的mapred-site.xml配置文件中设置的mapreduce.map.memory.mb 的值乘以 yarn.nodemanager.vmem-pmem-ratio 的值得到的。

其中yarn.nodemanager.vmem-pmem-ratio 是虚拟内存和物理内存比例，在yarn-site.xml中设置，默认是2.1GB，

很明显，这句话的意思是：分配给container虚拟内存只有2.1GB，但是目前container已经占用了2.1GB。所以kill掉了这个container。

上面只是map中产生的报错，当然也有可能在reduce中报错，如果是reduce中，那么就是对应mapreduce.reduce.memory.mb 和 yarn.nodemanager.vmem-pmem-ratio。

【3】解决方案

参考网址：

 https://blog.csdn.net/T1DMzks/article/details/78818874
 https://www.cnblogs.com/missie/p/4370135.html

# 进入目录
cd /opt/soft/hadoop/hadoop-3.1.2/etc/hadoop/
# 进入编辑
vim mapred-site.xml
# 添加以下内容：

     
   
        <property>
　　            <name>yarn.nodemanager.vmem-pmem-rationame>
　　            <value>2value>
        property>
   
        <property>
　　            <name>mapreduce.map.memory.mbname>
　　            <value>4096value>
        property>

【4】结果验证

# 添加重启hadoop、hbase：注意先停habse，并且不要要kill，因为hadoop在不断的切割，用stop停止，它会记录下来，下次启动继续切割
 
 stop-hbase.sh 
 stop-all.sh
 start-all.sh
 start-hbase.sh


## 验证：
# 1、先删除本地之前的备份文件
 rm -fr /opt/soft/hbase/hbase_bak/hbase_bak1562252298
# 2、再次备份
hbase org.apache.hadoop.hbase.mapreduce.Export -Dhbase.export.scanner.batch=2000 -D mapred.output.compress=true  tsdb file:///opt/soft/hbase/hbase_bak/hbase_bak1562252298

# 3、结果查看：进入备份文件路径查看内容(一般成功会生成_SUCCESS和若干part-m-文件)
cd /opt/soft/hbase/hbase_bak/hbase_bak1562252298
ll

在web上可以查看进度和状态：

在运行的时候会生成两个YarnChild进程

4、还原

【1】停止写入程序

【2】清空表

# 进入到shell命令
hbase shell # 清空要还原的表，只留表结构
truncate 'tsdb'
# 查看表
scan 'tsdb'

【3】还原

# 此步骤在非shell命令下执行，因此需要exit退出shell命令，我这里重开一个窗口做

hbase org.apache.hadoop.hbase.mapreduce.Driver import  tsdb file:///opt/soft/hbase/hbase_bak/hbase_bak1562252298

查看进度

【4】验证

　　当进度达到100%时，检查数据。

（1）hbase shell进行验证

# 进入shell命令
hbase shell

# 查看数据
scan 'tsdb'

（2）grafana验证

5、数据迁移：从一台服务器迁移到另一台服务器

本文从hbase3（ip：192.168.0.214）迁移到hbase1（ip：192.168.0.211），这两台服务器搭建的环境一样，并且做了互相免密登录。

【1】将刚刚hbase3备份的数据复制给hbase1

scp -r hbase3:/opt/soft/hbase/hbase_bak/hbase_bak1562252298/ hbase1:/opt/soft/hbase/hbase_bak/

【2】清空hbase1原本tsdb的数据

hbase1原本数据

清空

# 进入到shell命令
hbase shell
# 清空要还原的表，只留表结构
truncate 'tsdb'
# 查看表
scan 'tsdb'

【3】还原

【4】验证

6、增量备份

增量备份跟全量备份操作差不多，只不过要在后面加上时间戳。需要借助时间戳转换工具http://tool.chinaz.com/Tools/unixtime.aspx。

开始时间：2019-07-10 00:00:00 对应时间戳：1562616000

结束时间：2019-07-10 14:00:00 对应时间戳：1562652000

hbase org.apache.hadoop.hbase.mapreduce.Export -Dhbase.export.scanner.batch=2000 -D mapred.output.compress=true  tsdb file:///opt/soft/hbase/hbase_bak/hbase_bak_1562601600-1562652000 1562601600 1562652000

推荐阅读

string
在重复造轮子的情况下用ProxyServlet反向代理来减少工作量

像不少公司内部不同团队都会自己研发自己工具产品，当各个产品逐渐成熟，到达了一定的发展瓶颈，同时每个产品都有着自己的入口，用户 ... [详细]

蜡笔小新 2023-12-13 15:19:01
string
Linux如何安装Mongodb的详细步骤和注意事项

本文介绍了Linux如何安装Mongodb的详细步骤和注意事项，同时介绍了Mongodb的特点和优势。Mongodb是一个开源的数据库，适用于各种规模的企业和各类应用程序。它具有灵活的数据模式和高性能的数据读写操作，能够提高企业的敏捷性和可扩展性。文章还提供了Mongodb的下载安装包地址。 ... [详细]

蜡笔小新 2023-12-12 21:54:15
string
Linux下Kafka单机安装配置方法（实操成功）

本文介绍了在Linux下安装和配置Kafka的方法，包括安装JDK、下载和解压Kafka、配置Kafka的参数，以及配置Kafka的日志目录、服务器IP和日志存放路径等。同时还提供了单机配置部署的方法和zookeeper地址和端口的配置。通过实操成功的案例，帮助读者快速完成Kafka的安装和配置。 ... [详细]

蜡笔小新 2023-12-12 18:14:32
string
【牛客网论坛】第6章：Elasticsearch，分布式搜索引擎（Elasticsearch入门）

Elasticsearch1Elasticsearch入门1.1Elasticsearch术语1.1.16.0以前的Elasticsearch术语1.1.26.0以后的Elasti ... [详细]

蜡笔小新 2023-12-12 16:53:17
string
解决nginx启动报错epoll_wait() reported that client prematurely closed connection的方法

本文介绍了解决nginx启动报错epoll_wait() reported that client prematurely closed connection的方法，包括检查location配置是否正确、pass_proxy是否需要加“/”等。同时，还介绍了修改nginx的error.log日志级别为debug，以便查看详细日志信息。 ... [详细]

蜡笔小新 2023-12-12 13:19:04
string
Oracle优化新常态的五大禁止及其性能隐患

本文介绍了Oracle优化新常态中的五大禁止措施，包括禁止外键、禁止视图、禁止触发器、禁止存储过程和禁止JOB，并分析了这些禁止措施可能带来的性能隐患。文章还讨论了这些禁止措施在C/S架构和B/S架构中的不同应用情况，并提出了解决方案。 ... [详细]

蜡笔小新 2023-12-12 12:55:55
php
mac php错误日志配置方法及错误级别修改

本文介绍了在mac环境下配置php错误日志的方法，包括修改php.ini文件和httpd.conf文件的操作步骤。同时还介绍了如何修改错误级别，以及相应的错误级别参考链接。 ... [详细]

蜡笔小新 2023-12-12 11:59:08
python
一句话解决高并发的核心原则

本文介绍了解决高并发的核心原则，即将用户访问请求尽量往前推，避免访问CDN、静态服务器、动态服务器、数据库和存储，从而实现高性能、高并发、高可扩展的网站架构。同时提到了Google的成功案例，以及适用于千万级别PV站和亿级PV网站的架构层次。 ... [详细]

蜡笔小新 2023-12-12 10:56:24
string
解决Sharepoint 2013运行状况分析出现的“一个或多个服务器未响应”问题的方法

本文介绍了解决Sharepoint 2013运行状况分析中出现的“一个或多个服务器未响应”问题的方法。对于有高要求的客户来说，系统检测问题的存在是不可接受的。文章详细描述了解决该问题的步骤，包括删除服务器、处理分布式缓存留下的记录以及使用代码等方法。同时还提供了相关关键词和错误提示信息，以帮助读者更好地理解和解决该问题。 ... [详细]

蜡笔小新 2023-12-10 13:37:58
string
Sleuth+zipkin链路追踪SpringCloud微服务的解决方案

在庞大的微服务群中，随着业务扩展，微服务个数增多，系统调用链路复杂化。Sleuth+zipkin是解决SpringCloud微服务定位和追踪的方案。通过TraceId将不同服务调用的日志串联起来，实现请求链路跟踪。通过Feign调用和Request传递TraceId，将整个调用链路的服务日志归组合并，提供定位和追踪的功能。 ... [详细]

蜡笔小新 2023-12-09 19:14:50
install
ElasticSerach初探第一篇认识ES+环境搭建+简单MySQL数据同步+SpringBoot整合ES

一、认识ElasticSearch是一个基于Lucene的开源搜索引擎，通过简单的RESTfulAPI来隐藏Lucene的复杂性。全文搜索，分析系统&# ... [详细]

蜡笔小新 2023-12-09 10:36:06
int
初学者遇到的dubbo设计架构问题及解决方法总结

本文总结了初学者在使用dubbo设计架构过程中遇到的问题，并提供了相应的解决方法。问题包括传输字节流限制、分布式事务、序列化、多点部署、zk端口冲突、服务失败请求3次机制以及启动时检查。通过解决这些问题，初学者能够更好地理解和应用dubbo设计架构。 ... [详细]

蜡笔小新 2023-12-09 10:07:18
int
云原生应用最佳开发实践之十二原则（12factor）

目录简介一、基准代码二、依赖三、配置四、后端配置五、构建、发布、运行六、进程七、端口绑定八、并发九、易处理十、开发与线上环境等价十一、日志十二、进程管理当 ... [详细]

蜡笔小新 2023-12-09 09:35:02
match
windows下dll加载失败排错

在加载一个第三方厂商的dll文件时，提示“找不到指定模块，加载失败”。由于缺乏必要的技术支持，百思不得期间。后来发现一个有用的工具 ... [详细]

蜡笔小新 2023-10-17 23:00:57
php
[翻译]微服务设计模式5. 服务发现服务端服务发现

服务之间需要互相调用，在单体架构中，服务之间的互相调用直接通过编程语言层面的方法调用就搞定了。在传统的分布式应用的部署中，服务地 ... [详细]

蜡笔小新 2023-10-17 18:03:57

千__鱼姐姐

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章