当前位置: 开发笔记 > 编程语言 > 正文

开发笔记:CDHHadoop+HBaseHA部署详解

作者：葬宝御用小奶瓶2004 | 来源：互联网 | 2023-08-29 10:34

本文由编程笔记#小编为大家整理，主要介绍了CDHHadoop+HBaseHA部署详解相关的知识，希望对你有一定的参考价值。

本文由编程笔记#小编为大家整理，主要介绍了CDH Hadoop + HBase HA 部署详解相关的知识，希望对你有一定的参考价值。

CDH 的部署和 Apache Hadoop 的部署是没有任何区别的。这里着重的是 HA的部署，需要特殊说明的是NameNode HA 需要依赖 Zookeeper

准备

Hosts文件配置：

CDH Hadoop + HBase HA 部署详解

各个节点服务情况

CDH Hadoop + HBase HA 部署详解

对几个新服务说明下：

JournalNode 用于同步 NameNode 元数据，和 Zookeeper 一样需要 2N+1个节点存活集群才可用。

DFSZKFailoverController（ZKFC）用于主备切换，类似 Keepalived 所扮演的角色。

NTP 服务
设置时区

CDH Hadoop + HBase HA 部署详解

配置NTP Server

CDH Hadoop + HBase HA 部署详解

启动并设置开机自启动

CDH Hadoop + HBase HA 部署详解

配置 NTP Client

CDH Hadoop + HBase HA 部署详解

启动并设置开机自启动

CDH Hadoop + HBase HA 部署详解

检查 NTP 同步

CDH Hadoop + HBase HA 部署详解

JDK
创建目录

CDH Hadoop + HBase HA 部署详解

创建运行账户

useradd -u 600 run

安装包
http://archive.cloudera.com/cdh5/cdh/5/

CDH Hadoop + HBase HA 部署详解

安装 Zookeeper

CDH Hadoop + HBase HA 部署详解

设置环境变量

CDH Hadoop + HBase HA 部署详解

删除无用文件

CDH Hadoop + HBase HA 部署详解

创建数据目录

CDH Hadoop + HBase HA 部署详解

配置

CDH Hadoop + HBase HA 部署详解

修改Zookeeper的日志打印方式，与日志路径设置
编辑

$ZOOKEEPER_HOME/bin/zkEnv.sh

在27行后加入两个变量

CDH Hadoop + HBase HA 部署详解

创建 myid文件

CDH Hadoop + HBase HA 部署详解

设置目录权限

chown -R run.run /data/{app,appData,logs}

启动、停止

CDH Hadoop + HBase HA 部署详解

安装 Hadoop

CDH Hadoop + HBase HA 部署详解

设置环境变量

CDH Hadoop + HBase HA 部署详解

删除无用文件

CDH Hadoop + HBase HA 部署详解

新建数据目录

mkdir -p /data/appData/hdfs/{name,edits,data,jn,tmp}

配置
切换到配置文件目录

cd $HADOOP_HOME/etc/hadoop

编辑 core-site.xml

CDH Hadoop + HBase HA 部署详解

编辑 hdfs-site.xml

CDH Hadoop + HBase HA 部署详解

小于5个DataNode建议添加如下配置

CDH Hadoop + HBase HA 部署详解

在 hadoop-env.sh 中添加如下变量

CDH Hadoop + HBase HA 部署详解

Heap 设置，单位 MB

export HADOOP_HEAPSIZE=1024

权限设置

chown -R run.run /data/{app,appData,logs} chmod 777 /data/pid

格式化
格式化只需要执行一次,格式化之前启动Zookeeper

切换用户

su - run

启动所有 JournalNode

hadoop-daemon.sh start journalnode

格式化 Zookeeper（为 ZKFC 创建znode）

hdfs zkfc -formatZK

NameNode 主节点格式化并启动

hdfs namenode -format hadoop-daemon.sh start namenode

NameNode 备节点同步数据并启动

hdfs namenode -bootstrapStandby hadoop-daemon.sh start namenode

启动 ZKFC

hadoop-daemon.sh start zkfc

启动 DataNode

hadoop-daemon.sh start datanode

启动与停止
切换用户

su - run

集群批量启动
需要配置运行用户ssh-key免密码登录，与$HADOOP_HOME/etc/hadoop/slaves

# 启动 start-dfs.sh # 停止 stop-dfs.sh

单服务启动停止
启动HDFS

hadoop-daemon.sh start journalnode hadoop-daemon.sh start namenode hadoop-daemon.sh start zkfc hadoop-daemon.sh start datanode

停止HDFS

hadoop-daemon.sh stop datanode hadoop-daemon.sh stop namenode hadoop-daemon.sh stop journalnode hadoop-daemon.sh stop zkfc

测试
HDFS HA 测试
打开 NameNode 状态页：
http://cdh-m1:50010
http://cdh-m2:50010

在 Overview 后面能看见 active 或 standby，active 为当前 Master，停止 active 上的 NameNode，检查 standby是否为 active。

HDFS 测试

hadoop fs -mkdir /test hadoop fs -put /etc/hosts /test hadoop fs -ls /test

结果:

CDH Hadoop + HBase HA 部署详解

HDFS 管理命令

# 动态加载 hdfs-site.xml hadoop dfsadmin -refreshNodes

HBase安装配置

cd /data/install tar xf hbase-1.0.0-cdh5.4.5.tar.gz -C /data/app cd /data/app ln -s hbase-1.0.0-cdh5.4.5 hbase

设置环境变量

CDH Hadoop + HBase HA 部署详解

删除无用文件

CDH Hadoop + HBase HA 部署详解

配置
进入配置文件目录

cd $HBASE_HOME/conf

编辑 hbase-site.xml

CDH Hadoop + HBase HA 部署详解

在 hbase-env.sh 中添加如下变量

Heap 设置，单位 MB

export HBASE_HEAPSIZE=1024

可选设置 regionservers 中添加所有RegionServer主机名，用于集群批量启动、停止

启动与停止
切换用户

su - run

集群批量启动
需要配置运行用户ssh-key免密码登录，与$HBASE_HOME/conf/regionservers

# 启动 start-hbase.sh # 停止 stop-hbase.sh

单服务启动停止
HMaster

# 启动 hbase-daemon.sh start master # 停止 hbase-daemon.sh stop master

HRegionServer

# 启动 hbase-daemon.sh start regionserver # 停止 hbase-daemon.sh stop regionserver

测试
HBase HA 测试
浏览器打开两个HMaster状态页:
http://cdh-m1:60010
http://cdh-m2:60010

可以在Master后面看见其中一个主机名，Backup Masters中看见另一个。
停止当前Master，刷新另一个HMaster状态页会发现Master后面已经切换，HA成功。

HBase 测试
进入hbase shell 执行：

create 'users','user_id','address','info' list put 'users','anton','info:age','24' get 'users','anton' # 最终结果 COLUMN CELL info:age timestamp=1465972035945, value=24 1 row(s) in 0.0170 seconds

清除测试数据：

disable 'users' drop 'users'

微信扫一扫

推荐阅读

http
Hadoop入门与核心组件详解

本文详细介绍了Hadoop的基础知识及其核心组件，包括HDFS、MapReduce和YARN。通过本文，读者可以全面了解Hadoop的生态系统及应用场景。 ... [详细]

蜡笔小新 2024-12-26 13:12:48
main
Hadoop发行版本选择指南：技术解析与应用实践

本文详细介绍了Hadoop的不同发行版本及其特点，帮助读者根据实际需求选择最合适的Hadoop版本。内容涵盖Apache Hadoop、Cloudera CDH等主流版本的特性及应用场景。 ... [详细]

蜡笔小新 2024-12-22 20:38:12
main
如何构建基于Dubbo协议的示例项目

本文详细介绍了构建基于Dubbo协议的示例项目的步骤，包括环境搭建、服务接口定义、服务实现、配置文件设置及客户端调用等环节，旨在为初学者提供一个清晰的学习路径。 ... [详细]

蜡笔小新 2024-12-08 12:23:24
controller
dubbo5.添加dubbo

1整合dubbo1.1e3-manager-Service1.1.1pom.xml排除jar在e3-manager-Service工程中添加dubbo依赖的jar包。 ... [详细]

蜡笔小新 2024-12-06 11:43:22
request
Apache ZooKeeper 中 FileTxnLog.setPreallocSize 方法详解与应用实例

本文详细介绍了 Apache ZooKeeper 的 FileTxnLog 类中的 setPreallocSize 方法，并提供了多个实际应用中的代码示例。通过这些示例，读者可以更好地理解如何在不同场景下合理设置日志文件的预分配大小。 ... [详细]

蜡笔小新 2024-12-05 13:52:17
main
Kafka 示例项目中 Log4j 的配置与调试

本文详细介绍了如何在 Kafka 源码中的示例项目配置 Log4j，以确保能够正确记录日志信息，帮助开发者更好地理解和调试代码。 ... [详细]

蜡笔小新 2024-12-04 13:05:33
controller
HBase RegionServer 故障分析与解决

本文详细记录了一次 HBase RegionServer 异常宕机的情况，包括具体的错误信息和可能的原因分析。通过此案例，探讨了如何有效诊断并解决 HBase 中常见的 RegionServer 挂起问题。 ... [详细]

蜡笔小新 2024-12-01 16:21:27
php
将Web服务部署到Tomcat

本文介绍了如何在JDeveloper 12c中创建一个Java项目，并将其打包为Web服务，然后部署到Tomcat服务器。内容涵盖从项目创建、编写Web服务代码、配置相关XML文件到最终的本地部署和验证。 ... [详细]

蜡笔小新 2024-12-27 11:48:15
php
如何在窗口右下角添加调整大小的手柄

本文探讨了如何在传统MFC/Win32 API编程中实现类似C# WinForms中的SizeGrip功能，即在窗口的右下角显示一个用于调整窗口大小的手柄。我们将介绍具体的实现方法和相关API。 ... [详细]

蜡笔小新 2024-12-27 11:17:27
js
RecyclerView初步学习(一)

RecyclerView初步学习(一)ReCyclerView提供了一种插件式的编程模式，除了提供ViewHolder缓存模式，还可以自定义动画，分割符，布局样式，相比于传统的ListVi ... [详细]

蜡笔小新 2024-12-26 20:24:01
main
解决JAX-WS动态客户端工厂弃用问题并迁移到XFire

在处理Java项目中的JAR包冲突时，我们遇到了JaxWsDynamicClientFactory被弃用的问题，并成功将其迁移到org.codehaus.xfire.client。本文详细介绍了这一过程及解决方案。 ... [详细]

蜡笔小新 2024-12-25 18:48:34
js
通过Web界面管理Linux日志的解决方案

本指南介绍了一种利用rsyslog、MariaDB和LogAnalyzer搭建集中式日志管理平台的方法，使用户可以通过Web界面查看和分析Linux系统的日志记录。此方案不仅适用于服务器环境，还提供了详细的步骤来确保系统的稳定性和安全性。 ... [详细]

蜡笔小新 2024-12-24 17:11:38
js
HBase运维工具全解析

本文深入探讨了HBase常用的运维工具，详细介绍了每种工具的功能、使用场景及操作示例。对于HBase的开发人员和运维工程师来说，这些工具是日常管理和故障排查的重要手段。 ... [详细]

蜡笔小新 2024-12-24 17:00:59
js
离线安装Grafana Cloudera Manager插件并监控CDH集群

本文详细介绍如何离线安装Cloudera Manager (CM) 插件，并通过Grafana监控CDH集群的健康状况和资源使用情况。该插件利用CM提供的API接口进行数据获取和展示。 ... [详细]

蜡笔小新 2024-12-21 17:56:30
php
Spring Cloud学习指南：深入理解微服务架构

本文介绍了微服务架构的基本概念及其在Spring Cloud中的实现。讨论了微服务架构的主要优势，如简化开发和维护、快速启动、灵活的技术栈选择以及按需扩展的能力。同时，也探讨了微服务架构面临的挑战，包括较高的运维要求、分布式系统的复杂性、接口调整的成本等问题。最后，文章提出了实施微服务时应遵循的设计原则。 ... [详细]

蜡笔小新 2024-12-19 09:25:36

葬宝御用小奶瓶2004

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章