hbase伪集群搭建

作者：麦豪小仙 | 来源：互联网 | 2023-10-13 19:16

hbase数据存储有三种跑法，跑在本地磁盘上、跑在伪分布式上、跑在完全分布式上--------额。。。官网的文档挺坑爹的，结合官网、百度、谷歌的各种

hbase 数据存储有三种跑法，跑在本地磁盘上、跑在伪分布式上、跑在完全分布式上--------
额。。。官网的文档挺坑爹的，结合官网、百度、谷歌的各种文档看，只要理解原理，搭建也不算难（当然照的官网文档个看就比较坑爹了）
单机模式 ------->> 这个最简单，免写了，下了包直接解压配置个路径就可以启动了，zk 和 hbase 都是起在同一个 jvm 中的，数据落到本地磁盘。
伪分布式部署方式 ------->> 先部署 hdfs ，再部署 hbase ，它们的各个进程跑在不同的 jvm 中， hbase只是将数据落到了 hdfs 上。
完全分布式 ------->> 完全分布式用大白话来说，我理解的就是个伪分布式的升级款，只是把伪分布式的一台服务器变成了 n 台。。。

完全分布式一定要部署在物理机上

上边蛋扯的差不多了，下面直接入正题，开始部署
下载什么版本的包自己解决，要想下载最轻松的全部安装包，直接到 cdh 上去下载，百度搜索 cdh ，你懂的、、、然后配置文件每个版本的基本上差不多，没有太大的出入
下面是以 hadoop-2.7.2 、 hbase-1.1.2 为例

一、新系统的话，自己先处理一下系统，这个习惯相信所有运维同行的哥哥们都是有这习惯的。。。关闭不用的防火墙、最大文件打开数、jdk全局变量、dns、主机名解析
建议配置时用 ip 的最后用内网的域名，这样的话，开发的代码也好接入做好的 hbase，用主机名的话，开发的还得自己的 hosts ，我这里用的内网的 dns 域名。

二、部署 hdfs

包传到服务器上，解压

hadoop-2.7.2.tar.gz
tar xvf  hadoop-2.7.2.tar.gz  -C /home
cd /home/hadoop-2.7.2
vim etc/hadoop/hadoop-env.sh

export JAVA_HOME=/usr/lib/jvm/jdk1.7.0_72

配置HDFS 之 core-site.xml

mkdir data
vim etc/hadoop/core-site.xml

 
    fs.defaultFS
    hdfs://pretend.hdfs.gag.cn:9000
            
 
 
    hadoop.tmp.dir
    /home/hadoop-2.7.2/data/tmp

配置HDFS 之 hdfs-site.xml

vim etc/hadoop/hdfs-site.xml
   
   
    dfs.replication
    1

配置HDFS 之 YARN，这原配置文件里什么也没有，都是注释内容，直接改名就行

mv etc/hadoop/mapred-site.xml.template etc/hadoop/mapred-site.xml
vim etc/hadoop/mapred-site.xml

  
  
    mapreduce.framework.name
    yarn

配置HDFS 之 yarn-site.xml

 vim etc/hadoop/yarn-site.xml
  
  
    yarn.nodemanager.aux-services
    mapreduce_shuffle

启动 hdfs
初次启动 hdfs 先要初始化文件系统，也可以说是格式化文件系统

    bin/hdfs namenode -format

hbase伪集群搭建

格式化完毕，启动NameNod和DataNode进程
启动之前如果修改 jvm 参数的话，在 vim etc/hadoop/hadoop-env.sh 修改 HADOOP_HEAPSIZE 这一项就可以了，默认应该是 1024M

sbin/start-dfs.sh

启动以后，有这里显示有三个配置文件，是 out 后缀的，看日志的话，看 log 后缀的，看有没有 error 级别的报错
hbase伪集群搭建

启动YARN

     sbin/start-yarn.sh

同样是去看这两个的 log 后缀的日志
这里了 hdfs 就算启动完毕了，这时再 jps 命令可以看到除 jps 进程外有 5 个
hbase伪集群搭建

查看端口已经有这么多了， 50070 是 hdfs 的 web 端口，以后输入 ip:port 或者域名:port 来查看 web 页面
hbase伪集群搭建

======================================================================

以上 hdfs 启动没问题后，就可以启动 hbase 了

     tar xvf hbase-1.1.2-bin.tar.gz -C /home/        
     cd /home/hbase-1.1.2/   
     vim conf/hbase-env.sh   
     export JAVA_HOME=/usr/lib/jvm/jdk1.7.0_72

配置Hbase

mkdir data
vim conf/hbase-site.xml 

     
   
      hbase.rootdir
      hdfs://pretend.hdfs.gag.cn:9000/hbase
            
  
  
     hbase.zookeeper.property.dataDir
     /home/hbase-1.1.2/data
             
  
  
     hbase.cluster.distributed
     true

hbase 集群内的服务器，如果是启动完全分布式，这里要填写hbase所有的服务器域名或者 ip 或者主机名，顺便说一下，hbase和 hadoop 集群全部是已 ssh 远程调用命令的方式启动其他节点的

    vim conf/regionservers      
    pretend.hbase.gag.cn

这里的话，我把内存调整了一下，因为开发那边要用，服务器是 8G 的

    vim conf/hbase-env.sh 
    export HBASE_MASTER_OPTS="$HBASE_MASTER_OPTS -XX:PermSize=512m -XX:MaxPermSize=512m"
export HBASE_REGIONSERVER_OPTS="$HBASE_REGIONSERVER_OPTS -XX:PermSize=512m -XX:MaxPermSize=512m"

启动Hbase

先启动 zookeeper，如果是完全分布式的话，所有的 hbase节点会以临时节点的方式注册在 zk 里，伪分布式也一样，只不过zk 里只有一个节点，zk 也只有一个节点

 bin/hbase-daemon.sh start zookeeper         启动后查看日志
 bin/hbase-daemon.sh start master               启动后查看日志
 bin/hbase-daemon.sh start regionserver      启动后查看日志

此时的 jps 可以查看到除 jps 外 8 个进程
hbase伪集群搭建

hbase 的 web 页面端口是 16010
hbase伪集群搭建

如果要加开机启动的话，最好加上sleep等待，我是这样加的
hbase伪集群搭建

正常停止方式：
一定要按照顺序停止
停止 hbase、zookeeper、hdfs

推荐阅读

io
解决Hive启动时权限被拒问题

本文详细分析了Hive在启动过程中遇到的权限拒绝错误，并提供了多种解决方案，包括调整文件权限、用户组设置以及环境变量配置等。 ... [详细]

蜡笔小新 2024-12-26 19:14:29
io
百度服务再次遭遇技术问题，疑似DNS解析故障

近日晚间，百度多项在线服务出现加载异常，包括移动端搜索在内的多个功能受到影响。初步迹象表明，问题可能与DNS服务器解析有关。 ... [详细]

蜡笔小新 2024-12-26 12:52:25
shell
HBase运维工具全解析

本文深入探讨了HBase常用的运维工具，详细介绍了每种工具的功能、使用场景及操作示例。对于HBase的开发人员和运维工程师来说，这些工具是日常管理和故障排查的重要手段。 ... [详细]

蜡笔小新 2024-12-24 17:00:59
shell
技术变现之道：从日常工作中挖掘潜力

本文探讨了如何在日常工作中通过优化效率和深入研究核心技术，将技术和知识转化为实际收益。文章结合个人经验，分享了提高工作效率、掌握高价值技能以及选择合适工作环境的方法，帮助读者更好地实现技术变现。 ... [详细]

蜡笔小新 2024-12-24 15:21:23
less
深入解析网络存储技术

本文详细介绍了网络存储技术的基本概念、分类及应用场景。通过分析直连式存储（DAS）、网络附加存储（NAS）和存储区域网络（SAN）的特点，帮助读者理解不同存储方式的优势与局限性。 ... [详细]

蜡笔小新 2024-12-24 10:38:34
char
备战BAT面试：掌握这些MySQL核心问题

本文深入探讨了MySQL中常见的面试问题，包括事务隔离级别、存储引擎选择、索引结构及优化等关键知识点。通过详细解析，帮助读者在面对BAT等大厂面试时更加从容。 ... [详细]

蜡笔小新 2024-12-20 18:58:01
list
360SRC安全应急响应：从漏洞提交到修复的全过程

本文详细介绍了360SRC平台处理一起关键安全事件的过程，涵盖从漏洞提交、验证、排查到最终修复的各个环节。通过这一案例，展示了360在安全应急响应方面的专业能力和严谨态度。 ... [详细]

蜡笔小新 2024-12-27 11:10:05
list
Unity 客户端框架设计：UI管理系统的构建

本文详细介绍了如何构建一个高效的UI管理系统，集中处理UI页面的打开、关闭、层级管理和页面跳转等问题。通过UIManager统一管理外部切换逻辑，实现功能逻辑分散化和代码复用，支持多人协作开发。 ... [详细]

蜡笔小新 2024-12-27 10:28:40
settings
深入理解Android中的ADB Shell Input命令：模拟滑动、按键和点击事件

在维护公司项目时，发现按下手机的某个物理按键后会激活相应的服务，并在屏幕上模拟点击特定坐标点。本文详细介绍了如何使用ADB Shell Input命令来模拟各种输入事件，包括滑动、按键和点击等。 ... [详细]

蜡笔小新 2024-12-26 13:43:24
io
Hadoop入门与核心组件详解

本文详细介绍了Hadoop的基础知识及其核心组件，包括HDFS、MapReduce和YARN。通过本文，读者可以全面了解Hadoop的生态系统及应用场景。 ... [详细]

蜡笔小新 2024-12-26 13:12:48
plugins
离线安装Grafana Cloudera Manager插件并监控CDH集群

本文详细介绍如何离线安装Cloudera Manager (CM) 插件，并通过Grafana监控CDH集群的健康状况和资源使用情况。该插件利用CM提供的API接口进行数据获取和展示。 ... [详细]

蜡笔小新 2024-12-21 17:56:30
io
深入解析Hadoop的核心组件与工作原理

本文详细介绍了Hadoop的三大核心组件：分布式文件系统HDFS、资源管理器YARN和分布式计算框架MapReduce。通过分析这些组件的工作机制，帮助读者更好地理解Hadoop的架构及其在大数据处理中的应用。 ... [详细]

蜡笔小新 2024-12-19 17:17:51
io
深入解析Spring Cloud微服务架构与分布式系统实战

本文详细介绍了Spring Cloud在微服务架构和分布式系统中的应用，结合实际案例和最新技术，帮助读者全面掌握微服务的实现与优化。 ... [详细]

蜡笔小新 2024-12-19 16:02:50
io
深入解析BookKeeper的设计与应用场景

本文介绍了由Yahoo在2009年开发并于2011年开源的BookKeeper技术。BookKeeper是一种高效且可靠的日志流存储解决方案，广泛应用于需要高性能和强数据持久性的场景。 ... [详细]

蜡笔小新 2024-12-19 11:08:57
char
MapReduce原理是怎么剖析的

这期内容当中小编将会给大家带来有关MapReduce原理是怎么剖析的，文章内容丰富且以专业的角度为大家分析和叙述，阅读完这篇文章希望大家可以有所收获。1 ... [详细]

蜡笔小新 2024-12-16 18:23:06

麦豪小仙

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章