热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

hbase伪集群搭建

hbase数据存储有三种跑法,跑在本地磁盘上、跑在伪分布式上、跑在完全分布式上--------额。。。官网的文档挺坑爹的,结合官网、百度、谷歌的各种

hbase 数据存储有三种跑法,跑在本地磁盘上、跑在伪分布式上、跑在完全分布式上--------
额。。。官网的文档挺坑爹的,结合官网、百度、谷歌的各种文档看,只要理解原理,搭建也不算难(当然照的官网文档个看就比较坑爹了)
单机模式 ------->> 这个最简单,免写了,下了包直接解压配置个路径就可以启动了,zk 和 hbase 都是起在同一个 jvm 中的,数据落到本地磁盘。
伪分布式部署方式 ------->> 先部署 hdfs , 再部署 hbase ,它们的各个进程跑在不同的 jvm 中 , hbase只是将数据落到了 hdfs 上。
完全分布式 ------->> 完全分布式用大白话来说,我理解的就是个 伪分布式的 升级款,只是把伪分布式的一台服务器变成了 n 台。。。

完全分布式一定要部署在 物理机上

上边蛋扯的差不多了,下面直接入正题,开始部署
下载什么版本的包自己解决,要想下载最轻松的全部安装包,直接到 cdh 上去下载,百度搜索 cdh ,你懂的、、、然后配置文件每个版本的基本上差不多,没有太大的出入
下面是以 hadoop-2.7.2 、 hbase-1.1.2 为例

一、新系统的话,自己先处理一下系统,这个习惯相信所有运维同行的哥哥们都是有这习惯的。。。关闭不用的防火墙、最大文件打开数、jdk全局变量、dns、主机名解析
建议配置时用 ip 的最后用内网的域名,这样的话,开发的代码也好接入做好的 hbase,用主机名的话,开发的还得自己的 hosts ,我这里用的 内网的 dns 域名。

二、部署 hdfs

包传到 服务器上,解压

hadoop-2.7.2.tar.gz
tar xvf  hadoop-2.7.2.tar.gz  -C /home
cd /home/hadoop-2.7.2
vim etc/hadoop/hadoop-env.sh

export JAVA_HOME=/usr/lib/jvm/jdk1.7.0_72

配置HDFS 之 core-site.xml

mkdir data
vim etc/hadoop/core-site.xml

 
    fs.defaultFS
    hdfs://pretend.hdfs.gag.cn:9000
            
 
 
    hadoop.tmp.dir
    /home/hadoop-2.7.2/data/tmp
            
 

配置HDFS 之 hdfs-site.xml

vim etc/hadoop/hdfs-site.xml
   
   
    dfs.replication
    1
            
   

配置HDFS 之 YARN, 这原配置文件里什么也没有,都是注释内容,直接改名就行

mv etc/hadoop/mapred-site.xml.template etc/hadoop/mapred-site.xml
vim etc/hadoop/mapred-site.xml

  
  
    mapreduce.framework.name
    yarn
    
  

配置HDFS 之 yarn-site.xml

 vim etc/hadoop/yarn-site.xml
  
  
    yarn.nodemanager.aux-services
    mapreduce_shuffle
            
  

启动 hdfs
初次启动 hdfs 先要初始化文件系统,也可以说是格式化文件系统

    bin/hdfs namenode -format

hbase伪集群搭建

格式化完毕,启动NameNod和DataNode进程
启动之前如果修改 jvm 参数的话,在 vim etc/hadoop/hadoop-env.sh 修改 HADOOP_HEAPSIZE 这一项就可以了,默认应该是 1024M

sbin/start-dfs.sh

启动以后,有这里显示有 三个配置文件,是 out 后缀的,看日志的话,看 log 后缀的,看有没有 error 级别的报错
hbase伪集群搭建

启动YARN

     sbin/start-yarn.sh 

同样是去看这两个的 log 后缀的日志
这里了 hdfs 就算启动完毕了,这时再 jps 命令可以看到除 jps 进程外有 5 个
hbase伪集群搭建

查看端口已经有这么多了, 50070 是 hdfs 的 web 端口,以后输入 ip:port 或者 域名:port 来查看 web 页面
hbase伪集群搭建
hbase伪集群搭建

======================================================================

以上 hdfs 启动没问题后,就可以启动 hbase 了

     tar xvf hbase-1.1.2-bin.tar.gz -C /home/        
     cd /home/hbase-1.1.2/   
     vim conf/hbase-env.sh   
     export JAVA_HOME=/usr/lib/jvm/jdk1.7.0_72

配置Hbase

mkdir data
vim conf/hbase-site.xml 

     
   
      hbase.rootdir
      hdfs://pretend.hdfs.gag.cn:9000/hbase
            
  
  
     hbase.zookeeper.property.dataDir
     /home/hbase-1.1.2/data
             
  
  
     hbase.cluster.distributed
     true
             
  

hbase 集群内的服务器,如果是启动完全分布式,这里要填写hbase所有的服务器域名或者 ip 或者 主机名,顺便说一下,hbase和 hadoop 集群全部是已 ssh 远程 调用命令的方式启动其他节点的

    vim conf/regionservers      
    pretend.hbase.gag.cn

这里的话,我把内存调整了一下,因为开发那边要用,服务器是 8G 的

    vim conf/hbase-env.sh 
    export HBASE_MASTER_OPTS="$HBASE_MASTER_OPTS -XX:PermSize=512m -XX:MaxPermSize=512m"
export HBASE_REGIONSERVER_OPTS="$HBASE_REGIONSERVER_OPTS -XX:PermSize=512m -XX:MaxPermSize=512m"

启动Hbase

先启动 zookeeper,如果是完全分布式的话,所有的 hbase节点会以临时节点的方式注册在 zk 里,伪分布式也一样,只不过zk 里只有一个节点,zk 也只有一个节点

 bin/hbase-daemon.sh start zookeeper         启动后查看日志
 bin/hbase-daemon.sh start master               启动后查看日志
 bin/hbase-daemon.sh start regionserver      启动后查看日志

此时的 jps 可以查看到除 jps 外 8 个进程
hbase伪集群搭建

hbase 的 web 页面端口是 16010
hbase伪集群搭建

如果要加 开机启动的话,最好加上sleep等待,我是这样加的
hbase伪集群搭建

正常停止方式:
一定要按照顺序停止
停止 hbase、zookeeper、hdfs


推荐阅读
  • 本文详细分析了Hive在启动过程中遇到的权限拒绝错误,并提供了多种解决方案,包括调整文件权限、用户组设置以及环境变量配置等。 ... [详细]
  • HBase运维工具全解析
    本文深入探讨了HBase常用的运维工具,详细介绍了每种工具的功能、使用场景及操作示例。对于HBase的开发人员和运维工程师来说,这些工具是日常管理和故障排查的重要手段。 ... [详细]
  • 本文探讨了如何在日常工作中通过优化效率和深入研究核心技术,将技术和知识转化为实际收益。文章结合个人经验,分享了提高工作效率、掌握高价值技能以及选择合适工作环境的方法,帮助读者更好地实现技术变现。 ... [详细]
  • 全面解析运维监控:白盒与黑盒监控及四大黄金指标
    本文深入探讨了白盒和黑盒监控的概念,以及它们在系统监控中的应用。通过详细分析基础监控和业务监控的不同采集方法,结合四个黄金指标的解读,帮助读者更好地理解和实施有效的监控策略。 ... [详细]
  • 本文详细介绍了使用ZooKeeper构建高可用集群的方法,包括必要的软件环境准备、配置文件调整及集群启动等关键步骤。通常,一个ZooKeeper集群由奇数个节点组成,以确保Leader选举的有效性。 ... [详细]
  • 58同城的Elasticsearch应用与平台构建实践
    本文由58同城高级架构师于伯伟分享,由陈树昌编辑整理,内容源自DataFunTalk。文章探讨了Elasticsearch作为分布式搜索和分析引擎的应用,特别是在58同城的实施案例,包括集群优化、典型应用实例及自动化平台建设等方面。 ... [详细]
  • 网络运维工程师负责确保企业IT基础设施的稳定运行,保障业务连续性和数据安全。他们需要具备多种技能,包括搭建和维护网络环境、监控系统性能、处理突发事件等。本文将探讨网络运维工程师的职业前景及其平均薪酬水平。 ... [详细]
  • Hadoop入门与核心组件详解
    本文详细介绍了Hadoop的基础知识及其核心组件,包括HDFS、MapReduce和YARN。通过本文,读者可以全面了解Hadoop的生态系统及应用场景。 ... [详细]
  • 探讨如何真正掌握Java EE,包括所需技能、工具和实践经验。资深软件教学总监李刚分享了对毕业生简历中常见问题的看法,并提供了详尽的标准。 ... [详细]
  • 本文探讨了2012年4月期间,淘宝在技术架构上的关键数据和发展历程。涵盖了从早期PHP到Java的转型,以及在分布式计算、存储和网络流量管理方面的创新。 ... [详细]
  • 远程过程调用(RPC)是一种允许客户端通过网络请求服务器执行特定功能的技术。它简化了分布式系统的交互,使开发者可以像调用本地函数一样调用远程服务,并获得返回结果。本文将深入探讨RPC的工作原理、发展历程及其在现代技术中的应用。 ... [详细]
  • 深入解析BookKeeper的设计与应用场景
    本文介绍了由Yahoo在2009年开发并于2011年开源的BookKeeper技术。BookKeeper是一种高效且可靠的日志流存储解决方案,广泛应用于需要高性能和强数据持久性的场景。 ... [详细]
  • 优化使用Apache + Memcached-Session-Manager + Tomcat集群方案
    本文探讨了使用Apache、Memcached-Session-Manager和Tomcat集群构建高性能Web应用过程中遇到的问题及解决方案。通过重新设计物理架构,解决了单虚拟机环境无法真实模拟分布式环境的问题,并详细记录了性能测试结果。 ... [详细]
  • 深入解析:主流开源分布式文件系统综述
    本文详细探讨了几款主流的开源分布式文件系统,包括HDFS、MooseFS、Lustre、GlusterFS和CephFS,重点分析了它们的元数据管理和数据一致性机制,旨在为读者提供深入的技术见解。 ... [详细]
  • 构建Filebeat-Kafka-Logstash-ElasticSearch-Kibana日志收集体系
    本文介绍了如何使用Filebeat、Kafka、Logstash、ElasticSearch和Kibana构建一个高效、可扩展的日志收集与分析系统。各组件分别承担不同的职责,确保日志数据能够被有效收集、处理、存储及可视化。 ... [详细]
author-avatar
麦豪小仙
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有