热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Hadoop2.7.2安装与集群搭建

1.环境准备jdk需要1.7以上版本64位.创建hadoop用户.在hadoop用户目录下解压安装包hadoop2.7.2.tar.gz2.配置免密码登录各节点分别执行生成公钥和私

1.环境准备

jdk需要1.7以上版本64位.
创建hadoop用户.
在hadoop用户目录下解压安装包hadoop-2.7.2.tar.gz


2.配置免密码登录

  • 各节点分别执行

生成公钥和私钥:ssh-keygen -t rsa
四次enter.

将公钥添加进公钥库:cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
修改authorized_keys权限:chmod 600 ~/.ssh/authorized_keys
验证:ssh localhost

  • 拷贝

将各节点中id_rsa.pub中的内容共同拷贝到authorized_keys,将authorized_keys覆盖各节点.


3.创建目录

mkdir -p ~/hadoop/dfs/name
mkdir -p ~/hadoop/dfs/data
mkdir -p ~/hadoop/tmp


4.修改配置文件

  • core-site.xml




       hadoop.tmp.dir
       /home/wangkai/hadoop/tmp


       fs.defaultFS
       hdfs://centos7-1:9000


  • hdfs-site.xml



    
        dfs.replication
        3
    
    
        dfs.namenode.name.dir
        file:/home/wangkai/hadoop/dfs/name
    
    
        dfs.datanode.data.dir
        file:/home/wangkai/hadoop/dfs/data
    

  • yarn-site.xml


  
 mapreduce.framework.name 
 yarn 
  
  
 yarn.nodemanager.aux-services 
 mapreduce_shuffle 
  
 
 yarn.resourcemanager.hostname 
 192.168.163.101 
  

注:不配置yarn.resourcemanager.hostname可能会导致从节点的nodemanager无法与主节点resourcemanager通信,默认为0.0.0.0,需要修改.


  • slaves
centos7-1
centos7-2
centos7-3

  • hadoop-env.sh

第一行添加

export JAVA_HOME=/usr/local/jdk1.7.0_79

  • yarn-env.sh

第一行添加:

export JAVA_HOME=/usr/local/jdk1.7.0_79

5.修改系统文件(各节点)

  • /etc/hosts

文件末尾添加

192.168.163.101 centos7-1
192.168.163.102 centos7-2
192.168.163.103 centos7-3

  • ~/.bashrc

文件末尾添加

export JAVA_HOME=/usr/local/jdk1.7.0_79
export HADOOP_HOME=/home/wangkai/hadoop
export CLASSPATH=$JAVA_HOME/lib:$JAVA_HOME/jre/lib:$CLASSPATH
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

source ~/.bashrc


6.启动

将Hadoop文件夹移动至各个节点

  • 清空以下目录

/home/wangkai/hadoop/dfs/name
/home/wangkai/hadoop/dfs/data
/home/wangkai/hadoop/tmp


  • 启动hdfs

执行格式化:hadoop namenode -format
执行start-dfs.sh

查看进程应显示:
NameNode
DataNode
SecondaryNameNode

浏览器访问:192.168.163.101:50070

注意:关闭防火墙
systemctl stop firewalld.service

systemctl disable firewalld.service


  • 启动yarn

执行start-yarn.sh

查看进程应显示:
NodeManager
ResourceManager

浏览器访问: 192.168.163.101:8088


7.Hadoop及其生态的环境匹配

一个典型搭配
Hadoop 2.7.2,HBase 1.2.2 , Hive 2.1.0 ,Zookeeper 3.4.8 ,Sqoop 1.4.6 , Spark 2.0.2 ,Kafka 2.11-0.10.0.0等等


Hadoop2.7.2安装与集群搭建


推荐阅读
  • Hadoop 2.6 主要由 HDFS 和 YARN 两大部分组成,其中 YARN 包含了运行在 ResourceManager 的 JVM 中的组件以及在 NodeManager 中运行的部分。本文深入探讨了 Hadoop 2.6 日志文件的解析方法,并详细介绍了 MapReduce 日志管理的最佳实践,旨在帮助用户更好地理解和优化日志处理流程,提高系统运维效率。 ... [详细]
  • 本文介绍了如何使用Python爬取妙笔阁小说网仙侠系列中所有小说的信息,并将其保存为TXT和CSV格式。主要内容包括如何构造请求头以避免被网站封禁,以及如何利用XPath解析HTML并提取所需信息。 ... [详细]
  • PHP 5.5.31 和 PHP 5.6.17 安全更新发布
    PHP 5.5.31 和 PHP 5.6.17 已正式发布,主要包含多个安全修复。强烈建议所有用户尽快升级至最新版本以确保系统安全。 ... [详细]
  • 本文详细介绍了Linux系统中用于管理IPC(Inter-Process Communication)资源的两个重要命令:ipcs和ipcrm。通过这些命令,用户可以查看和删除系统中的消息队列、共享内存和信号量。 ... [详细]
  • 本文介绍了如何利用Shell脚本高效地部署MHA(MySQL High Availability)高可用集群。通过详细的脚本编写和配置示例,展示了自动化部署过程中的关键步骤和注意事项。该方法不仅简化了集群的部署流程,还提高了系统的稳定性和可用性。 ... [详细]
  • 在使用SSH框架进行项目开发时,经常会遇到一些常见的问题。例如,在Spring配置文件中配置AOP事务声明后,进行单元测试时可能会出现“No Hibernate Session bound to thread”的错误。本文将详细探讨这一问题的原因,并提供有效的解决方案,帮助开发者顺利解决此类问题。 ... [详细]
  • Hadoop + Spark安装(三) —— 调hadoop
    ***************************测试hadoop及问题跟进***************************执行以下语句报错datahadoop-2.9. ... [详细]
  • 前期Linux环境准备1.修改Linux主机名2.修改IP3.修改主机名和IP的映射关系4.关闭防火墙5.ssh免登陆6.安装JDK,配置环境变量等集群规划主机 IP安装软件运行进 ... [详细]
  • 【原创】七、Hadoop 2.5.2+zookeeper高可用部署
    一、原理(四大要点)(1)保证元数据一致(edits)namenode(fsimage edits)a、NFSb、journalnodec、zk(2)只有一台namenode对外提 ... [详细]
  • 【clienteclipse集群提交运行】:客户端eclipse集群提交mapreduce代码1.需求:在master:8088上,有客户 ... [详细]
  • 短视频app源码,Android开发底部滑出菜单首先依赖三方库implementationandroidx.appcompat:appcompat:1.2.0im ... [详细]
  • 事件是程序各部分之间的一种通信方式,也是异步编程的一种实现形式。本文将详细介绍EventTarget接口及其相关方法,以及如何使用监听函数处理事件。 ... [详细]
  • [转]doc,ppt,xls文件格式转PDF格式http:blog.csdn.netlee353086articledetails7920355确实好用。需要注意的是#import ... [详细]
  • Zookeeper作为Apache Hadoop生态系统中的一个重要组件,主要致力于解决分布式应用中的常见数据管理难题。它提供了统一的命名服务、状态同步服务以及集群管理功能,有效提升了分布式系统的可靠性和可维护性。此外,Zookeeper还支持配置管理和临时节点管理,进一步增强了其在复杂分布式环境中的应用价值。 ... [详细]
  • 【并发编程】全面解析 Java 内存模型,一篇文章带你彻底掌握
    本文深入解析了 Java 内存模型(JMM),从基础概念到高级特性进行全面讲解,帮助读者彻底掌握 JMM 的核心原理和应用技巧。通过详细分析内存可见性、原子性和有序性等问题,结合实际代码示例,使开发者能够更好地理解和优化多线程并发程序。 ... [详细]
author-avatar
zwjy2018
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有