热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Hadoop2.5.0-cdh5.3.6集群搭建

Hadoop2.5.0-cdh5.3.6部署*LocalMode*DistributedMode*伪分布式

Hadoop 2.5.0-cdh5.3.6 部署

    * Local Mode

    * Distributed Mode

        * 伪分布式

            一台机器,运行所有的守护进程,

            从节点DataNode、NodeManager

        * 完全分布式

            有多个从节点

            DataNodes

            NodeManagers

            配置文件

                $HADOOP_HOME/etc/hadoop/slaves

 

================================================================

三台机器

    192.168.159.111        192.168.159.112        192.168.159.113

     bigdata01              bigdata02              bigdata03

        1.5G                   1G                    1G

        1 CPU                  1CPU                  1 CPU

 

配置映射

    /etc/hosts

        192.168.159.111     bigdata01                  bigdata01  

        192.168.159.112     bigdata02                  bigdata02  

        192.168.159.113     bigdata03                  bigdata03  

 

=====================================================================

        bigdata01              bigdata02              bigdata03   

HDFS

        NameNode

        DataNode                DataNode                DataNode

                                                      SecondaryNameNode

YARN

                               ResourceManager

        NodeManager             NodeManager             NodeManager

 

MapReduce

        JobHistoryServer

 

配置

    * hdfs

         *hadoop-env.sh

         *core-site.xml

         *hdfs-site.xml

         *slaves

    * yarn

         *yarn-env.sh

         *yarn-site.xml

         *slaves

    * mapredue

         *mapred-env.sh

         *mapred-site.xml

 

准备工作:

1.    准备三台虚拟机,命名为bigdata01(NameNode,DataNode,NodeManager,JobHistoryServer),bigdata02(DataNode,ResourceManager,NodeManager),bigdata03(DataNode,SecondaryNameNode,NodeManager)

2.    安装系统并配置(bigdata01)

修改主机名

vim /etc/sysconfig/network

Vim /etc/hosts

vim /etc/udev/rules.d/70-persistent-net.rules

vim /etc/sysconfig/network-scripts/ifcfg-eth0

配置完成重启

对bigdata01进行克隆,分别为bigdata02,bigdata03,两台虚拟机也进行如上操作。

利用CRT连接虚拟机bigdata01,bigdata02,bigdata03

3.    免密码登录配置

bigdata01:

ssh-keygen -tras 连续三个回车,生成2个文件: id_rsa和 id_rsa.pub(在/root/.ssh)

 

ssh-copy-idlocalhost

作用:就是把id_rsa.pub中的内容拷贝到authorized_keys

   使用 catid_rsa.pub  >> authorized_keys 可以代替ssh-copy-id localhost这个命令

   对于三台机器,可以把每个节点上的ssh公共密钥的内容放到一个权限文件中即可。

   在bigdata01中配置完authorized_keys中的所有节点公钥内容之后,分别拷贝到其他的节点,命令如下:

 在bigdata01节点上:

scp/root/.ssh/authorized_keys bigdata02:/root/.ssh/

scp/root/.ssh/authorized_keys bigdata03:/root/.ssh/

bigdata02重复以上操作

4.           环境配置

hadoop-env.sh

core-site.xml

hdfs-site.xml

Slaves

yarn-env.sh

yarn-site.xml

mapred-env.sh

mapred-site.xml

在bigdata01上配置完hadoop之后,需要把hadoop的安装目录远程拷贝到其他节点:

scp -R  hadoop-2.5.0-cdh5.3.6/   root@bigdata02:/opt/app

scp -R  hadoop-2.5.0-cdh5.3.6/   root@bigdata03/opt/app

      

5.           集群时间同步

找一台机器

时间服务器

所有的机器与这台机器时间进行定时的同步

    比如,每日十分钟,同步一次时间

# rpm -qa|grep ntp

 

# vi /etc/ntp.conf

server 127.127.1.0 

fudge  127.127.1.0stratum 10

# vi /etc/sysconfig/ntpd

    # Drop root to id'ntp:ntp' by default.

    SYNC_HWCLOCK=yes

    OPTIOnS="-untp:ntp -p /var/run/ntpd.pid -g"

   

[root@bigdata01 hadoop-2.5.0-cdh5.3.6]# service ntpd status

ntpd is stopped

[root@bigdata01 hadoop-2.5.0-cdh5.3.6]# service ntpdstart

Starting ntpd: [  OK  ]

[root@bigdata01 hadoop-2.5.0-cdh5.3.6]# chkconfig ntpdon

 

[root@bigdata03 hadoop-2.5.0-cdh5.3.6]# crontab -e

0-59/10 * * * * /usr/sbin/ntpdate bigdata01

[root@bigdata04 hadoop-2.5.0-cdh5.3.6]# crontab -e

0-59/10 * * * * /usr/sbin/ntpdate bigdata01

 

6.格式化namenode

hdfs namenode -format

 

7启动hadoop

start-dfs.sh

start-yarn.sh

 

mr-jobhistory-daemon.sh start historyserver

http://192.168.159.111:50070 (HDFS管理界面)


推荐阅读
  • 本文探讨了如何在PHP与MySQL环境中实现高效的分页查询,包括基本的分页实现、性能优化技巧以及高级的分页策略。 ... [详细]
  • Docker安全策略与管理
    本文探讨了Docker的安全挑战、核心安全特性及其管理策略,旨在帮助读者深入理解Docker安全机制,并提供实用的安全管理建议。 ... [详细]
  • 本文介绍了Tomcat的基本操作,包括启动、关闭及首次访问的方法,并详细讲解了如何在IDEA中创建Web项目,配置Servlet及其映射,以及如何将项目部署到Tomcat。 ... [详细]
  • Asynchronous JavaScript and XML (AJAX) 的流行很大程度上得益于 Google 在其产品如 Google Suggest 和 Google Maps 中的应用。本文将深入探讨 AJAX 在 .NET 环境下的工作原理及其实现方法。 ... [详细]
  • Python3爬虫入门:pyspider的基本使用[python爬虫入门]
    Python学习网有大量免费的Python入门教程,欢迎大家来学习。本文主要通过爬取去哪儿网的旅游攻略来给大家介绍pyspid ... [详细]
  • 本文详细介绍了如何在 Ubuntu 14.04 系统上搭建仅使用 CPU 的 Caffe 深度学习框架,包括环境准备、依赖安装及编译过程。 ... [详细]
  • 为何Compose与Swarm之后仍有Kubernetes的诞生?
    探讨在已有Compose和Swarm的情况下,Kubernetes是如何以其独特的设计理念和技术优势脱颖而出,成为容器编排领域的领航者。 ... [详细]
  • Maven + Spring + MyBatis + MySQL 环境搭建与实例解析
    本文详细介绍如何使用MySQL数据库进行环境搭建,包括创建数据库表并插入示例数据。随后,逐步指导如何配置Maven项目,整合Spring框架与MyBatis,实现高效的数据访问。 ... [详细]
  • Beetl是一款先进的Java模板引擎,以其丰富的功能、直观的语法、卓越的性能和易于维护的特点著称。它不仅适用于高响应需求的大型网站,也适合功能复杂的CMS管理系统,提供了一种全新的模板开发体验。 ... [详细]
  • 调试利器SSH隧道
    在开发微信公众号或小程序的时候,由于微信平台规则的限制,部分接口需要通过线上域名才能正常访问。但我们一般都会在本地开发,因为这能快速的看到 ... [详细]
  • CentOS下ProFTPD的安装与配置指南
    本文详细介绍在CentOS操作系统上安装和配置ProFTPD服务的方法,包括基本配置、安全设置及高级功能的启用。 ... [详细]
  • 从理想主义者的内心深处萌发的技术信仰,推动了云原生技术在全球范围内的快速发展。本文将带你深入了解阿里巴巴在开源领域的贡献与成就。 ... [详细]
  • 本文提供了处理WordPress网站中出现过多重定向问题的方法,包括检查DNS配置、安装SSL证书以及解决数据库连接错误等步骤。 ... [详细]
  • 精选10款Python框架助力并行与分布式机器学习
    随着神经网络模型的不断深化和复杂化,训练这些模型变得愈发具有挑战性,不仅需要处理大量的权重,还必须克服内存限制等问题。本文将介绍10款优秀的Python框架,帮助开发者高效地实现分布式和并行化的深度学习模型训练。 ... [详细]
  • 深入体验Python的高级交互式Shell - IPython
    IPython 是一个增强型的 Python 交互式 Shell,提供了比标准 Python 控制台更为强大的功能,适用于开发和调试过程。它不仅支持直接执行 Linux 命令,还提供了丰富的特性来提高编程效率。 ... [详细]
author-avatar
qa32qw51
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有