热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

史上最详细的Hadoop环境搭建(五)之二

5、配置hdfs-site.xml<configuration><property&

5、 配置hdfs-site.xml

  1. <configuration>
  2. <property>
  3. <!—配置三台NameNode >
  4. <name>dfs.nameservicesname>
  5. <value>ns1,ns2,ns3value>
  6. property>
  7. <property>
  8. <!—第一台NameNode的机器名和rpc端口,指定了NameNode和DataNode通讯用的端口号 >
  9. <name>dfs.namenode.rpc-address.ns1name>
  10. <value>bigdata-senior01.chybinmy.com:8020value>
  11. property>
  12. <property>
  13. <!—第一台NameNode的机器名和rpc端口,备用端口号 >
  14. <name>dfs.namenode.serviceerpc-address.ns1name>
  15. <value>bigdata-senior01.chybinmy.com:8022value>
  16. property>
  17. <property>
  18. <
    !—第一台NameNode的http页面地址和端口号 >
  19. <name>dfs.namenode.http-address.ns1name>
  20. <value>bigdata-senior01.chybinmy.com:50070value>
  21. property>
  22. <property>
  23. <!—第一台NameNode的https页面地址和端口号 >
  24. <name>dfs.namenode.https-address.ns1name>
  25. <value>bigdata-senior01.chybinmy.com:50470value>
  26. property>
  27. <property>
  28. <name>dfs.namenode.rpc-address.ns2name>
  29. <value>bigdata-senior02.chybinmy.com:8020value>
  30. property>
  31. <property>
  32. <name>dfs.namenode.serviceerpc-address.ns2name>
  33. <value>bigdata-senior02.chybinmy.com:8022value>
  34. property>
  35. <property>
  36. <name>dfs.namenode.http-address.ns2name>
  37. <value>bigdata-senior02.chybinmy.com:50070value>
  38. property>
  39. <property>
  40. <name>dfs.namenode.https-address.ns2name>
  41. <value>bigdata-senior02.chybinmy.com:50470value>
  42. property>
  43. <property>
  44. <name>dfs.namenode.rpc-address.ns3name>
  45. <value>bigdata-senior03.chybinmy.com:8020value>
  46. property>
  47. <property>
  48. <name>dfs.namenode.serviceerpc-address.ns3name>
  49. <value>bigdata-senior03.chybinmy.com:8022value>
  50. property>
  51. <property>
  52. <name>dfs.namenode.http-address.ns3name>
  53. <value>bigdata-senior03.chybinmy.com:50070value>
  54. property>
  55. <property>
  56. <name>dfs.namenode.https-address.ns3name>
  57. <value>bigdata-senior03.chybinmy.com:50470value>
  58. property>
  59. configuration>

6、 配置core-site.xml

  1. <configuration>
  2. <property>
  3. <name>hadoop.tmp.dirname>
  4. <value>/opt/modules/hadoopha/hadoop-2.5.0/data/tmpvalue>
  5. property>
  6. configuration>

hadoop.tmp.dir设置hadoop临时目录地址,默认时,NameNode和DataNode的数据存在这个路径下。

7、 配置slaves文件

  1. bigdata-senior01.chybinmy.com
  2. bigdata-senior02.chybinmy.com
  3. bigdata-senior03.chybinmy.com

8、 配置yarn-site.xml

  1. <configuration>
  2. <property>
  3. <name>yarn.nodemanager.aux-servicesname>
  4. <value>mapreduce_shufflevalue>
  5. property>
  6. <property>
  7. <name>yarn.resourcemanager.hostnamename>
  8. <value>bigdata-senior02.chybinmy.comvalue>
  9. property>
  10. <property>
  11. <name>yarn.log-aggregation-enablename>
  12. <value>truevalue>
  13. property>
  14. <property>
  15. <name>yarn.log-aggregation.retain-secondsname>
  16. <value>106800value>
  17. property>
  18. configuration>

9、 分发到其他节点

分发之前先将share/doc目录删除,这个目录中是帮助文件,并且很大,可以删除。

  1. [hadoop@bigdata-senior01 hadoop-2.5.0]$ scp -r /opt/modules/ /opt/modules/hadoopfederation bigdata-senior02.chybinmy.com:/opt/modules
  2. [hadoop@bigdata-senior01 hadoop-2.5.0]$ scp -r /opt/modules/hadoopfederation bigdata-senior03.chybinmy.com:/opt/modules

10、 格式化NameNode

在第一台上进行NameNode格式化。

[hadoop@bigdata-senior01 hadoop-2.5.0]$ bin/hdfs namenode -format -clusterId hadoop-federation-clusterId

这里一定要指定一个集群ID,使得多个NameNode的集群ID是一样的,因为这三个NameNode在同一个集群中,这里集群ID为hadoop-federation-clusterId。

在第二台NameNode上。

[hadoop@bigdata-senior02 hadoop-2.5.0]$ bin/hdfs namenode -format -clusterId hadoop-federation-clusterId

在第二台NameNode上。

[hadoop@bigdata-senior03 hadoop-2.5.0]$ bin/hdfs namenode -format -clusterId hadoop-federation-clusterId

11、 启动NameNode

在第一台、第二台、第三台机器上启动NameNode:

  1. [hadoop@bigdata-senior01 hadoop-2.5.0]$ sbin/hadoop-daemon.sh start namenode
  2. [hadoop@bigdata-senior02 hadoop-2.5.0]$ sbin/hadoop-daemon.sh start namenode
  3. [hadoop@bigdata-senior03 hadoop-2.5.0]$ sbin/hadoop-daemon.sh start namenode

启动后,用jps命令查看是否已经启动成功。

查看HDFS Web页面,此时三个NameNode都是standby状态。

史上最详细的Hadoop环境搭建(五)之二

史上最详细的Hadoop环境搭建(五)之二

史上最详细的Hadoop环境搭建(五)之二

12、 启动DataNode

  1. [hadoop@bigdata-senior01 hadoop-2.5.0]$ sbin/hadoop-daemon.sh start datanode
  2. [hadoop@bigdata-senior02 hadoop-2.5.0]$ sbin/hadoop-daemon.sh start datanode
  3. [hadoop@bigdata-senior03 hadoop-2.5.0]$ sbin/hadoop-daemon.sh start datanode

启动后,用jps命令确认DataNode进程已经启动成功。

四十九、测试HDFS Federation

1、 修改core-site.xml

在bigdata-senior01机器上,修改core-site.xml文件,指定连接的NameNode是第一台NameNode。

[[email protected] hadoop-2.5.0]$ vim etc/hadoop/core-site.xml

  1. <configuration>
  2. <property>
  3. <name>fs.defaultFSname>
  4. <value>hdfs://bigdata-senior01.chybinmy.com:8020value>
  5. property>
  6. <property>
  7. <name>hadoop.tmp.dirname>
  8. <value>/opt/modules/hadoopfederation/hadoop-2.5.0/data/tmpvalue>
  9. property>
  10. configuration>

2、 在bigdate-senior01上传一个文件到HDFS

  1. [hadoop@bigdata-senior01 hadoop-2.5.0]$ bin/hdfs dfs -mkdir /tmp
  2. [hadoop@bigdata-senior01 hadoop-2.5.0]$ bin/hdfs dfs -put ~/shuffle_daily.sh /tmp/shuffle_daily.sh

3、 查看HDFS文件

史上最详细的Hadoop环境搭建(五)之二

可以看到,刚才的文件只上传到了bigdate-senior01机器上的NameNode上了,并没有上传到其他的NameNode上去。

这样,在HDFS的客户端,可以指定要上传到哪个NameNode上,从而来达到了划分NameNode的目的。

后记

这篇文章的操作步骤并不是工作中标准的操作流程,如果在成百上千的机器全部这样安装会被累死,希望读者可以通过文章中一步步地安装,从而初步了解到Hadoop的组成部分,协助过程等,这对于Hadoop的深入使用有很大的帮助。


推荐阅读
  •        在搭建Hadoop环境之前,请先阅读如下博文,把搭建Hadoop环境之前的准备工作做好,博文如下:       1、CentOS6.7下安装JDK,地址:http:b ... [详细]
  • 【转】腾讯分析系统架构解析
    TA(TencentAnalytics,腾讯分析)是一款面向第三方站长的免费网站分析系统,在数据稳定性、及时性方面广受站长好评,其秒级的实时数据更新频率也获得业界的认可。本文将从实 ... [详细]
  • 本文介绍了Python高级网络编程及TCP/IP协议簇的OSI七层模型。首先简单介绍了七层模型的各层及其封装解封装过程。然后讨论了程序开发中涉及到的网络通信内容,主要包括TCP协议、UDP协议和IPV4协议。最后还介绍了socket编程、聊天socket实现、远程执行命令、上传文件、socketserver及其源码分析等相关内容。 ... [详细]
  • Java序列化对象传给PHP的方法及原理解析
    本文介绍了Java序列化对象传给PHP的方法及原理,包括Java对象传递的方式、序列化的方式、PHP中的序列化用法介绍、Java是否能反序列化PHP的数据、Java序列化的原理以及解决Java序列化中的问题。同时还解释了序列化的概念和作用,以及代码执行序列化所需要的权限。最后指出,序列化会将对象实例的所有字段都进行序列化,使得数据能够被表示为实例的序列化数据,但只有能够解释该格式的代码才能够确定数据的内容。 ... [详细]
  • 本文介绍了如何使用php限制数据库插入的条数并显示每次插入数据库之间的数据数目,以及避免重复提交的方法。同时还介绍了如何限制某一个数据库用户的并发连接数,以及设置数据库的连接数和连接超时时间的方法。最后提供了一些关于浏览器在线用户数和数据库连接数量比例的参考值。 ... [详细]
  • 本文介绍了在mac环境下使用nginx配置nodejs代理服务器的步骤,包括安装nginx、创建目录和文件、配置代理的域名和日志记录等。 ... [详细]
  • Hadoop2.6.0 + 云centos +伪分布式只谈部署
    3.0.3玩不好,现将2.6.0tar.gz上传到usr,chmod-Rhadoop:hadophadoop-2.6.0,rm掉3.0.32.在etcp ... [详细]
  • (九)Docker常用安装
    一、总体步骤1、搜索镜像2、拉取镜像3、查看镜像4、启动镜像5、停止镜像6、移除镜像二、安装tomcat1、dockerhub上面查找tomcat镜像 dockersearchto ... [详细]
  • Hadoop源码解析1Hadoop工程包架构解析
    1 Hadoop中各工程包依赖简述   Google的核心竞争技术是它的计算平台。Google的大牛们用了下面5篇文章,介绍了它们的计算设施。   GoogleCluster:ht ... [详细]
  • mapreduce源码分析总结
    这篇文章总结的非常到位,故而转之一MapReduce概述MapReduce是一个用于大规模数据处理的分布式计算模型,它最初是由Google工程师设计并实现的ÿ ... [详细]
  • MySQL5.6.40在CentOS764下安装过程 ... [详细]
  • 概述本章主要写当慢查询文件很大的时候怎样在线生成一个新的慢查询文件。测试环境:mysql5.6.2 ... [详细]
  • 《Spark核心技术与高级应用》——1.2节Spark的重要扩展
    本节书摘来自华章社区《Spark核心技术与高级应用》一书中的第1章,第1.2节Spark的重要扩展,作者于俊向海代其锋马海平,更多章节内容可以访问云栖社区“华章社区”公众号查看1. ... [详细]
  • SOA架构理解理解SOA架构,了解ESB概念,明白SOA与微服务的区别和联系,了解SOA与热门技术的结合与应用。1、面向服务的架构SOASOA(ServiceOrien ... [详细]
  • 本文详细介绍了MysqlDump和mysqldump进行全库备份的相关知识,包括备份命令的使用方法、my.cnf配置文件的设置、binlog日志的位置指定、增量恢复的方式以及适用于innodb引擎和myisam引擎的备份方法。对于需要进行数据库备份的用户来说,本文提供了一些有价值的参考内容。 ... [详细]
author-avatar
手机用户2502872795
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有