史上最详细的Hadoop环境搭建(五)之二

作者：手机用户2502872795 | 来源：互联网 | 2023-09-13 12:31

5、配置hdfs-site.xml&amp;lt;configuration&amp;gt;&amp;lt;property&

5、配置hdfs-site.xml




<configuration>



<property>



<!—配置三台NameNode –>



    <name>dfs.nameservicesname>




    <value>ns1,ns2,ns3value>




  property>




  <property>




<!—第一台NameNode的机器名和rpc端口，指定了NameNode和DataNode通讯用的端口号 –>



    <name>dfs.namenode.rpc-address.ns1name>




    <value>bigdata-senior01.chybinmy.com:8020value>




  property>




   <property>




<!—第一台NameNode的机器名和rpc端口，备用端口号 –>



    <name>dfs.namenode.serviceerpc-address.ns1name>




    <value>bigdata-senior01.chybinmy.com:8022value>




  property>




  <property>




<
!—第一台NameNode的http页面地址和端口号 –>



    <name>dfs.namenode.http-address.ns1name>




    <value>bigdata-senior01.chybinmy.com:50070value>




  property>




<property>



<!—第一台NameNode的https页面地址和端口号 –>



    <name>dfs.namenode.https-address.ns1name>




    <value>bigdata-senior01.chybinmy.com:50470value>




  property>




 



  <property>




    <name>dfs.namenode.rpc-address.ns2name>




    <value>bigdata-senior02.chybinmy.com:8020value>




  property>




   <property>




    <name>dfs.namenode.serviceerpc-address.ns2name>




    <value>bigdata-senior02.chybinmy.com:8022value>




  property>




  <property>




    <name>dfs.namenode.http-address.ns2name>




    <value>bigdata-senior02.chybinmy.com:50070value>




  property>




    <property>




    <name>dfs.namenode.https-address.ns2name>




    <value>bigdata-senior02.chybinmy.com:50470value>




  property>




 



 



  <property>




    <name>dfs.namenode.rpc-address.ns3name>




    <value>bigdata-senior03.chybinmy.com:8020value>




  property>




   <property>




    <name>dfs.namenode.serviceerpc-address.ns3name>




    <value>bigdata-senior03.chybinmy.com:8022value>




  property>




  <property>




    <name>dfs.namenode.http-address.ns3name>




    <value>bigdata-senior03.chybinmy.com:50070value>




  property>




    <property>




    <name>dfs.namenode.https-address.ns3name>




    <value>bigdata-senior03.chybinmy.com:50470value>




  property>




 



configuration>

6、配置core-site.xml




<configuration>



<property>



    <name>hadoop.tmp.dirname>




    <value>/opt/modules/hadoopha/hadoop-2.5.0/data/tmpvalue>




property>



configuration>

hadoop.tmp.dir设置hadoop临时目录地址，默认时，NameNode和DataNode的数据存在这个路径下。

7、配置slaves文件




bigdata-senior01.chybinmy.com



bigdata-senior02.chybinmy.com



bigdata-senior03.chybinmy.com

8、配置yarn-site.xml




<configuration>



<property>



    <name>yarn.nodemanager.aux-servicesname>




    <value>mapreduce_shufflevalue>




 property>     



 <property>




    <name>yarn.resourcemanager.hostnamename>




    <value>bigdata-senior02.chybinmy.comvalue>




 property>     



 <property>




    <name>yarn.log-aggregation-enablename>




    <value>truevalue>




 property>     



 <property>




    <name>yarn.log-aggregation.retain-secondsname>




    <value>106800value>




 property>     



configuration>

9、分发到其他节点

分发之前先将share/doc目录删除，这个目录中是帮助文件，并且很大，可以删除。




[hadoop@bigdata-senior01 hadoop-2.5.0]$ scp -r /opt/modules/ /opt/modules/hadoopfederation bigdata-senior02.chybinmy.com:/opt/modules



[hadoop@bigdata-senior01 hadoop-2.5.0]$ scp -r /opt/modules/hadoopfederation bigdata-senior03.chybinmy.com:/opt/modules

10、格式化NameNode

在第一台上进行NameNode格式化。

[hadoop@bigdata-senior01 hadoop-2.5.0]$ bin/hdfs namenode -format -clusterId hadoop-federation-clusterId

这里一定要指定一个集群ID，使得多个NameNode的集群ID是一样的，因为这三个NameNode在同一个集群中，这里集群ID为hadoop-federation-clusterId。

在第二台NameNode上。

[hadoop@bigdata-senior02 hadoop-2.5.0]$ bin/hdfs namenode -format -clusterId hadoop-federation-clusterId

在第二台NameNode上。

[hadoop@bigdata-senior03 hadoop-2.5.0]$ bin/hdfs namenode -format -clusterId hadoop-federation-clusterId

11、启动NameNode

在第一台、第二台、第三台机器上启动NameNode：




[hadoop@bigdata-senior01 hadoop-2.5.0]$ sbin/hadoop-daemon.sh start namenode



[hadoop@bigdata-senior02 hadoop-2.5.0]$ sbin/hadoop-daemon.sh start namenode



[hadoop@bigdata-senior03 hadoop-2.5.0]$ sbin/hadoop-daemon.sh start namenode

启动后，用jps命令查看是否已经启动成功。

查看HDFS Web页面，此时三个NameNode都是standby状态。

史上最详细的Hadoop环境搭建(五)之二

12、启动DataNode




[hadoop@bigdata-senior01 hadoop-2.5.0]$ sbin/hadoop-daemon.sh start datanode



[hadoop@bigdata-senior02 hadoop-2.5.0]$ sbin/hadoop-daemon.sh start datanode



[hadoop@bigdata-senior03 hadoop-2.5.0]$ sbin/hadoop-daemon.sh start datanode

启动后，用jps命令确认DataNode进程已经启动成功。

四十九、测试HDFS Federation

1、修改core-site.xml

在bigdata-senior01机器上,修改core-site.xml文件，指定连接的NameNode是第一台NameNode。

[[email protected] hadoop-2.5.0]$ vim etc/hadoop/core-site.xml




<configuration>



  <property>




     <name>fs.defaultFSname>




     <value>hdfs://bigdata-senior01.chybinmy.com:8020value>




  property>




<property>



    <name>hadoop.tmp.dirname>




    <value>/opt/modules/hadoopfederation/hadoop-2.5.0/data/tmpvalue>




property>



configuration>

2、在bigdate-senior01上传一个文件到HDFS




[hadoop@bigdata-senior01 hadoop-2.5.0]$ bin/hdfs dfs -mkdir /tmp



[hadoop@bigdata-senior01 hadoop-2.5.0]$ bin/hdfs dfs -put ~/shuffle_daily.sh /tmp/shuffle_daily.sh

3、查看HDFS文件

史上最详细的Hadoop环境搭建(五)之二

可以看到，刚才的文件只上传到了bigdate-senior01机器上的NameNode上了，并没有上传到其他的NameNode上去。

这样，在HDFS的客户端，可以指定要上传到哪个NameNode上，从而来达到了划分NameNode的目的。

后记

这篇文章的操作步骤并不是工作中标准的操作流程，如果在成百上千的机器全部这样安装会被累死，希望读者可以通过文章中一步步地安装，从而初步了解到Hadoop的组成部分，协助过程等，这对于Hadoop的深入使用有很大的帮助。

推荐阅读

js
在 CentOS 6.5 系统上部署 VNC 服务器的详细步骤与配置指南

在 CentOS 6.5 系统上部署 VNC 服务器时，首先需要确认 VNC 服务是否已安装。通常情况下，VNC 服务默认未安装。可以通过运行特定的查询命令来检查其安装状态。如果查询结果为空，则表明 VNC 服务尚未安装，需进行手动安装。此外，建议在安装前确保系统的软件包管理器已更新至最新版本，以避免兼容性问题。 ... [详细]

蜡笔小新 2024-11-07 11:12:58
list
在CentOS系统下详细解析阿里云ECS服务器上搭建LAMP环境的配置步骤

本文详细介绍了在CentOS 6.5 64位系统上使用阿里云ECS服务器搭建LAMP环境的具体步骤。首先，通过PuTTY工具实现远程连接至服务器。接着，检查当前系统的磁盘空间使用情况，确保有足够的空间进行后续操作，可使用 `df` 命令进行查看。此外，文章还涵盖了安装和配置Apache、MySQL和PHP的相关步骤，以及常见问题的解决方法，帮助用户顺利完成LAMP环境的搭建。 ... [详细]

蜡笔小新 2024-11-09 15:09:47
plugins
InfluxDB、collectd与Grafana的详细安装与配置指南

本文详细介绍了 InfluxDB、collectd 和 Grafana 的安装与配置流程。首先，按照启动顺序依次安装并配置 InfluxDB、collectd 和 Grafana。InfluxDB 作为时序数据库，用于存储时间序列数据；collectd 负责数据的采集与传输；Grafana 则用于数据的可视化展示。文中提供了 collectd 的官方文档链接，便于用户参考和进一步了解其配置选项。通过本指南，读者可以轻松搭建一个高效的数据监控系统。 ... [详细]

蜡笔小新 2024-11-11 19:54:24
text
Presto：高效即席查询引擎的深度解析与应用

本文深入解析了Presto这一高效的即席查询引擎，详细探讨了其架构设计及其优缺点。Presto通过内存到内存的数据处理方式，显著提升了查询性能，相比传统的MapReduce查询，不仅减少了数据传输的延迟，还提高了查询的准确性和效率。然而，Presto在大规模数据处理和容错机制方面仍存在一定的局限性。本文还介绍了Presto在实际应用中的多种场景，展示了其在大数据分析领域的强大潜力。 ... [详细]

蜡笔小新 2024-11-07 19:17:47
js
如何在PHP中正确配置错误显示功能

在PHP中正确配置错误显示功能的方法如下：首先，定位并打开“php.ini”配置文件；接着，将“display_errors”参数设置为“On”；最后，在PHP代码文件的顶部添加 `ini_set('display_errors', '1');` 以确保错误信息能够被正确显示。此外，建议在开发环境中启用此功能，而在生产环境中禁用，以避免敏感信息泄露。 ... [详细]

蜡笔小新 2024-11-05 23:42:42
list
利用Apache构建高效稳定的Web服务器环境

本文详细介绍了如何利用Apache构建高效稳定的Web服务器环境。首先，概述了Apache服务器的基本概念及其安装步骤，并深入探讨了相关配置文件的设置方法。接着，通过具体的实验环境示例，展示了服务端（域名：zhangpp63.cn，IP地址：192.168.1.63）和客户端的配置过程，确保读者能够全面理解并实际应用这些技术。此外，还提供了一些优化建议，以提高服务器的性能和稳定性。 ... [详细]

蜡笔小新 2024-11-02 12:31:40
io
Spring 切面配置中的切点表达式详解

本文介绍了如何在Spring框架中使用AspectJ风格的切面配置，详细解释了切点表达式的语法和常见示例，帮助开发者更好地理解和应用Spring AOP。 ... [详细]

蜡笔小新 2024-11-13 14:07:16
text
Spring详解（六）AOP

原文网址：https:www.cnblogs.comysoceanp7476379.html目录1、AOP什么？2、需求3、解决办法1:使用静态代理4 ... [详细]

蜡笔小新 2024-11-12 14:40:40
js
CentOS 7 中 iptables 过滤表实例与 NAT 表应用详解

在 CentOS 7 系统中，iptables 的过滤表和 NAT 表具有重要的应用价值。本文通过具体实例详细介绍了如何配置 iptables 的过滤表，包括编写脚本文件 `/usr/local/sbin/iptables.sh`，并使用 `iptables -F` 清空现有规则。此外，还深入探讨了 NAT 表的配置方法，帮助读者更好地理解和应用这些网络防火墙技术。 ... [详细]

蜡笔小新 2024-11-11 18:33:22
bit
在CentOS 7环境中安装配置Redis及使用Redis Desktop Manager连接时的注意事项与技巧

在 CentOS 7 环境中安装和配置 Redis 时，需要注意一些关键步骤和最佳实践。本文详细介绍了从安装 Redis 到配置其基本参数的全过程，并提供了使用 Redis Desktop Manager 连接 Redis 服务器的技巧和注意事项。此外，还探讨了如何优化性能和确保数据安全，帮助用户在生产环境中高效地管理和使用 Redis。 ... [详细]

蜡笔小新 2024-11-11 18:27:44
uri
REST与RPC：选择哪种API架构风格？

在探讨REST与RPC这两种API架构风格的选择时，本文首先介绍了RPC（远程过程调用）的概念。RPC允许客户端通过网络调用远程服务器上的函数或方法，从而实现分布式系统的功能调用。相比之下，REST（Representational State Transfer）则基于资源的交互模型，通过HTTP协议进行数据传输和操作。本文将详细分析两种架构风格的特点、适用场景及其优缺点，帮助开发者根据具体需求做出合适的选择。 ... [详细]

蜡笔小新 2024-11-07 12:00:58
uri
JavaWeb项目架构中的NFS文件服务器实现与优化

在JavaWeb项目架构中，NFS（网络文件系统）的实现与优化是关键环节。NFS允许不同主机系统通过局域网共享文件和目录，提高资源利用率和数据访问效率。本文详细探讨了NFS在JavaWeb项目中的应用，包括配置、性能优化及常见问题的解决方案，旨在为开发者提供实用的技术参考。 ... [详细]

蜡笔小新 2024-11-06 15:58:12
js
CentOS 7环境下Jenkins的安装与前后端应用部署详解

CentOS 7环境下Jenkins的安装与前后端应用部署详解 ... [详细]

蜡笔小新 2024-11-04 16:46:02
js
基于域名、端口和IP的虚拟主机构建方案

本文探讨了在单台物理服务器上构建多个Web站点的虚拟主机方案，详细介绍了三种主要的虚拟主机类型：基于域名、基于IP地址和基于端口的虚拟主机。每种类型的实现方式及其优缺点均进行了深入分析，为实际应用提供了全面的技术指导。 ... [详细]

蜡笔小新 2024-11-03 13:17:53
list
开发心得：深入探讨Servlet、Dubbo与MyBatis中的责任链模式应用

开发心得：深入探讨Servlet、Dubbo与MyBatis中的责任链模式应用 ... [详细]

蜡笔小新 2024-10-31 20:30:19

手机用户2502872795

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章