当前位置: 开发笔记 > 运维 > 正文

hadoop动态增加和删除节点方法介绍

作者：蓝田学园赴嘉兴镇海吉林实践团队 | 来源：互联网 | 2021-12-20 03:25

这篇文章主要介绍了hadoop动态增加和删除节点方法介绍，小编觉得挺不错的，这里分享给大家，需要的朋友可以参考。

上一篇文章中我们介绍了Hadoop编程基于MR程序实现倒排索引示例的有关内容，这里我们看看如何在Hadoop中动态地增加和删除节点（DataNode）。

假设集群操作系统均为：CentOS 6.7 x64

Hadoop版本为：2.6.3

一、动态增加DataNode

1、准备新的DataNode节点机器，配置SSH互信，可以直接复制已有DataNode中.ssh目录中的authorized_keys和id_rsa

2、复制Hadoop运行目录、hdfs目录及tmp目录至新的DataNode

3、在新DataNode上启动hadoop

..sbin/hadoop-daemon.sh start datanode 
..sbin/yarn-daemon.sh start datanode

4、在NameNode上刷新节点

..bin/hdfs dfsadmin -refreshNodes 
..sbin/start-balancer.sh

5、为方便下次启动，可以将新DataNode的域名和ip加入/etc/hosts中

二、动态删除DataNode

1、配置NameNode的hdfs-site.xml，适当减小dfs.replication副本数，增加dfs.hosts.exclude配置

 
  dfs.hosts.exclude 
  /usr/local/hadoop2/etc/hadoop/excludes

2、在对应路径（/etc/hadoop/）下新建excludes文件，并写入待删除DataNode的ip或域名
3、在NameNode上刷新所有DataNode

..bin/hdfs dfsadmin -refreshNodes 
..sbin/start-balancer.sh

4、此时，可以在web检测界面（ip:50070）上可以观测到DataNode逐渐变为Dead。

总结

以上就是本文关于hadoop动态增加和删除节点方法介绍的全部内容，希望对大家有所帮助。感兴趣的朋友可以继续参阅本站：浅谈七种常见的Hadoop和Spark项目案例、hadoop重新格式化HDFS步骤解析等，有什么问题可以直接留言，小编会及时回复大家的。感谢朋友们对本站的支持！

推荐阅读

shell
Apache Spark 基础操作指南

本文详细介绍如何使用 Apache Spark 执行基本任务，包括启动 Spark Shell、运行示例程序以及编写简单的 WordCount 程序。同时提供了参数配置的注意事项和优化建议。 ... [详细]

蜡笔小新 2024-12-20 18:01:20
容器
深入解析Hadoop的核心组件与工作原理

本文详细介绍了Hadoop的三大核心组件：分布式文件系统HDFS、资源管理器YARN和分布式计算框架MapReduce。通过分析这些组件的工作机制，帮助读者更好地理解Hadoop的架构及其在大数据处理中的应用。 ... [详细]

蜡笔小新 2024-12-19 17:17:51
service
在Linux系统上构建Web服务器的详细步骤

本文详细介绍了如何在Linux系统上搭建Web服务器的过程，包括安装Apache、PHP和MySQL等关键组件，以及遇到的一些常见问题及其解决方案。 ... [详细]

蜡笔小新 2024-12-17 19:02:43
port
MapReduce原理是怎么剖析的

这期内容当中小编将会给大家带来有关MapReduce原理是怎么剖析的，文章内容丰富且以专业的角度为大家分析和叙述，阅读完这篇文章希望大家可以有所收获。1 ... [详细]

蜡笔小新 2024-12-16 18:23:06
port
深入浅出：Hadoop架构详解

Hadoop作为大数据处理的核心技术，包含了一系列组件如HDFS（分布式文件系统）、YARN（资源管理框架）和MapReduce（并行计算模型）。本文将通过实例解析Hadoop的工作原理及其优势。 ... [详细]

蜡笔小新 2024-11-26 13:26:40
service
CentOS 7.2 配置防火墙端口开放

本文介绍如何在 CentOS 7.2 系统上配置防火墙以开放特定的服务端口，包括 FTP 服务的临时与永久开放方法，以及如何验证配置是否生效。 ... [详细]

蜡笔小新 2024-12-18 20:58:47
service
RedHat 系统下配置国内 YUM 源以替代官方收费源的方法

本文详细介绍如何在 RedHat Linux 中安装并配置 YUM 包管理器，并通过使用国内镜像源来解决因未购买官方服务而导致的更新源限制问题。 ... [详细]

蜡笔小新 2024-12-18 20:23:06
service
CentOS 7环境下GitLab服务器的构建与配置

本文详细介绍了如何在CentOS 7操作系统上搭建GitLab服务器的过程，包括环境准备、软件安装及基本配置等关键步骤。 ... [详细]

蜡笔小新 2024-12-14 10:29:23
dns
Twisted网络编程必备（1）注：测试版本Twisted10.1.0.winxp32py2.6，对于原代码略有修改

转自：http:www.yybug.comread-htm-tid-15324.html为什么使用Twisted? 如果你并不准备使用Twisted，你可能有很多异议。为什么使用T ... [详细]

蜡笔小新 2024-12-13 14:57:51
dns
解决Jenkins登录后显示空白页的权限配置问题

本文详细介绍了如何通过修改 Jenkins 的配置文件来解决因权限设置不当导致的登录后页面为空的问题，包括多种权限配置策略的选择与应用。 ... [详细]

蜡笔小新 2024-12-12 08:26:17
dns
Elasticsearch (ES) 基础概念解析

本文介绍了Elasticsearch (ES)，这是一个基于Java开发的开源全文搜索引擎。ES通过JSON接口提供服务，支持分布式集群管理和索引功能，特别适合大规模数据的快速搜索与分析。 ... [详细]

蜡笔小新 2024-12-06 18:41:45
tomcat
深入解析Rsync的工作机制与部署实践

本文详细介绍了Rsync的数据同步工具，包括其核心算法、安装配置方法以及实际应用中的注意事项，适合IT运维人员和技术爱好者阅读。 ... [详细]

蜡笔小新 2024-12-06 12:00:01
tomcat
全面解析Hive：数据仓库工具概览

本文介绍了Hive作为基于Hadoop的数据仓库工具的核心概念，包括其基本功能、使用理由、特点以及与Hadoop的关系。同时，文章还探讨了Hive相较于传统关系型数据库的不同之处，并展望了Hive的发展前景。 ... [详细]

蜡笔小新 2024-12-05 10:44:18
server
HBase RegionServer 故障分析与解决

本文详细记录了一次 HBase RegionServer 异常宕机的情况，包括具体的错误信息和可能的原因分析。通过此案例，探讨了如何有效诊断并解决 HBase 中常见的 RegionServer 挂起问题。 ... [详细]

蜡笔小新 2024-12-01 16:21:27
server
大数据SQL优化：全面解析数据倾斜解决方案

本文深入探讨了大数据SQL优化中的数据倾斜问题，提供了多种解决策略和实际案例，旨在帮助读者理解和应对这一常见挑战。 ... [详细]

蜡笔小新 2024-11-29 13:37:00

蓝田学园赴嘉兴镇海吉林实践团队

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章