Centos7搭建Hadoop集群(V3.3.4)

作者：太2真人05 | 来源：互联网 | 2023-09-24 15:57

Centos7搭建Hadoop集群V3.3.4一、准备工作1、配置hostname2、hosts映射3、关闭防火墙4、同步时间5、关闭selinux6、配置ssh免密登陆7、重启二

Centos7搭建Hadoop集群V3.3.4

一、准备工作
- 1、配置hostname
- 2、hosts映射
- 3、关闭防火墙
- 4、同步时间
- 5、关闭selinux
- 6、配置ssh免密登陆
- 7、重启
二、安装所需环境
- 1、jdk安装
- 2、hadoop安装
三、修改配置
- hadoop-env.sh
- core-site.xml
- hdfs-site.xml
- mapred-site.xml
- yarn-site.xml
- workers
四、初始化并启动
- 1、初始化
- 2、启动
五、测试hdfs

本次安装Hadoop版本为3.3.4

安装规划(3台机器)

node01 &＃xff1a;192.168.117.20 NameNode DataNode node02 &＃xff1a;192.168.117.21 DataNode node03 &＃xff1a;192.168.117.22 DataNode SecondaryNameNode
一、准备工作

1、配置hostname

hostname分别为node01,node02,node03

# 三台机器分别执行 hostnamectl set-hostname node01 hostnamectl set-hostname node02 hostnamectl set-hostname node03

在这里插入图片描述

2、hosts映射

# 三台机器均要执行 vim /etc/hosts 192.168.117.20 node01 192.168.117.21 node02 192.168.117.22 node03

3、关闭防火墙

systemctl stop firewalld.service systemctl disable firewalld.service

4、同步时间

yum install ntpdate ntpdate ntp5.aliyun.com

在这里插入图片描述

5、关闭selinux

vim /etc/selinux/config 修改为 SELINUX&＃61;disabled

在这里插入图片描述

6、配置ssh免密登陆

# 三台机器均执行一下命令 ssh-keygen -t rsa # 将每台机器的公钥拷贝给每台机器 ssh-copy-id node01 ssh-copy-id node02 ssh-copy-id node03

测试
在这里插入图片描述

7、重启

reboot
二、安装所需环境

1、jdk安装

# 三台机器均执行 cd /etc/profile.d vim jdk.sh # 写入内容 export JAVA_HOME&＃61;/opt/button/jdk export CLASSPATH&＃61;$:CLASSPATH:$JAVA_HOME/lib/ export PATH&＃61;$PATH:$JAVA_HOME/bin # 使配置生效 source /etc/profile

验证

java -version

在这里插入图片描述

2、hadoop安装

下载安装包
配置环境变量

# 三台机器均执行 vim /etc/profile.d/hadoop.sh # 写入内容 export HADOOP_HOME&＃61;/opt/button/hadoop/hadoop-3.3.4 export PATH&＃61;$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin # 使配置生效 source /etc/profile

验证

hadoop version

在这里插入图片描述
创建hadoop数据目录&＃xff1a;

mkdir /opt/button/hadoop/data cd /opt/button/hadoop chmod -R 777 ./data/
三、修改配置

配置位于hadoop解压目录etc/hadoop目录下&＃xff0c;三台机器配置保持一致
在这里插入图片描述

hadoop-env.sh

vim hadoop-env.sh # jdk修改为自己的路径 export JAVA_HOME&＃61;/opt/button/jdk

core-site.xml

 <property> <name>fs.defaultFS</name> <value>hdfs://node01:9000</value> </property> <property> <name>hadoop.tmp.dir</name> <value>/opt/button/hadoop/data</value> </property>  <property> <name>hadoop.http.staticuser.user</name> <value>root</value> </property>  <property> <name>fs.trash.interval</name> <value>1440</value> </property>

hdfs-site.xml

<property> <name>dfs.replication</name> <value>3</value> </property> <property> <name>dfs.namenode.secondary.http-address</name> <value>node03:50090</value> </property> <property> <name>dfs.name.dir</name> <value>/opt/button/hadoop/data/</value> </property> <property> <name>dfs.data.dir</name> <value>/opt/button/hadoop/data/</value> </property>

mapred-site.xml

<property> <name>mapreduce.framework.name</name> <value>yarn</value> </property>

yarn-site.xml

<property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property>  <property> <name>yarn.resourcemanager.hostname</name> <value>node01</value> </property>  <property> <name>yarn.nodemanager.pmem-check-enabled</name> <value>false</value> </property> <property> <name>yarn.nodemanager.vmem-check-enabled</name> <value>false</value> </property>

workers

vim workers # 写入如下内容 node01 node02 node03
四、初始化并启动

1、初始化

如果第一次启动集群需格式化NameNode&＃xff0c;三个节点都操作

hdfs namenode –format

注&＃xff1a;如果不是第一次&＃xff0c;需要先执行stop-all.sh&＃xff0c;然后删除data与logs中的文件再执行初始化命令

2、启动

在node01节点上的sbin目录找到start-all.sh并执行即可
在这里插入图片描述
执行如下操作解决此问题

vim /etc/profile.d/my_env.sh # 添加如下内容 export HDFS_NAMENODE_USER&＃61;root export HDFS_DATANODE_USER&＃61;root export HDFS_SECONDARYNAMENODE_USER&＃61;root export YARN_RESOURCEMANAGER_USER&＃61;root export YARN_NODEMANAGER_USER&＃61;root # 使配置生效 source /etc/profile

重新执行start-all.sh
在这里插入图片描述
查看启动的服务

NameNode默认端口9870
http://192.168.117.20:9870/

ResourceManager默认端口8088

五、测试hdfs

hadoop fs -mkdir /hfile hadoop fs -put input.txt /hfile hadoop fs -ls /hfile

在这里插入图片描述

推荐阅读

main
05Hadoop的HA搭建

前期Linux环境准备1.修改Linux主机名2.修改IP3.修改主机名和IP的映射关系4.关闭防火墙5.ssh免登陆6.安装JDK，配置环境变量等集群规划主机 IP安装软件运行进 ... [详细]

蜡笔小新 2024-10-16 18:20:36
import
Ubuntu 14.04 环境下搭建 Caffe（仅限 CPU）

本文详细介绍了如何在 Ubuntu 14.04 系统上搭建仅使用 CPU 的 Caffe 深度学习框架，包括环境准备、依赖安装及编译过程。 ... [详细]

蜡笔小新 2024-11-22 16:43:30
java
Red Hat Linux 下 GCC 4.4.2 的安装指南

本文详细介绍了在 Red Hat Linux 系统上安装 GCC 4.4.2 的步骤，包括必要的依赖库的安装及常见问题的解决方法。 ... [详细]

蜡笔小新 2024-11-22 10:41:00
spring
Maven + Spring + MyBatis + MySQL 环境搭建与实例解析

本文详细介绍如何使用MySQL数据库进行环境搭建，包括创建数据库表并插入示例数据。随后，逐步指导如何配置Maven项目，整合Spring框架与MyBatis，实现高效的数据访问。 ... [详细]

蜡笔小新 2024-11-21 18:39:23
timezone
Oracle VM VirtualBox 使用指南：创建静态网页及高级功能

本文详细介绍了如何在Oracle VM VirtualBox中实现主机与虚拟机之间的数据交换，包括安装Guest Additions增强功能，以及如何利用这些功能进行文件传输、屏幕调整等操作。 ... [详细]

蜡笔小新 2024-11-21 18:13:22
email
利用 Calcurse 在 Linux 终端高效管理日程与任务

对于喜爱使用 Linux 终端进行日常操作的系统管理员来说，Calcurse 提供了一种强大的方式来管理日程安排、待办事项及会议。本文将详细介绍如何在 Linux 上安装和使用 Calcurse，帮助用户更有效地组织工作。 ... [详细]

蜡笔小新 2024-11-21 17:01:54
request
解决 ChinaASP.Upload 错误 '80040002' - 必须添加版权信息

本文介绍了如何解决 ChinaASP.Upload 错误 '80040002'，即必须添加版权信息的问题，并提供了详细的步骤和注意事项。 ... [详细]

蜡笔小新 2024-11-19 15:12:54
java
hadoop3.1.2 first programdefault wordcount (Mac)

hadoop3.1.2安装完成后的第一个实操示例程 ... [详细]

蜡笔小新 2024-10-15 11:11:55
import
5分钟搭建 vite + vue3 工程，简单，实用！

大厂技术高级前端Node进阶点击上方程序员成长指北，关注公众号回复1，加入高级Node交流群介绍本文主要介绍vitevue3vue-router4vue ... [详细]

蜡笔小新 2024-10-12 18:37:09
client
简述hdfs工作原理_HDFS原理概念扫盲

1、概述hdfs文件系统主要设计为了存储大文件的文件系统；如果有个TB级别的文件，我们该怎么存储呢？分布式文件系统未出现的时候࿰ ... [详细]

蜡笔小新 2024-10-12 13:16:56
chat
2017年9月7日前端技术动态与资讯汇总

2017-09-07前端日报精选JavaScriptEventLoop机制详解与Vue.js中实践应用Redux基础与实践如何用js获取虚拟键盘高度？（ ... [详细]

蜡笔小新 2024-10-22 19:15:38
java
Hadoop + Spark安装(三) —— 调hadoop

***************************测试hadoop及问题跟进***************************执行以下语句报错datahadoop-2.9. ... [详细]

蜡笔小新 2024-10-17 11:56:27
java
【原创】七、Hadoop 2.5.2+zookeeper高可用部署

一、原理（四大要点）（1）保证元数据一致（edits）namenode（fsimage edits）a、NFSb、journalnodec、zk（2）只有一台namenode对外提 ... [详细]

蜡笔小新 2024-10-15 12:25:58
main
本地执行MapReduce程序之后，报的一些错误

【clienteclipse集群提交运行】：客户端eclipse集群提交mapreduce代码1.需求：在master:8088上，有客户 ... [详细]

蜡笔小新 2024-10-15 10:46:12
main
Hadoop之HDFS的概念理解

HDFS是什么？HDFS全称HadoopDistributedFileSystem，简称HDFS，是一个分布式文件系统。它是谷歌的GFS提出之后出现的另外一种文件系统。它有一定高 ... [详细]

蜡笔小新 2024-10-12 10:52:32

太2真人05

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章