当前位置: 开发笔记 > 编程语言 > 正文

Hadoop-2.3.0-cdh5.1.0完全分布式搭建（基于CentOS）

作者：郭洁蓉4071_878 | 来源：互联网 | 2023-09-07 10:26

nsitionalENhttp:www.w3.orgTRxhtml1DTDxhtml1-transitional.dtd

先参考：《Hadoop-2.3.0-cdh5.1.0伪分布安装（基于CentOS）》 2014-09/106372.htm

注：本例使用root用户搭建

一、环境

操作系统：CentOS 6.5 64位操作系统

注：Hadoop2.0以上采用的是jdk环境是1.7,Linux自带的jdk卸载掉，重新安装

下载地址：http://www.oracle.com/technetwork/java/javase/downloads/index.html

软件版本：hadoop-2.3.0-cdh5.1.0.tar.gz, zookeeper-3.4.5-cdh5.1.0.tar.gz

下载地址：http://archive.cloudera.com/cdh5/cdh/5/

c1:192.168.58.11

c2:192.168.58.12

c3:192.168.58.13

二、安装JDK（略）见上面的参考文章

三、配置环境变量（配置jdk和hadoop的环境变量）

四、系统配置

1关闭防火墙

chkconfig iptables off(永久性关闭)

配置主机名和hosts文件

2、SSH无密码验证配置

因为Hadoop运行过程需要远程管理Hadoop的守护进程，NameNode节点需要通过SSH（Secure Shell）链接各个DataNode节点，停止或启动他们的进程，所以SSH必须是没有密码的，所以我们要把NameNode节点和DataNode节点配制成无秘密通信，同理DataNode也需要配置无密码链接NameNode节点。

在每一台机器上配置：

vi /etc/ssh/sshd_config打开

RSAAuthentication yes # 启用 RSA 认证，PubkeyAuthentication yes # 启用公钥私钥配对认证方式

Master01:运行：ssh-keygen –t rsa –P '' 不输入密码直接enter

默认存放在／root／.ssh目录下,

cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

[root@master01 .ssh]# ls

authorized_keys id_rsa id_rsa.pub known_hosts

远程copy:

scp authorized_keys c2:~/.ssh/

scp authorized_keys c3:~/.ssh/

五、配置几个文件（各个节点一样）

5.1. hadoop/etc/hadoop/hadoop-env.sh 添加：

# set to the root ofyour Java installation
export JAVA_HOME=/usr/java/latest

# Assuming your installation directory is/usr/local/hadoop
export HADOOP_PREFIX=/usr/local/hadoop

5.2. etc/hadoop/core-site.xml

fs.defaultFS
hdfs://c1:9000

hadoop.tmp.dir
/usr/local/cdh/hadoop/data/tmp

5.3. etc/hadoop/hdfs-site.xml

dfs.webhdfs.enabled
true


dfs.replication
2


dfs.namenode.name.dir
/usr/local/cdh/hadoop/data/dfs/name
namenode 存放name table(fsimage)本地目录（需要修改）


dfs.namenode.edits.dir
${dfs.namenode.name.dir}
namenode粗放 transactionfile(edits)本地目录（需要修改）

dfs.datanode.data.dir
/usr/local/cdh/hadoop/data/dfs/data
datanode存放block本地目录（需要修改）

dfs.permissions
false

dfs.permissions.enabled
false

5.4 etc/hadoop/mapred-site.xml

mapreduce.framework.name
yarn

5.5 etc/hadoop/yarn-env.sh

# some Java parameters
export JAVA_HOME=/usr/local/java/jdk1.7.0_67

5.6 etc/hadoop/yarn-site.xml

yarn.resourcemanager.address
c1:8032

yarn.resourcemanager.scheduler.address
c1:8030

yarn.resourcemanager.resource-tracker.address
c1:8031

yarn.resourcemanager.admin.address
c1:8033

yarn.resourcemanager.webapp.address
c1:8088

yarn.nodemanager.aux-services
mapreduce_shuffle

yarn.nodemanager.aux-services.mapreduce.shuffle.class
org.apache.hadoop.mapred.ShuffleHandler

5.7. etc/hadoop/slaves

c2
c3

六：启动及验证安装是否成功

格式化：要先格式化HDFS:

bin/hdfs namenode -format

启动：

sbin/start-dfs.sh
sbin/start-yarn.sh

[root@c1 hadoop]# jps
3250 Jps
2491 ResourceManager
2343 SecondaryNameNode
2170 NameNode

datanode节点：

[root@c2 ~]# jps
4196 Jps
2061 DataNode
2153 NodeManager

--------------------------------------------------------------------------------

Ubuntu 13.04上搭建Hadoop环境 2013-06/86106.htm

Ubuntu 12.10 +Hadoop 1.2.1版本集群配置 2013-09/90600.htm

Ubuntu上搭建Hadoop环境（单机模式+伪分布模式） 2013-01/77681.htm

Ubuntu下Hadoop环境的配置 2012-11/74539.htm

单机版搭建Hadoop环境图文教程详解 2012-02/53927.htm

搭建Hadoop环境（在Winodws环境下用虚拟机虚拟两个Ubuntu系统进行搭建） 2011-12/48894.htm

Hadoop2.4.1尝鲜部署+完整版配置文件 2014-09/106291.htm

--------------------------------------------------------------------------------

1. 打开浏览器

NameNode - http://localhost:50070/

2. 创建文件夹

3. $bin/hdfs dfs -mkdir /user

$ bin/hdfs dfs -mkdir /user/

4. Copy 文件

$ bin/hdfs dfs -put etc/hadoop input

5. 运行作业

$ bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.3.0-cdh5.1.0.jar grep input output 'dfs[a-z.]+'

6. 查看输出

$ bin/hdfs dfs -get output output

$ cat output/*

# Hadoop-2.3.0-cdh5.1.0完全分布式搭建（基于CentOS） #

Hadoop 专题页面 =13

：2014-09/106373.htm

推荐阅读

char
使用Vultr云服务器和Namesilo域名搭建个人网站

本文详细介绍了如何通过Vultr云服务器和Namesilo域名搭建一个功能齐全的个人网站，包括购买、配置服务器以及绑定域名的具体步骤。文章还提供了详细的命令行操作指南，帮助读者顺利完成建站过程。 ... [详细]

蜡笔小新 2024-12-26 16:36:34
process
深入探讨CPU虚拟化与KVM内存管理

本文详细介绍了现代服务器架构中的CPU虚拟化技术，包括SMP、NUMA和MPP三种多处理器结构，并深入探讨了KVM的内存虚拟化机制。通过对比不同架构的特点和应用场景，帮助读者理解如何选择最适合的架构以优化性能。 ... [详细]

蜡笔小新 2024-12-25 19:15:51
io
深入解析网络存储技术

本文详细介绍了网络存储技术的基本概念、分类及应用场景。通过分析直连式存储（DAS）、网络附加存储（NAS）和存储区域网络（SAN）的特点，帮助读者理解不同存储方式的优势与局限性。 ... [详细]

蜡笔小新 2024-12-24 10:38:34
command
解决Hive启动时权限被拒问题

本文详细分析了Hive在启动过程中遇到的权限拒绝错误，并提供了多种解决方案，包括调整文件权限、用户组设置以及环境变量配置等。 ... [详细]

蜡笔小新 2024-12-26 19:14:29
io
MySQL缓存机制深度解析

本文详细探讨了MySQL的缓存机制，包括主从复制、读写分离以及缓存同步策略等内容。通过理解这些概念和技术，读者可以更好地优化数据库性能。 ... [详细]

蜡笔小新 2024-12-26 15:15:06
io
使用Python在SAE上开发新浪微博应用的初步探索

最近重新审视了新浪云平台（SAE）提供的服务，发现其已支持Python开发。本文将详细介绍如何利用Django框架构建一个简单的新浪微博应用，并分享开发过程中的关键步骤。 ... [详细]

蜡笔小新 2024-12-26 13:36:52
ascii
掌握Java EE的全面指南

探讨如何真正掌握Java EE，包括所需技能、工具和实践经验。资深软件教学总监李刚分享了对毕业生简历中常见问题的看法，并提供了详尽的标准。 ... [详细]

蜡笔小新 2024-12-25 13:38:29
text
Linux 透明防火墙（网桥模式）的部署与配置

本文介绍如何在现有网络中部署基于Linux系统的透明防火墙（网桥模式），以实现灵活的时间段控制、流量限制等功能。通过详细的步骤和配置说明，确保内部网络的安全性和稳定性。 ... [详细]

蜡笔小新 2024-12-25 13:17:38
io
在Ubuntu 8.04中安装美观的Cairo-Dock桌面增强工具

本文介绍如何在Ubuntu 8.04系统中安装和配置Cairo-Dock，这款桌面增强工具以其精美的界面和高效的功能备受用户青睐。文章将指导您通过简单的步骤完成安装，并提供一些实用的配置建议。 ... [详细]

蜡笔小新 2024-12-24 14:09:55
char
使用RPM包在本地安装MySQL 5.6

本文详细介绍了如何通过RPM包在Linux系统（如CentOS）上安装MySQL 5.6。涵盖了检查现有安装、下载和安装RPM包、配置MySQL以及设置远程访问和开机自启动等步骤。 ... [详细]

蜡笔小新 2024-12-23 13:36:04
dll
阿里云ecs怎么配置php环境,阿里云ecs配置选择

阿里云ecs怎么配置php环境,阿里云ecs配置选择 ... [详细]

蜡笔小新 2024-12-23 11:12:07
io
在Ubuntu系统中安装Windows 7的详细步骤

本文详细介绍了如何在预装Ubuntu系统的笔记本电脑上安装Windows 7。针对没有光驱的情况，提供了通过USB安装的具体方法，并解决了分区、驱动器无法识别等问题。 ... [详细]

蜡笔小新 2024-12-22 18:26:55
io
Linux系统中设置服务启动优先级的方法

本文详细介绍了Linux系统中init进程的作用及其启动过程，解释了运行级别的概念，并提供了调整服务启动顺序的具体步骤和实例。通过了解这些内容，用户可以更好地管理系统的启动流程和服务配置。 ... [详细]

蜡笔小新 2024-12-25 16:16:05
char
解决网站乱码问题的综合指南

本文总结了导致网站乱码的常见原因，并提供了详细的解决方案，包括文件编码、HTML元标签设置、服务器响应头配置、数据库字符集调整以及PHP与MySQL交互时的编码处理。 ... [详细]

蜡笔小新 2024-12-25 14:57:54
io
CentOS 6.5 上安装 MySQL 5.7.23 的详细步骤

本文详细介绍如何在 CentOS 6.5 系统上成功安装 MySQL 5.7.23，包括卸载旧版本、下载安装包、配置文件修改及启动服务等关键步骤。 ... [详细]

蜡笔小新 2024-12-23 11:16:04

郭洁蓉4071_878

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章