当前位置: 开发笔记 > 编程语言 > 正文

Hadoop2.6.4完全分布式搭建

作者：陆寥频 | 来源：互联网 | 2023-08-04 15:52

资源准备准备4台Linux服务器要求：glibc版本2.14192.168.9.1192.168.9.2192.168.9.3192.168.9.4安装配置JDK1.7+（详细操

资源准备

准备4台 Linux 服务器要求：glibc 版本 >= 2.14
192.168.9.1
192.168.9.2
192.168.9.3
192.168.9.4
安装配置 JDK1.7+（详细操作）
下载：hadoop-2.6.4

服务器配置

4台服务器分别创建用户hadoop

root@XXX# useradd hadoop
root@XXX# echo &＃8216;hadoop&＃8217; | passwd &＃8211;stdin hadoop

4台服务器分别配置 hosts

root@XXX# vi /etc/hosts

添加内容如下：

192.168.9.1 master
192.168.9.2 secmaster
192.168.9.3 slave0
192.168.9.4 slave1

master 主机免密码登陆其他主机配置
在各个主机上生成 SSH 密钥

hadoop@XXX$ ssh-keygen -t rsa -P &＃8221; -f ~/.ssh/id_rsa

在 master 主机上copy公钥

hadoop@192.168.9.1$ ssh-copy-id -i secmaster 输入密码：hadoop即copy公钥成功
hadoop@192.168.9.1$ ssh-copy-id -i slave0 输入密码：hadoop即copy公钥成功
hadoop@192.168.9.1$ ssh-copy-id -i slave1 输入密码：hadoop即copy公钥成功

测试ssh免登陆

在192.168.9.1主机上执行如下命令确保 master 可以实现对其他主机的免密码登陆，首次执行需要输入&＃8221;yes&＃8221; 确认
hadoop@192.168.9.1$ ssh secmaster
hadoop@192.168.9.1$ ssh slave0
hadoop@192.168.9.1$ ssh slave1

hadoop自身配置

在 master(192.168.9.1) 主机上解压 hadoop-2.6.4.tar.gz

hadoop@192.168.9.1$ tar xvf hadoop-2.6.4.tar.gz

配置 etc/hadoop/core-site.xml

fs.default.name hdfs://master:9000 io.file.buffer.size 131072 hadoop.tmp.dir /home/hadoop/tmp hadoop.proxyuser.u0.hosts * hadoop.proxyuser.u0.groups *

配置 etc/hadoop/hdfs-site.xml

dfs.replication 2 dfs.namenode.secondary.http-address secmaster:9001 dfs.namenode.name.dir file:/home/hadoop/dfs/name dfs.datanode.data.dir file:/home/hadoop/dfs/data dfs.webhdfs.enabled true

配置 etc/hadoop/mapred-site.xml

mapreduce.framework.name yarn mapreduce.jobhistory.address master:10020 mapreduce.jobhistory.webapp.address master:19888

配置etc/hadoop/yarn-site.xml

yarn.nodemanager.aux-services mapreduce_shuffle yarn.nodemanager.aux-services.mapreduce.shuffle.class org.apache.hadoop.mapred.ShuffleHandler yarn.resourcemanager.address master:8032 yarn.resourcemanager.scheduler.address master:8030 yarn.resourcemanager.resource-tracker.address master:8031 yarn.resourcemanager.admin.address master:8033 yarn.resourcemanager.webapp.address master:8088

Master向各个节点同步配置完毕后的 hadoop 工程

hadoop@192.168.9.1$ scp -r /home/hadoop/hadoop-2.6.4 hadoop@secmaster:/home/hadoop
hadoop@192.168.9.1$ scp -r /home/hadoop/hadoop-2.6.4 hadoop@slave0:/home/hadoop
hadoop@192.168.9.1$ scp -r /home/hadoop/hadoop-2.6.4 hadoop@slave1:/home/hadoop

格式化 namenode，启动 hadoop 所有组件

[hadoop@192.168.9.1hadoop2.6.4]$ bin/hadoop namenode -format
[hadoop@192.168.9.1hadoop2.6.4]$ sbin/start-all.sh

如果不出意外完全分布式的 hadoop cluster 已经运行起来了^_

推荐阅读

cmd
windows部署hadoop2.7.0

这里使用自己编译的hadoop-2.7.0版本部署在windows上，记得几年前，部署hadoop需要借助于cygwin，还需要开启ssh服务，最近发现，原来不需要借助cy ... [详细]

蜡笔小新 2023-10-17 21:04:04
cmd
MR程序的几种提交运行模式

MR程序的几种提交运行模式本地模型运行1在windows的eclipse里面直接运行main方法，就会将job提交给本地执行器localjobrunner执行-- ... [详细]

蜡笔小新 2023-10-16 18:29:26
get
Azkaban（三）Azkaban的使用

界面介绍首页有四个菜单projects：最重要的部分，创建一个工程，所有flows将在工程中运行。scheduling:显示定时任务executing:显示当前运行的任务histo ... [详细]

蜡笔小新 2023-10-15 23:43:11
get
每天收获一点点Hadoop概述

一、Hadoop来历Hadoop的思想来源于Google在做搜索引擎的时候出现一个很大的问题就是这么多网页我如何才能以最快的速度来搜索到，由于这个问题Google发明 ... [详细]

蜡笔小新 2023-12-14 18:58:01
client
sqoop自定义分隔符的实现方法及步骤详解

本文介绍了在sqoop1.4.*版本中，如何实现自定义分隔符的方法及步骤。通过修改sqoop生成的java文件，并重新编译，可以满足实际开发中对分隔符的需求。具体步骤包括修改java文件中的一行代码，重新编译所需的hadoop包等。详细步骤和编译方法在本文中都有详细说明。 ... [详细]

蜡笔小新 2023-12-10 11:29:22
install
Maven构建Hadoop,

Maven构建Hadoop工程阅读目录序Maven安装构建示例下载系列索引序　　上一篇，我们编写了第一个MapReduce，并且成功的运行了Job，Hadoop1.x是通过ant ... [详细]

蜡笔小新 2023-10-17 16:11:18
stream
什么是大数据lambda架构

一、什么是Lambda架构Lambda架构由Storm的作者[NathanMarz]提出，根据维基百科的定义，Lambda架构的设计是为了在处理大规模数 ... [详细]

蜡笔小新 2023-10-17 16:06:09
stream
Hadoop源码解析1Hadoop工程包架构解析

1 Hadoop中各工程包依赖简述 Google的核心竞争技术是它的计算平台。Google的大牛们用了下面5篇文章，介绍了它们的计算设施。 GoogleCluster：ht ... [详细]

蜡笔小新 2023-10-17 13:28:20
text
hadoop学习；block数据块；mapreduce实现样例；UnsupportedClassVersionError异常；关联项目源代码...

对于开源的东东，尤其是刚出来不久，我认为最好的学习方式就是能够看源代码和doc，測试它的样例为了方便查看源代码，关联导入源代 ... [详细]

蜡笔小新 2023-10-17 09:49:38
text
Kylin 单节点安装

软件环境Hadoop:2.7,3.1(sincev2.5)Hive:0.13-1.2.1HBase:1.1,2.0(sincev2.5)Spark(optional)2.3.0K ... [详细]

蜡笔小新 2023-10-16 16:09:42
text
Hadoop学习笔记1：伪分布式环境搭建

在搭建Hadoop环境之前，请先阅读如下博文，把搭建Hadoop环境之前的准备工作做好，博文如下： 1、CentOS6.7下安装JDK,地址：http:b ... [详细]

蜡笔小新 2023-10-16 16:04:04
get
Hadoop （CDH4发行版）集群部署（部署脚本，namenode高可用，hadoop管理）

前言折腾了一段时间hadoop的部署管理，写下此系列博客记录一下。为了避免各位做部署这种重复性的劳动，我已经把部署的步骤写成脚本，各位只需要按着本文把脚本执行完，整个环境基本就部署 ... [详细]

蜡笔小新 2023-10-16 15:11:51
get
hadoop基础----hadoop实战(六)-----hadoop管理工具---Cloudera Manager---CDH介绍

我们在之前的文章中已经初步介绍了Cloudera。hadoop基础----hadoop实战(零)-----hadoop的平台版本选择从版本选择这篇文章中我们了解到除了hadoop官方版本外很多 ... [详细]

蜡笔小新 2023-10-16 14:21:13
client
MapReduce工作流程最详细解释

MapReduce是我们再进行离线大数据处理的时候经常要使用的计算模型，MapReduce的计算过程被封装的很好，我们只用使用Map和Reduce函数，所以对其整体的计算过程不是太 ... [详细]

蜡笔小新 2023-10-16 14:14:27
client
MapReduce 切片机制源码分析

总体来说大概有以下2个大的步骤1.连接集群(yarnrunner或者是localjobrunner)2.submitter.submitJobInternal()在该方法中会创建 ... [详细]

蜡笔小新 2023-10-16 13:03:18