热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Hadoop学习之路,YARN的配置与安装

篇首语:本文由编程笔记#小编为大家整理,主要介绍了Hadoop学习之路,YARN的配置与安装相关的知识,希望对你有一定的参考价值。Hadoop中YARN的配置

篇首语:本文由编程笔记#小编为大家整理,主要介绍了Hadoop学习之路,YARN的配置与安装相关的知识,希望对你有一定的参考价值。



Hadoop中YARN的配置


etc/hadoop/mapred-site.xml文件编辑



mapreduce.framework.name</name>
yarn</value>
</property>
</configuration>

etc/hadoop/yarn-site.xml文件编辑



yarn.nodemanager.aux-services</name>
mapreduce_shuffle</value>
</property>
</configuration>

启动yarn

[vagary&#64;vagary ~]$ jps
21049 DataNode
2187 Jps
21275 SecondaryNameNode
20926 NameNode
[vagary&#64;vagary ~]$ start-yarn.sh
Starting resourcemanager
Starting nodemanagers
[vagary&#64;vagary ~]$ jps
21049 DataNode
2842 Jps
21275 SecondaryNameNode
2493 NodeManager
2366 ResourceManager
20926 NameNode

然后查看对应端口号

[root&#64;vagary ~]# netstat -nlp | grep 2366
tcp 0 0 0.0.0.0:8088 0.0.0.0:* LISTEN 2366/java
tcp 0 0 0.0.0.0:8030 0.0.0.0:* LISTEN 2366/java
tcp 0 0 0.0.0.0:8031 0.0.0.0:* LISTEN 2366/java
tcp 0 0 0.0.0.0:8032 0.0.0.0:* LISTEN 2366/java
tcp 0 0 0.0.0.0:8033 0.0.0.0:* LISTEN 2366/java

然后web界面查看&#xff0c;这样子我们就算安装成功了&#xff0c;如果访问不成功&#xff0c;证明安全组没打开&#xff0c;打开该端口安全组就行


然后因为8088端口经常会成为挖矿的一个点&#xff0c;所以需要再进行一些配置&#xff0c;伪装端口&#xff0c;再打开yarn-site.xml文件&#xff0c;再加一条设置&#xff0c;这里我修改为9527了&#xff0c;只要改成不常用的都可以


yarn.resourcemanager.webapp.address</name>
$yarn.resourcemanager.hostname:9527</value>
</property>

设置完成&#xff0c;再重新启动yarn&#xff0c;查看端口&#xff0c;已经修改为9527了

[vagary&#64;vagary hadoop]$ jps
17990 ResourceManager
18119 NodeManager
21049 DataNode
18521 Jps
21275 SecondaryNameNode
20926 NameNode
[root&#64;vagary ~]# netstat -nlp | grep 17990
tcp 0 0 0.0.0.0:9527 0.0.0.0:* LISTEN 17990/java
tcp 0 0 0.0.0.0:8030 0.0.0.0:* LISTEN 17990/java
tcp 0 0 0.0.0.0:8031 0.0.0.0:* LISTEN 17990/java
tcp 0 0 0.0.0.0:8032 0.0.0.0:* LISTEN 17990/java
tcp 0 0 0.0.0.0:8033 0.0.0.0:* LISTEN 17990/java

将Hadoop的pid临时路径改到本地,编辑 hadoop-env.sh文件&#xff0c;加入一下配置

[vagary&#64;vagary hadoop]$ vi hadoop-env.sh

export HADOOP_PID_DIR&#61;/home/vagary/tmp
export HADOOP_SECURE_PID_DIR&#61;/home/vagary/tmp

运行一个mapreduce实例&#xff0c;现在本地创建一个txt文件

[vagary&#64;vagary data]$ vi wordcount.txt

文件内容&#xff1a;

hadoop hdfs hdfs hive
hdfs sqoop flume java
Java Hadoop hadoop

在Hadoop上创建文件夹,这里我们选择创建级联文件夹&#xff08;-p&#xff09;

[vagary&#64;vagary data]$ hdfs dfs -mkdir -p /wordcount/input

将文件上传到刚刚创建好的Hadoop文件目录中

[vagary&#64;vagary data]$ hdfs dfs -put wordcount.txt /wordcount/input

运行个mapreduce任务&#xff0c;调用jar&#43;任务名&#43;输入路径&#43;输出路径,具体用法&#xff1a;

[vagary&#64;vagary hadoop]$ hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar wordcount /wordcount/input /wordcount/output

会报以下错误&#xff1a;

需要在etc/hadoop/mapred-site.xml文件下再加入一下配置&#xff1a;


yarn.app.mapreduce.am.env</name>
HADOOP_MAPRED_HOME&#61;$HADOOP_HOME</value>
</property>

mapreduce.map.env</name>
HADOOP_MAPRED_HOME&#61;$HADOOP_HOME</value>
</property>

mapreduce.reduce.env</name>
HADOOP_MAPRED_HOME&#61;$HADOOP_HOME</value>
</property>

yarn.app.mapreduce.am.env含义&#xff1a;
用户为MR应用程序主进程添加了环境变量&#xff0c;指定为逗号分隔的列表
mapreduce.map.env:为map添加环境变量
mapreduce.reduce.env&#xff1a;为reduce添加环境变量
现在再重新运行任务&#xff1a;

[vagary&#64;vagary hadoop]$ hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar wordcount /wordcount/input /wordcount/output

出现以下结果&#xff0c;就成功了&#xff1a;

查看结果显示&#xff1a;

[vagary&#64;vagary hadoop]$ hdfs dfs -cat /wordcount/output/*
2022-03-19 19:02:59,158 INFO sasl.SaslDataTransferClient: SASL encryption trust check: localHostTrusted &#61; false, remoteHostTrusted &#61; false
Hadoop 1
Java 1
flume 1
hadoop 2
hdfs 3
hive 1
java 1
sqoop 1

推荐阅读
  • 本文探讨了一个Web工程项目的需求,即允许用户随时添加定时任务,并通过Quartz框架实现这些任务的自动化调度。文章将介绍如何设计任务表以存储任务信息和执行周期,以及如何通过一个定期扫描机制自动识别并加载新任务到调度系统中。 ... [详细]
  • 本文档旨在提供C语言的基础知识概述,涵盖常量、变量、数据类型、控制结构及函数定义等内容。特别强调了常量的不同类型及其在程序中的应用,以及如何正确声明和使用函数。 ... [详细]
  • 本文详细介绍了PHP中的几种超全局变量,包括$GLOBAL、$_SERVER、$_POST、$_GET等,并探讨了AJAX的工作原理及其优缺点。通过具体示例,帮助读者更好地理解和应用这些技术。 ... [详细]
  • 本文详细介绍了在MyBatis框架中如何通过#和$两种方式来传递SQL查询参数。使用#方式可以提高执行效率,而使用$则有助于在复杂SQL语句中更好地查看日志。此外,文章还探讨了不同场景下的参数传递方法,包括实体对象、基本数据类型以及混合参数的使用。 ... [详细]
  • 本文详细探讨了编程中的命名空间与作用域概念,包括其定义、类型以及在不同上下文中的应用。 ... [详细]
  • 本文探讨了在使用 MyBatis 进行批量数据处理时遇到的参数绑定异常问题,并提供了详细的解决方案。 ... [详细]
  • 本文详细介绍了Socket在Linux内核中的实现机制,包括基本的Socket结构、协议操作集以及不同协议下的具体实现。通过这些内容,读者可以更好地理解Socket的工作原理。 ... [详细]
  • 探讨如何在给定数组中寻找一个连续子数组,使其和至少达到指定值s,同时确保子数组长度最短。 ... [详细]
  • 在Linux系统中使用EncFS实现文件夹加密
    为了保护个人隐私或敏感数据不被未经授权的访问,可以通过加密技术来增强安全性。本文介绍如何在Linux系统上使用EncFS工具创建和管理加密文件夹,以确保即使在系统登录状态下,特定文件夹中的数据也保持加密状态。 ... [详细]
  • 本文探讨了在不同场景下如何高效且安全地存储Token,包括使用定时器刷新、数据库存储等方法,并针对个人开发者与第三方服务平台的不同需求提供了具体建议。 ... [详细]
  • 本文详细介绍了在PHP中如何获取和处理HTTP头部信息,包括通过cURL获取请求头信息、使用header函数发送响应头以及获取客户端HTTP头部的方法。同时,还探讨了PHP中$_SERVER变量的使用,以获取客户端和服务器的相关信息。 ... [详细]
  • 本文介绍了如何在React应用中实现延迟加载以提高性能,以及如何利用自定义Hook和高阶组件(HOC)来增强组件功能。通过这些技术,开发者可以构建更加高效和可维护的应用。 ... [详细]
  • 2023年1月28日网络安全热点
    涵盖最新的网络安全动态,包括OpenSSH和WordPress的安全更新、VirtualBox提权漏洞、以及谷歌推出的新证书验证机制等内容。 ... [详细]
  • Java高级工程师学习路径及面试准备指南
    本文基于一位朋友的PDF面试经验整理,涵盖了Java高级工程师所需掌握的核心知识点,包括数据结构与算法、计算机网络、数据库、操作系统等多个方面,并提供了详细的参考资料和学习建议。 ... [详细]
  • 本文详细介绍了如何在PHP中使用Memcached进行数据缓存,包括服务器连接、数据操作、高级功能等。 ... [详细]
author-avatar
峰的紫色摩天轮
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有