Hadoop2.6日志文件解析与MapReduce日志管理深入探讨

作者：ig56mkw | 来源：互联网 | 2024-11-03 16:23

Hadoop2.6主要由HDFS和YARN两大部分组成，其中YARN包含了运行在ResourceManager的JVM中的组件以及在NodeManager中运行的部分。本文深入探讨了Hadoop2.6日志文件的解析方法，并详细介绍了MapReduce日志管理的最佳实践，旨在帮助用户更好地理解和优化日志处理流程，提高系统运维效率。

Hadoop 2.6包含两个大部分&＃xff1a;DFS和Yarn&＃xff0c;而Yarn里面又包含在Resource Manager的JVM中运行的部分和在Node Manager里面运行的JVM部分。所以整个系统&＃xff08;不考虑加装ZooKeeper的HA的情况&＃xff09;的log是分别放在3个log里面的。

1. 对于DFS的log&＃xff0c;在Name Node和Data Node里面&＃xff0c;默认可以在${HADOOP_INSTALL}/logs里面看到。这个是非DFS的文件&＃xff0c;直接可以通过Linux文件系统看到。

2. 对于Yarn的log&＃xff0c;在Resource Manager和Node Manager里面&＃xff0c;默认可以在${HADOOP_INSTALL}/logs里面看到。这个也是非DFS的文件&＃xff0c;直接可以通过Linux文件系统看到。

对于MapReduce任务的log&＃xff0c;情况就比较的复杂了。在2.6里面&＃xff0c;task是按照application->container的层次来管理的&＃xff0c;所以在Name Node机器上运行mapreduce程序的时候&＃xff0c;在console里面看到的log都可以通过在相应的data node/node manager里面的${HADOOP_INSTALL}/logs/userlogs下面找到。这个部分也是非DFS文件&＃xff0c;直接可以通过Linux文件系统看到。
这些log也可以通过Hadoop Web管理页面看到&＃xff0c;比较方便。

网络上搜来的信息基本都是关于上面这些部分的。可对于一个开发人员而言&＃xff0c;上面这些log对于调试程序的帮助就不大了。Java程序员会经常要用System.out/err来输出中间内容到standard output&＃xff0c;而且工业界早就用logger来记录系统状态和帮助调试了。那么我们在mapreduce程序体里面怎么来得到这些log哪。

首先讲讲System.out的输出&＃xff0c;这个网络上的介绍还算详细。基本来说在main方法里面的部分都可以在console上输出。这一点不管是在Eclipse里面通过插件链接DFS运行on MapReduce的时候&＃xff0c;还是直接在namenode上跑jar包&＃xff0c;都可以看的到。直接编程读写DFS的程序也能够通过这个方法来看到中间结果和调试程序。而上面也说了&＃xff0c;因为这个task的部分是运行在resource manager的启动的JVM里面&＃xff08;这个部分不是很确定&＃xff0c;也许是单独启动的一个JVM&＃xff09;&＃xff0c;所以System.out的输出可以看到。而一旦程序进入Mapper和Reducer的部分&＃xff0c;这个时候&＃xff0c;任务是分发到datanode的机器里面跑&＃xff0c;那里的JVM的输出就不会再返回到task的JVM了&＃xff0c;所以在Mapper和Reducer里面的System.out输出是无法看到的。

那么这个时候怎么来写log哪?网络搜索的结果基本给了3个方法&＃xff1a;1. 用log4j来生成logger&＃xff1b;2. 用apache common里面的LogFactory生成logger&＃xff1b;3. 用MultipleOutput来自己写log输出。

1和2本质是一样的&＃xff0c;只是调用现成的Logger类。3是要自己管理log文件的生成和输出&＃xff0c;灵活但是很累。

现在最关键的问题来了。我用Log4j或者LogFactory的Logger输出的log文件在哪里&＃xff1f;搜了一天&＃xff0c;基本讲的都语焉不详&＃xff0c;特别是针对Hadoop 2.6的&＃xff0c;没有找到。综合了几个帖子&＃xff0c;终于发现了问题所在。为了能看到Logger输出的内容&＃xff0c;需要做如下几件事&＃xff1a;

1. 在启动Hadoop集群的时候&＃xff0c;除了start-yarn.sh和start-dfs.sh&＃xff0c;还要启动historyserver&＃xff0c;命令是

[plain] view plaincopy

mr-jobhistory-daemon.sh start historyserver

mr-jobhistory-daemon.sh命令是在${HADOOP_INSTALL}/sbin/目录下面。启动完了&＃xff0c;用jps命令可以看到有JobHistoryServer的进程启动。

启动了HistoryServer后&＃xff0c;就可以看到Tracking URL里面的History了。

还能在Hadoop Web管理界面里看到每个Job的历史Map和Reduce任务&＃xff0c;以及每个任务所在的datanode。

点击Maps和Reduces后面的数字link&＃xff0c;就能看到每个任务运行的情况。

但是当去点击log的链接的时候&＃xff0c;会碰到Aggregation function is not enabled错误。为了能看到每个Map和Reduce任务的Log&＃xff0c;还必须在yarn-site.xml里面配置aggregation为true。

[html] view plaincopy

<property>
<name>yarn.log-aggregation-enablename>
<value>truevalue>
<description>Configuration to enable or disable log aggregationdescription>
property>

然后将yarn-site.xml同步到所有的节点&＃xff0c;在重启集群。这个时候再点击上面那个logs链接&＃xff0c;就可以看到每个任务的log了&＃xff0c;而Logger们输出的内容也在里面&＃xff01;&＃xff01;

到了这里&＃xff0c;就只剩下一个问题了。这个log文件在哪里&＃xff1f;查看yarn-site.xml后终于发现了MapReduce任务的log的位置。

[html] view plaincopy

<name>yarn.nodemanager.remote-app-log-dirname>
<value>/logsvalue>
<description>HDFS directory where the application logs are moved on application completion. Need to set appropriate permissions. Only applicable if log-aggregation is enabled. The default value is "/logs" or "/tmp/logs" description>
t;/property>

注意红色字的部分&＃xff0c;这里清楚的指明了这个log是存放在HDFS文件系统里面的&＃xff0c;不是放在Linux文件系统里面的。在hdfs://namenode/logs/hadoop/logs里面&＃xff0c;终于发现了每个任务对应的log文件夹。每个任务文件夹里有两个文件。分别对应的Map任务和Reduce任务。

[plain] view plaincopy

[hadoop&＃64;SXV2V999 ~]$ hdfs dfs -ls hdfs://namenode/logs/hadoop/logs/application_1430285399789_0001
15/04/29 23:02:01 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
Found 2 items
-rw-r----- 2 hadoop supergroup 58369 2015-04-29 13:32 hdfs://namenode/logs/hadoop/logs/application_1430285399789_0001/hostname_39575
-rw-r----- 2 hadoop supergroup 399834 2015-04-29 13:32 hdfs://namenode/logs/hadoop/logs/application_1430285399789_0001/hostname_54053

hostname部分是对应的datanode的hostname。

在Web页面里显示的也就是从这两个文件里读取并排版的。自此每个log文件的具体位置终于水落石出。

推荐阅读

byte
HBase运维工具全解析

本文深入探讨了HBase常用的运维工具，详细介绍了每种工具的功能、使用场景及操作示例。对于HBase的开发人员和运维工程师来说，这些工具是日常管理和故障排查的重要手段。 ... [详细]

蜡笔小新 2024-12-24 17:00:59
install
Python配置文件读写指南

本文详细介绍如何使用Python进行配置文件的读写操作，涵盖常见的配置文件格式（如INI、JSON、TOML和YAML），并提供具体的代码示例。 ... [详细]

蜡笔小新 2024-12-28 08:39:55
install
网络链路质量监控：Smokeping部署与配置

本文详细介绍了如何在Linux系统上安装和配置Smokeping，以实现对网络链路质量的实时监控。通过详细的步骤和必要的依赖包安装，确保用户能够顺利完成部署并优化其网络性能监控。 ... [详细]

蜡笔小新 2024-12-27 19:31:05
install
Dockerfile 编写与 Docker 网络配置详解

本文详细介绍了 Dockerfile 的编写方法及其在网络配置中的应用，涵盖基础指令、镜像构建与发布流程，并深入探讨了 Docker 的默认网络、容器互联及自定义网络的实现。 ... [详细]

蜡笔小新 2024-12-27 17:31:41
config
编写有趣的VBScript恶作剧脚本

本文将介绍如何编写一些有趣的VBScript脚本，这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例，帮助您了解VBScript的基本语法和功能。 ... [详细]

蜡笔小新 2024-12-28 09:46:23
settings
解决Uploadify在IE浏览器中的兼容性问题

本文详细介绍了如何解决Uploadify插件在Internet Explorer（IE）9和10版本中遇到的点击失效及JQuery运行时错误问题。通过修改相关JavaScript代码，确保上传功能在不同浏览器环境中的一致性和稳定性。 ... [详细]

蜡笔小新 2024-12-27 22:07:40
settings
JQuery基础：省市联动与表单验证

本文介绍了如何使用JQuery实现省市二级联动和表单验证。首先，通过change事件监听用户选择的省份，并动态加载对应的城市列表。其次，详细讲解了使用Validation插件进行表单验证的方法，包括内置规则、自定义规则及实时验证功能。 ... [详细]

蜡笔小新 2024-12-27 17:10:48
install
MySQL 数据库迁移指南：从本地到远程及磁盘间迁移

本文详细介绍了如何在不同场景下进行 MySQL 数据库的迁移，包括从一个硬盘迁移到另一个硬盘、从一台计算机迁移到另一台计算机，以及解决迁移过程中可能遇到的问题。 ... [详细]

蜡笔小新 2024-12-26 13:21:38
version
微软Exchange服务器遭遇2022年版“千年虫”漏洞

微软Exchange服务器在新年伊始遭遇了一个类似于‘千年虫’的日期处理漏洞，导致邮件传输受阻。该问题主要影响配置了FIP-FS恶意软件引擎的Exchange 2016和2019版本。 ... [详细]

蜡笔小新 2024-12-25 14:08:03
version
Hadoop发行版本选择指南：技术解析与应用实践

本文详细介绍了Hadoop的不同发行版本及其特点，帮助读者根据实际需求选择最合适的Hadoop版本。内容涵盖Apache Hadoop、Cloudera CDH等主流版本的特性及应用场景。 ... [详细]

蜡笔小新 2024-12-22 20:38:12
config
window下kafka的安装以及测试

目录一、安装JDK（需要安装依赖javaJDK）二、安装Kafka三、测试参考在Windows系统上安装消息队列kafka一、安装JDKÿ ... [详细]

蜡笔小新 2024-12-16 12:01:36
config
Kafka Topic 数据管理与清理策略

本文探讨了在生产环境中如何有效管理和定期清理Kafka Topic中的数据。介绍了基于时间、日志大小和日志起始偏移量三种清除方式，并重点讲解了基于时间的清除策略及其配置方法。 ... [详细]

蜡笔小新 2024-12-15 13:50:22
rsa
移动 UI 设计基础：打造简洁高效的用户界面

本章将深入探讨移动 UI 设计的核心原则，帮助开发者构建简洁、高效且用户友好的界面。通过学习设计规则和用户体验优化技巧，您将能够创建出既美观又实用的移动应用。 ... [详细]

蜡笔小新 2024-12-27 08:43:40
client
深入解析 org.apache.hadoop.registry.client.impl.zk.ZKPathDumper 类及其应用

本文详细介绍了 Java 中的 org.apache.hadoop.registry.client.impl.zk.ZKPathDumper 类，提供了丰富的代码示例和使用指南。通过这些示例，读者可以更好地理解如何在实际项目中利用 ZKPathDumper 类进行注册表树的转储操作。 ... [详细]

蜡笔小新 2024-12-23 14:15:06
client
ZooKeeper集群脑裂问题及其解决方案

本文深入探讨了ZooKeeper集群中可能出现的脑裂问题，分析其成因，并提供了多种有效的解决方案，确保集群在高可用性环境下的稳定运行。 ... [详细]

蜡笔小新 2024-12-22 17:19:52

ig56mkw

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章