登录MapReduce作业的标准做法

作者：川川shilohjr_993 | 来源：互联网 | 2023-05-25 12:04

如何解决《登录MapReduce作业的标准做法》经验，为你挑选了1个好方法。

我正在尝试找到登录MapReduce作业的最佳方法.我在其他Java应用程序中使用slf4j和log4j appender,但由于MapReduce作业在集群中以分布式方式运行,我不知道应该在哪里设置日志文件位置,因为它是一个访问受限的共享集群特权.

是否有任何标准做法用于登录MapReduce作业,因此您可以在作业完成后轻松查看群集中的日志？

1> Ashrith..：

您可以使用log4j,它是hadoop使用的默认日志记录框架.因此,从MapReduce应用程序中,您可以执行以下操作:

import org.apache.log4j.Logger;
// other imports omitted

public class SampleMapper extends Mapper {
    private Logger logger = Logger.getLogger(SampleMapper.class);

    @Override
    protected void setup(Context context) {
        logger.info("Initializing NoSQL Connection.")
        try {
            // logic for connecting to NoSQL - ommitted
        } catch (Exception ex) {
            logger.error(ex.getMessage());
        }
    }

    @Override
    protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {
        // mapper code ommitted
    }
}

此示例代码将使用log4j logger将事件记录到继承的Mapper记录器.所有日志事件都将记录到各自的任务日志中.您可以从JobTracker(MRv1)/ ResourceManager(MRv2)网页访问任务日志.

如果你正在使用纱线,则可以使用以下命令从命令行访问应用程序日志:

yarn logs -applicationId

如果您使用mapreduce v1,则命令行没有单点访问; 因此,您必须登录每个TaskTracker并查看通常/var/log/hadoop/userlogs/attempt_/syslog在${hadoop.log.dir}/userlogs包含log4j输出中指定的配置路径.

推荐阅读

text
MapReduce编程(一) Intellij Idea配置MapReduce编程环境

介绍怎样在IntellijIdea中通过创建mavenproject配置MapReduce的编程环境。一、软件环境我使用的软件版本号例如以下:IntellijIdea2017.1M ... [详细]

蜡笔小新 2023-10-13 16:56:06
ip
Linux重启网络命令实例及关机和重启示例教程

本文介绍了Linux系统中重启网络命令的实例，以及使用不同方式关机和重启系统的示例教程。包括使用图形界面和控制台访问系统的方法，以及使用shutdown命令进行系统关机和重启的句法和用法。 ... [详细]

蜡笔小新 2023-12-14 15:52:52
list
关于cuowu类的错误提示和使用AdjustmentListener的问题

本文讨论了一个关于cuowu类的问题，作者在使用cuowu类时遇到了错误提示和使用AdjustmentListener的问题。文章提供了16个解决方案，并给出了两个可能导致错误的原因。 ... [详细]

蜡笔小新 2023-12-13 22:09:56
ip
初学者遇到的dubbo设计架构问题及解决方法总结

本文总结了初学者在使用dubbo设计架构过程中遇到的问题，并提供了相应的解决方法。问题包括传输字节流限制、分布式事务、序列化、多点部署、zk端口冲突、服务失败请求3次机制以及启动时检查。通过解决这些问题，初学者能够更好地理解和应用dubbo设计架构。 ... [详细]

蜡笔小新 2023-12-09 10:07:18
ip
20210918堡垒机

什么是堡垒机？堡垒机是一个主机系统，其自身通常经过了一定的加固，具有较高的安全性，可抵御一定的攻击，其作用主 ... [详细]

蜡笔小新 2023-10-14 17:01:39
string
线上问题：JavaBean赋值基础类型抛出异常

1问题复现1.1问题实体（JavaBean规范）赋值时，抛出异常。1.2原因使用基础类型定义属性，当使用null给属 ... [详细]

蜡笔小新 2023-10-13 14:00:21
list
Python3中选择文件对话框的格式打开和保存图片

本文介绍了在Python3中如何使用选择文件对话框的格式打开和保存图片的方法。通过使用tkinter库中的filedialog模块的asksaveasfilename和askopenfilename函数，可以方便地选择要打开或保存的图片文件，并进行相关操作。具体的代码示例和操作步骤也被提供。 ... [详细]

蜡笔小新 2023-12-14 17:46:55
ip
RHEL 7中的系统日志管理和网络管理

本文介绍了在RHEL 7中的系统日志管理和网络管理。系统日志管理包括rsyslog和systemd-journal两种日志服务，分别介绍了它们的特点、配置文件和日志查询方式。网络管理主要介绍了使用nmcli命令查看和配置网络接口的方法，包括查看网卡信息、添加、修改和删除配置文件等操作。 ... [详细]

蜡笔小新 2023-12-09 10:39:58
char
Git版本控制工具中自动增加版本号的替代方案

本文讨论了在使用Git进行版本控制时，如何提供类似CVS中自动增加版本号的功能。作者介绍了Git中的其他版本表示方式，如git describe命令，并提供了使用这些表示方式来确定文件更新情况的示例。此外，文章还介绍了启用$Id:$功能的方法，并讨论了一些开发者在使用Git时的需求和使用场景。 ... [详细]

蜡笔小新 2023-12-09 09:55:13
ip
【转】腾讯分析系统架构解析

TA（TencentAnalytics，腾讯分析）是一款面向第三方站长的免费网站分析系统，在数据稳定性、及时性方面广受站长好评，其秒级的实时数据更新频率也获得业界的认可。本文将从实 ... [详细]

蜡笔小新 2023-10-16 19:05:20
ip
hackingTeam是如何被黑的

hackingTeam是如何被黑的 ... [详细]

蜡笔小新 2023-10-14 17:02:43
grid
《Python3 网络爬虫开发实战》:高效实用的 MongoDB 文档存储

NoSQL，全称NotOnlySQL，意为不仅仅是SQL，泛指非关系型数据库。NoSQL是基于键值对的，而且不需要经过SQL ... [详细]

蜡笔小新 2023-10-13 12:58:52
ip
MySQL数据库简介与基本语法

目录一、MySQL数据库1.简介2.用管理员身份登录3.密码相关操作4.SQL与NoSQL5.数据库重要概念二、MySQL基本语句1.基于库的增删改查2.基于表的增删改查3.基于记 ... [详细]

蜡笔小新 2023-10-13 11:43:58
io
qt mysql 锁_Qt 数据库（支持10种数据库）

Qt提供了QtSql模块来提供平台独立的基于SQL的数据库操作。这里我们所说的“平台独立”，既包括操作系统平台，有包括各个数据库平台。另外， ... [详细]

蜡笔小新 2023-10-12 21:54:51
io
Mycat分库分表全解析 Part 2 数据库切分方式

数据库切 ... [详细]

蜡笔小新 2023-10-12 20:00:19

川川shilohjr_993

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章