org.apache.hadoop.mapred.FileOutputCommitter类的使用及代码示例

作者：狗血饭团联_367 | 来源：互联网 | 2023-09-08 23:04

本文整理了Java中org.apache.hadoop.mapred.FileOutputCommitter类的一些代码示例，展示了FileOutputCo

本文整理了Java中org.apache.hadoop.mapred.FileOutputCommitter类的一些代码示例，展示了FileOutputCommitter类的具体用法。这些代码示例主要来源于Github/Stackoverflow/Maven等平台，是从一些精选项目中提取出来的代码，具有较强的参考意义，能在一定程度帮忙到你。FileOutputCommitter类的具体详情如下：
包路径：org.apache.hadoop.mapred.FileOutputCommitter
类名称：FileOutputCommitter

FileOutputCommitter介绍

[英]An OutputCommitter that commits files specified in job output directory i.e. ${mapreduce.output.fileoutputformat.outputdir}.
[中]提交作业输出目录中指定的文件的OutputCommitter，即${mapreduce.output.fileoutputformat.outputdir}。

代码示例

代码示例来源：origin: org.apache.hadoop/hadoop-mapreduce-client-core

JobContext jCOntext= new JobContextImpl(conf, taskID.getJobID()); TaskAttemptContext tCOntext= new TaskAttemptContextImpl(conf, taskID); FileOutputCommitter committer = new FileOutputCommitter(); committer.setupJob(jContext); committer.setupTask(tContext); committer.abortTask(tContext); File out = new File(outDir.toUri().getPath()); Path workPath = committer.getWorkPath(tContext, outDir); File wp = new File(workPath.toUri().getPath()); File expectedFile = new File(wp, partFile); assertFalse("task temp dir still exists", expectedFile.exists()); committer.abortJob(jContext, JobStatus.State.FAILED); expectedFile = new File(out, FileOutputCommitter.TEMP_DIR_NAME); assertFalse("job temp dir still exists", expectedFile.exists());

代码示例来源：origin: org.apache.hadoop/hadoop-mapreduce-client-core

private void testMapOnlyNoOutputInternal(int version) throws Exception { JobConf cOnf= new JobConf(); //This is not set on purpose. FileOutputFormat.setOutputPath(conf, outDir); conf.set(JobContext.TASK_ATTEMPT_ID, attempt); conf.setInt(org.apache.hadoop.mapreduce.lib.output. FileOutputCommitter.FILEOUTPUTCOMMITTER_ALGORITHM_VERSION, version); JobContext jCOntext= new JobContextImpl(conf, taskID.getJobID()); TaskAttemptContext tCOntext= new TaskAttemptContextImpl(conf, taskID); FileOutputCommitter committer = new FileOutputCommitter(); // setup committer.setupJob(jContext); committer.setupTask(tContext); if(committer.needsTaskCommit(tContext)) { // do commit committer.commitTask(tContext); } committer.commitJob(jContext); // validate output FileUtil.fullyDelete(new File(outDir.toString())); }

代码示例来源：origin: ch.cern.hadoop/hadoop-mapreduce-client-core

@Override public boolean needsTaskCommit(TaskAttemptContext context) throws IOException { return getWrapped(context).needsTaskCommit(context, getTaskAttemptPath(context)); }

代码示例来源：origin: org.apache.hadoop/hadoop-mapreduce-client-core

JobContext jCOntext= new JobContextImpl(conf, taskID.getJobID()); TaskAttemptContext tCOntext= new TaskAttemptContextImpl(conf, taskID); FileOutputCommitter committer = new FileOutputCommitter(); committer.setupJob(jContext); committer.setupTask(tContext); if(committer.needsTaskCommit(tContext)) { committer.commitTask(tContext); Path jobTempDir1 = committer.getCommittedTaskPath(tContext); File jtd1 = new File(jobTempDir1.toUri().getPath()); if (commitVersion == 1) { JobContext jContext2 = new JobContextImpl(conf2, taskID.getJobID()); TaskAttemptContext tContext2 = new TaskAttemptContextImpl(conf2, taskID); FileOutputCommitter committer2 = new FileOutputCommitter(); committer2.setupJob(jContext2); committer2.recoverTask(tContext2); Path jobTempDir2 = committer2.getCommittedTaskPath(tContext2); File jtd2 = new File(jobTempDir2.toUri().getPath()); if (recoveryVersion == 1) { committer2.commitJob(jContext2); validateContent(outDir); FileUtil.fullyDelete(new File(outDir.toString()));

代码示例来源：origin: ch.cern.hadoop/hadoop-mapreduce-client-jobclient

JobContext jCOntext= new JobContextImpl(job, taskID.getJobID()); TaskAttemptContext tCOntext= new TaskAttemptContextImpl(job, taskID); FileOutputCommitter committer = new FileOutputCommitter(); FileOutputFormat.setWorkOutputPath(job, committer.getTaskAttemptPath(tContext)); committer.setupJob(jContext); committer.setupTask(tContext); String file = "test.txt"; committer.commitTask(tContext); committer.commitJob(jContext);

代码示例来源：origin: org.apache.hadoop/hadoop-mapred-test

JobContext jCOntext= new JobContextImpl(job, taskID.getJobID()); TaskAttemptContext tCOntext= new TaskAttemptContextImpl(job, taskID); FileOutputCommitter committer = new FileOutputCommitter(); FileOutputFormat.setWorkOutputPath(job, committer.getTempTaskOutputPath(tContext)); committer.setupJob(jContext); committer.setupTask(tContext); String file = "test.txt"; committer.commitTask(tContext); committer.commitJob(jContext);

代码示例来源：origin: com.facebook.hadoop/hadoop-core

/** * Helper function to create the task's temporary output directory and * return the path to the task's output file. * * @param conf job-configuration * @param name temporary task-output filename * @return path to the task's temporary output file * @throws IOException */ public static Path getTaskOutputPath(JobConf conf, String name) throws IOException { // ${mapred.out.dir} Path outputPath = getOutputPath(conf); if (outputPath == null) { throw new IOException("Undefined job output-path"); } OutputCommitter committer = conf.getOutputCommitter(); Path workPath = outputPath; TaskAttemptContext cOntext= new TaskAttemptContext(conf, TaskAttemptID.forName(conf.get("mapred.task.id"))); if (committer instanceof FileOutputCommitter) { workPath = ((FileOutputCommitter)committer).getWorkPath(context, outputPath); } // ${mapred.out.dir}/_temporary/_${taskid}/${name} return new Path(workPath, name); }

代码示例来源：origin: io.hops/hadoop-mapreduce-client-core

@Private public Path getTaskAttemptPath(TaskAttemptContext context) throws IOException { Path out = getOutputPath(context); return out == null ? null : getTaskAttemptPath(context, out); }

代码示例来源：origin: org.apache.hadoop/hadoop-mapred-test

@Override public void commitJob(JobContext context) throws IOException { Configuration cOnf= context.getConfiguration(); Path share = new Path(conf.get("share")); FileSystem fs = FileSystem.get(conf); while (true) { if (fs.exists(share)) { break; } UtilsForTests.waitFor(100); } super.commitJob(context); } }

代码示例来源：origin: org.apache.hadoop/hadoop-mapred

context.getProgressible().progress(); if (fs.isFile(taskOutput)) { Path finalOutputPath = getFinalPath(jobOutputDir, taskOutput, getTempTaskOutputPath(context)); if (!fs.rename(taskOutput, finalOutputPath)) { if (!fs.delete(finalOutputPath, true)) { } else if(fs.getFileStatus(taskOutput).isDirectory()) { FileStatus[] paths = fs.listStatus(taskOutput); Path finalOutputPath = getFinalPath(jobOutputDir, taskOutput, getTempTaskOutputPath(context)); fs.mkdirs(finalOutputPath); if (paths != null) { for (FileStatus path : paths) { moveTaskOutputs(context, fs, jobOutputDir, path.getPath());

代码示例来源：origin: io.hops/hadoop-mapreduce-client-core

private org.apache.hadoop.mapreduce.lib.output.FileOutputCommitter getWrapped(JobContext context) throws IOException { if(wrapped == null) { wrapped = new org.apache.hadoop.mapreduce.lib.output.FileOutputCommitter( getOutputPath(context), context); } return wrapped; }

代码示例来源：origin: io.hops/hadoop-mapreduce-client-core

public Path getWorkPath(TaskAttemptContext context, Path outputPath) throws IOException { return outputPath == null ? null : getTaskAttemptPath(context, outputPath); }

代码示例来源：origin: io.hops/hadoop-mapreduce-client-core

@Override @Deprecated public void cleanupJob(JobContext context) throws IOException { getWrapped(context).cleanupJob(context); }

代码示例来源：origin: org.apache.hadoop/hadoop-mapred

public void commitTask(TaskAttemptContext context) throws IOException { Path taskOutputPath = getTempTaskOutputPath(context); TaskAttemptID attemptId = context.getTaskAttemptID(); JobConf job = context.getJobConf(); if (taskOutputPath != null) { FileSystem fs = taskOutputPath.getFileSystem(job); context.getProgressible().progress(); if (fs.exists(taskOutputPath)) { Path jobOutputPath = taskOutputPath.getParent().getParent(); // Move the task outputs to their final place moveTaskOutputs(context, fs, jobOutputPath, taskOutputPath); // Delete the temporary task-specific output directory if (!fs.delete(taskOutputPath, true)) { LOG.info("Failed to delete the temporary output" + " directory of task: " + attemptId + " - " + taskOutputPath); } LOG.info("Saved output of task '" + attemptId + "' to " + jobOutputPath); } } }

代码示例来源：origin: com.facebook.hadoop/hadoop-core

public void abortTask(TaskAttemptContext context) throws IOException { Path taskOutputPath = getTempTaskOutputPath(context); try { if (taskOutputPath != null) { FileSystem fs = taskOutputPath.getFileSystem(context.getJobConf()); context.getProgressible().progress(); if (!fs.delete(taskOutputPath, true)) { LOG.warn("Deleting output in " + taskOutputPath + " returns false"); } } } catch (IOException ie) { LOG.warn("Error discarding output in " + taskOutputPath, ie); throw ie; } }

代码示例来源：origin: LiveRamp/hank

public void setupJob(JobContext context) throws IOException { // Finally, set up FileOutputCommitter super.setupJob(context); }

代码示例来源：origin: org.apache.hive.hcatalog/hive-hcatalog-hbase-storage-handler

public HBaseBulkOutputCommitter() { baseOutputCommitter = new FileOutputCommitter(); }

代码示例来源：origin: org.apache.hadoop/hadoop-mapreduce-client-app

@Override public void abortJob(JobContext context, int runState) throws IOException { super.abortJob(context, runState); this.abortJobCalled = true; }

代码示例来源：origin: org.apache.hadoop/hadoop-mapred-test

public void abortTask(TaskAttemptContext context) throws IOException { System.err.println(cleanupLog); String attemptId = System.getProperty("hadoop.tasklog.taskid"); assertNotNull(attemptId); if (attemptId.endsWith("_0")) { assertFalse(Boolean.getBoolean(System .getProperty("hadoop.tasklog.iscleanup"))); } else { assertTrue(Boolean.getBoolean(System .getProperty("hadoop.tasklog.iscleanup"))); } super.abortTask(context); } }

代码示例来源：origin: ch.cern.hadoop/hadoop-mapreduce-client-core

/** * Helper function to create the task's temporary output directory and * return the path to the task's output file. * * @param conf job-configuration * @param name temporary task-output filename * @return path to the task's temporary output file * @throws IOException */ public static Path getTaskOutputPath(JobConf conf, String name) throws IOException { // ${mapred.out.dir} Path outputPath = getOutputPath(conf); if (outputPath == null) { throw new IOException("Undefined job output-path"); } OutputCommitter committer = conf.getOutputCommitter(); Path workPath = outputPath; TaskAttemptContext cOntext= new TaskAttemptContextImpl(conf, TaskAttemptID.forName(conf.get( JobContext.TASK_ATTEMPT_ID))); if (committer instanceof FileOutputCommitter) { workPath = ((FileOutputCommitter)committer).getWorkPath(context, outputPath); } // ${mapred.out.dir}/_temporary/_${taskid}/${name} return new Path(workPath, name); }

推荐阅读

java
javax.mail.search.BodyTerm.matchPart()方法的使用及代码示例

javax.mail.search.BodyTerm.matchPart()方法的使用及代码示例 ... [详细]

蜡笔小新 2024-11-13 15:24:50
metadata
Pentaho Kettle 中 RowMetaInterface.writeMeta 方法详解与代码示例

本文详细介绍了 Pentaho Kettle 中 RowMetaInterface.writeMeta 方法的使用，并提供了多个代码示例，帮助开发者更好地理解和应用该方法。 ... [详细]

蜡笔小新 2024-11-13 16:21:25
eval
com.sun.javadoc.PackageDoc.exceptions()方法的使用及代码示例

com.sun.javadoc.PackageDoc.exceptions()方法的使用及代码示例 ... [详细]

蜡笔小新 2024-11-13 10:47:33
java
Java 并发编程：深入解析 AtomicInteger 和 CAS 无锁算法

在多线程并发环境中，普通变量的操作往往是线程不安全的。本文通过一个简单的例子，展示了如何使用 AtomicInteger 类及其核心的 CAS 无锁算法来保证线程安全。 ... [详细]

蜡笔小新 2024-11-12 16:40:04
tree
【数据结构】线段数/segment tree/interval tree

【线段树】　　本质是二叉树，每个节点表示一个区间[L,R]，设m(R-L+1)2(该处结果向下取整)左孩子区间为[L，m]，右孩子区间为[m ... [详细]

蜡笔小新 2024-11-14 23:11:47
int
Go语言中正则表达式的简易应用

本文介绍了Go语言中正则表达式的基本使用方法，并提供了一些实用的示例代码。 ... [详细]

蜡笔小新 2024-11-14 20:27:47
java
Cookie学习小结

Cookie学习小结 ... [详细]

蜡笔小新 2024-11-14 16:26:25
java
Android Studio SQLite 数据库增删改查简单（代码参考）

一个建表一个执行crud操作建表代码importandroid.content.Context;importandroid.database.sqlite.SQLiteDat ... [详细]

蜡笔小新 2024-11-14 11:01:49
java
Spring Data JdbcTemplate 入门指南

本文将介绍如何使用 Spring JdbcTemplate 进行数据库操作，包括查询和插入数据。我们将通过一个学生表的示例来演示具体步骤。 ... [详细]

蜡笔小新 2024-11-14 10:33:29
int
将.o文件链接到.elf文件时

我有一个从C项目编译的.o文件，该文件引用了名为init_static_pool ... [详细]

蜡笔小新 2024-11-14 10:07:21
java
HDFS API

Hadoop的文件操作位于包org.apache.hadoop.fs里面，能够进行新建、删除、修改等操作。比较重要的几个类：(1)Configurati ... [详细]

蜡笔小新 2024-11-13 17:31:50
int
Android 自定义加载对话框 CustomProgressDialog

本文介绍如何在 Android 中自定义加载对话框 CustomProgressDialog，包括自定义 View 类和 XML 布局文件的详细步骤。 ... [详细]

蜡笔小新 2024-11-12 21:51:00
eval
Python 使用 DOM 和 SAX 解析 XML 的应用实例

本文介绍如何使用 Python 的 DOM 和 SAX 方法解析 XML 文件，并通过示例展示了如何动态创建数据库表和处理大量数据的实时插入。 ... [详细]

蜡笔小新 2024-11-12 16:10:39
int
Android 系统版本号获取方法详解

本文详细介绍了如何在 Android 应用中获取系统的版本号，包括具体的应用场景和实现步骤。 ... [详细]

蜡笔小新 2024-11-12 14:43:24
java
com.hazelcast.config.MapConfig.isStatisticsEnabled()方法的使用及代码示例

com.hazelcast.config.MapConfig.isStatisticsEnabled()方法的使用及代码示例 ... [详细]

蜡笔小新 2024-11-12 14:33:17

狗血饭团联_367

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章