热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Hive集成Tez引擎跑任务出现的问题(Javaheapspace问题)

问题1:Hive集成Tez引擎跑任务出现异常:TaskAttempt3failed,info[Error:Errorwhilerunningtask(f

问题1:Hive集成Tez引擎跑任务出现异常:TaskAttempt 3 failed, info=[Error: Error while running task ( failure ) : attempt_1597977573448_0002_1_16_000000_3:java.lang.RuntimeException: java.lang.OutOfMemoryError: Java heap space

看yarn 的job平台是success的,所以想到Tez的内存设置问题,因为Tez引擎是纯内存操作,所以对内存大小肯定有要求。所以查看下tez的设置情况:
在这里插入图片描述
查看了

SET hive.tez.container.size;容器大小:如果8G,去除预留和其他组件给4G,4*1024
SET hive.tez.java.opts;(java内存设置 -Xmx1048m)值一般是80% * 容器大小
SET hive.am.resource.memory.mb;
SET hive.am.java.opts;

以下是调优参数这是:
在这里插入图片描述


问题2:如果报以下问题:

Status: Failed
Vertex's TaskResource is beyond the cluster container capability,Vertex=vertex_1597977573448_0003_1_00 [Map 9], Requested TaskResource=, Cluster MaxContainerCapability=
FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.tez.TezTask. Vertex'
s TaskResource is beyond the cluster container capability,Vertex&#61;vertex_1597977573448_0003_1_00 [Map 9], Requested TaskResource&#61;<memory:4096, vCores:1>, Cluster MaxContainerCapability&#61;<memory:2048, vCores:2>

则继续调整tez内存大小&#xff0c;不能超过yarn的单个任务的最大设置。
在这里插入图片描述
执行ok了
在这里插入图片描述


附录&#xff1a;

一、AM、Container大小设置1、tez.am.resource.memory.mb  #设置 tez AM容器内存默认值&#xff1a;1024  配置文件&#xff1a;tez-site.xml  建议&#xff1a;不小于或者等于yarn.scheduler.minimum-allocation-mb值。2、hive.tez.container.size  #设置 tez container内存默认值&#xff1a;-1默认情况下&#xff0c;Tez将生成一个mapper大小的容器。这可以用来覆盖默认值。配置文件&#xff1a;hive-site-xml  建议&#xff1a;不小于或者是yarn.scheduler.minimum-allocation-mb的倍数
二、AM、Container JVM参数设置
1、tez.am.launch.cmd-opts  #设置 AM jvm&#xff0c;启动TEZ任务进程期间提供的命令行选项。默认值&#xff1a;-XX:&#43;PrintGCDetails -verbose:gc -XX:&#43;PrintGCTimeStamps -XX:&#43;UseNUMA -XX:&#43;UseParallelGC(用于GC)&#xff0c;默认的大小&#xff1a;80%*tez.am.resource.memory.mb  配置文件&#xff1a;tez-site.xml  建议&#xff1a;不要在这些启动选项中设置任何xmx或xms&#xff0c;以便tez可以自动确定它们。  
2、hive.tez.java.ops  #设置 container jvm默认值&#xff1a;Hortonworks建议“–server –Djava.net.preferIPv4Stack&#61;true–XX:NewRatio&#61;8 –XX:&#43;UseNUMA –XX:UseG1G”&#xff0c;默认大小&#xff1a;80%*hive.tez.container.size  说明&#xff1a;在hive 2.x的官方文档中没有找到这个参数。看有些博客里面有这个值。  配置文件&#xff1a;hive-site.xml
3、tez.container.max.java.heap.fraction  #设置task/AM占用jvm内存大小的比例。  默认值&#xff1a;0.8  配置文件&#xff1a;tez-site.xml  说明&#xff1a;这个值按具体需要调整&#xff0c;当内存不足时&#xff0c;一般都要调小。三、Hive内存Map Join参数设置1、tez.runtime.io.sort.mb  #设置输出排序内存大小  默认值&#xff1a;100  配置文件&#xff1a;tez-site.xml  建议&#xff1a;40%*hive.tez.container.size&#xff0c;一般不超过2G2、hive.auto.convert.join.noconditionaltask  #是否将多个mapjoin合并为一个  默认值&#xff1a;true  建议使用默认值。  配置文件&#xff1a;hive-site.xml3、hive.auto.convert.join.noconditionaltask.size   默认值&#xff1a;10000000  (10M)  说明&#xff1a;这个参数使用的前提是hive.auto.convert.join.noconditionaltask值为true&#xff0c;多个mapjoin转换为1个时&#xff0c;所有小表的文件大小总和小于这个值&#xff0c;这个值只是限制输入的表文件的大小&#xff0c;并不代表实际mapjoin时hashtable的大小。 建议值&#xff1a;1/3* hive.tez.container.size  配置文件&#xff1a;hive-site.xml
4、tez.runtime.unordered.output.buffer.size-mb  #如果不直接写入磁盘&#xff0c;使用的缓冲区大小  默认值&#xff1a;100M  建议&#xff1a;10%* hive.tez.container.size  配置文件&#xff1a;tez-site.xml5、tez.am.container.reuse.enabled  #容器重用  默认值&#xff1a;true  配置文件&#xff1a;tez-ste.xml

推荐阅读
  • Java如何导入和导出Excel文件的方法和步骤详解
    本文详细介绍了在SpringBoot中使用Java导入和导出Excel文件的方法和步骤,包括添加操作Excel的依赖、自定义注解等。文章还提供了示例代码,并将代码上传至GitHub供访问。 ... [详细]
  • SpringMVC接收请求参数的方式总结
    本文总结了在SpringMVC开发中处理控制器参数的各种方式,包括处理使用@RequestParam注解的参数、MultipartFile类型参数和Simple类型参数的RequestParamMethodArgumentResolver,处理@RequestBody注解的参数的RequestResponseBodyMethodProcessor,以及PathVariableMapMethodArgumentResol等子类。 ... [详细]
  • VScode格式化文档换行或不换行的设置方法
    本文介绍了在VScode中设置格式化文档换行或不换行的方法,包括使用插件和修改settings.json文件的内容。详细步骤为:找到settings.json文件,将其中的代码替换为指定的代码。 ... [详细]
  • Nginx使用(server参数配置)
    本文介绍了Nginx的使用,重点讲解了server参数配置,包括端口号、主机名、根目录等内容。同时,还介绍了Nginx的反向代理功能。 ... [详细]
  • 开发笔记:加密&json&StringIO模块&BytesIO模块
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了加密&json&StringIO模块&BytesIO模块相关的知识,希望对你有一定的参考价值。一、加密加密 ... [详细]
  • 本文介绍了Java工具类库Hutool,该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装,并提供了各种Util工具类。同时,还介绍了Hutool的组件,包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码,提高开发效率。 ... [详细]
  • android listview OnItemClickListener失效原因
    最近在做listview时发现OnItemClickListener失效的问题,经过查找发现是因为button的原因。不仅listitem中存在button会影响OnItemClickListener事件的失效,还会导致单击后listview每个item的背景改变,使得item中的所有有关焦点的事件都失效。本文给出了一个范例来说明这种情况,并提供了解决方法。 ... [详细]
  • Windows下配置PHP5.6的方法及注意事项
    本文介绍了在Windows系统下配置PHP5.6的步骤及注意事项,包括下载PHP5.6、解压并配置IIS、添加模块映射、测试等。同时提供了一些常见问题的解决方法,如下载缺失的msvcr110.dll文件等。通过本文的指导,读者可以轻松地在Windows系统下配置PHP5.6,并解决一些常见的配置问题。 ... [详细]
  • 使用在线工具jsonschema2pojo根据json生成java对象
    本文介绍了使用在线工具jsonschema2pojo根据json生成java对象的方法。通过该工具,用户只需将json字符串复制到输入框中,即可自动将其转换成java对象。该工具还能解析列表式的json数据,并将嵌套在内层的对象也解析出来。本文以请求github的api为例,展示了使用该工具的步骤和效果。 ... [详细]
  • python限制递归次数(python最大公约数递归)
    本文目录一览:1、python为什么要进行递归限制 ... [详细]
  • JavaWeb中读取文件资源的路径问题及解决方法
    在JavaWeb开发中,读取文件资源的路径是一个常见的问题。本文介绍了使用绝对路径和相对路径两种方法来解决这个问题,并给出了相应的代码示例。同时,还讨论了使用绝对路径的优缺点,以及如何正确使用相对路径来读取文件。通过本文的学习,读者可以掌握在JavaWeb中正确找到和读取文件资源的方法。 ... [详细]
  • ShiftLeft:将静态防护与运行时防护结合的持续性安全防护解决方案
    ShiftLeft公司是一家致力于将应用的静态防护和运行时防护与应用开发自动化工作流相结合以提升软件开发生命周期中的安全性的公司。传统的安全防护方式存在误报率高、人工成本高、耗时长等问题,而ShiftLeft提供的持续性安全防护解决方案能够解决这些问题。通过将下一代静态代码分析与应用开发自动化工作流中涉及的安全工具相结合,ShiftLeft帮助企业实现DevSecOps的安全部分,提供高效、准确的安全能力。 ... [详细]
  • 在一个包含四个活动的活动组中,作者遇到了一个屏幕方向的问题。在其中三个活动中,作者将屏幕方向设置为纵向,但需要一个活动在设备旋转时改变方向。通过删除ActivityGroup在AndroidManifest文件中的Portrait设置,作者解决了这个问题。 ... [详细]
  • 如何优化Webpack打包后的代码分割
    本文介绍了如何通过优化Webpack的代码分割来减小打包后的文件大小。主要包括拆分业务逻辑代码和引入第三方包的代码、配置Webpack插件、异步代码的处理、代码分割重命名、配置vendors和cacheGroups等方面的内容。通过合理配置和优化,可以有效减小打包后的文件大小,提高应用的加载速度。 ... [详细]
  • 从批量eml文件中提取附件的Python代码实现方法
    本文介绍了使用Python代码从批量eml文件中提取附件的实现方法,包括获取eml附件信息、递归文件夹下所有文件、创建目的文件夹等步骤。通过该方法可以方便地提取eml文件中的附件,并保存到指定的文件夹中。 ... [详细]
author-avatar
风飞满天2602938511
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有