作者:喝咖啡的小南瓜_488 | 来源:互联网 | 2023-08-21 15:34
如何进行CM部署客户端配置失败异常的分析,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。
温馨提示:如果使用电脑查看图片不清晰,可以使用手机打开文章单击文中的图片放大查看高清原图。
1.异常描述
在Cloudera Manager修改了服务的客户端配置后,执行部署客户配置报如下异常:
无法成功的部署客户端配置到相应的节点上,在有些时候界面看不到任何异常信息,导致很难定位问题。
2.异常分析及处理
1.由于没有日志信息,不好根据异常分析问题,那我们分析部署成功的日志信息是怎么样的,下面以部署Hive客户端配置日志为例
通过上述两个截图日志可以看到,其实部署客户端的操作就是在部署节点上将/etc/hive/conf.cloudera.hive目录的配置删除,然后将/run/cloudera-scm-agent/process/ccdeploy_hive-conf_xxxx/hive-conf下的配置文件拷贝至/etc/hive/conf.cloudera.hive目录,然后再做授权等操作。
2.通过部署成功的日志,可以得出部署客户端时会在/run/cloudera-scm-agent/process/ccdeploy_*目录下生成客户端临时配置文件
3.登录到部署失败节点(cdh03.fayson.com),进入/run/cloudera-scm-agent/process目录下
在该目录下有大量的部署客户端配置临时文件,那需要根据我们部署失败的时间点找到相应的部署目录,这里Fayson就查找最近时间的部署目录
[root@cdh03 process]# ll -t |grep ccdeploy_ |more
(可左右滑动)
进入上图标识的目录下,可以看到该目录下有logs目录,里面记录了部署客户端配置的详细日志
进入logs目录下,查看stderr.log日志文件内容
在日志的文件末尾看到“/var/lib/alternatives/hadoop-conf empty!”,这里与部署成功的日志有一些区别,因此定位可能是由于该文件为空导致的问题。
4.查看/var/lib/alternatives/hadoop-conf文件
[root@cdh03 alternatives]# ll hadoop-conf
-rw-r--r-- 1 root root 0 Aug 31 09:36 hadoop-conf
[root@cdh03 alternatives]# more hadoop-conf
(可左右滑动)
显示hadoop-conf文件大小为0,文件内没有任何内容。
5.在部署正常的节点上,将/var/lib/alternatives/hadoop-conf文件的内容拷贝至该hadoop-conf文件中
[root@cdh03 alternatives]# more hadoop-conf
auto
/etc/hadoop/conf
/opt/cloudera/parcels/CDH-5.15.0-1.cdh6.15.0.p0.21/etc/hadoop/conf.empty
10
/etc/hadoop/conf.cloudera.yarn
92
/etc/hadoop/conf.cloudera.hdfs
90
(可左右滑动)
修改成功后,重启该节点的cloudera-scm-agent服务。
6.在Cloudera Manager再次执行部署客户端配置测试,如下图所示部署成功
3.总结
在部署客户端失败且没有日志的情况下,我们可以变通下分析问题的方式,可以通过正常部署的日志信息,推断问题可能会出现在哪里?可以通过正常日志分析部署配置每个阶段的操作,去反推部署异常节点的问题。
在/var/lib/alternatives目录下的文件不存在或做了修改后,需要重启cloudera-scm-agent服务来重新加载该目录下的配置文件。
提示:代码块部分可以左右滑动查看
关于如何进行CM部署客户端配置失败异常的分析问题的解答就分享到这里了,希望以上内容可以对大家有一定的帮助,如果你还有很多疑惑没有解开,可以关注编程笔记行业资讯频道了解更多相关知识。