热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

利用ClouderaManager进行核心进程迁移

环境信息操作系统系统:Centos7JDK:1.7CDH版本:5.8.4利用ClouderaManager迁移zookeeper进入zookeeperinstance界面停止一台老

环境信息

  • 操作系统系统:Centos7
  • JDK:1.7
  • CDH 版本:5.8.4

利用Cloudera Manager 迁移zookeeper

  • 进入zookeeper instance界面
  • 停止一台老的zookeeper服务
  • 确保zookeeper服务成功选举出新的leader节点(可通过命令echo "stat" | nc nfjd-hadoop-test01 2181查看每个zookeeper节点状态)
  • 从zookeeper instance界面删除老的zookeeper节点
  • 添加新的zookeeper节点
  • 进入新的zookeeper节点详细页面,启动zookeeper服务(zookeeper instance界面无法拉起服务,报错信息:Starting these new ZooKeeper Servers may cause the existing ZooKeeper Datastore to be lost. Try again after restarting any existing ZooKeeper Servers with outdated configurations. If you do not want to preserve the existing Datastore, you can start each ZooKeeper Server from its respective Status page.)
  • 确保zookeeper状态页面为1个leader节点其他全为Follower
  • 依次重启其他过期配置zookeeper节点
  • 重启其他过期配置服务,例:hdfs,yarn,hbase等
  • 重新部署客户端配置文件
  • 在hdfs服务中执行Failover Controller手动切换一次NameNode主备Go to the HDFS service -> Click the Instances tab -> Federation and High Availability -> Actions -> Manual Failover

注:每次迁移一台机器,迁移过程中保证一台Leader,其他全是Follower。测试环境验证可以先迁移再重启其他依赖服务。

官方文档:https://www.cloudera.com/documentation/enterprise/5-8-x/topics/cm_mc_zookeeper_service.html#ReplacingZkServerCM

利用Cloudera Manager进行HDFS核心进程迁移 (NameNode,Failover Controller,JournalNode)

准备阶段

  • HDFS 已启用 HA 并使用 quorum-based storage
  • 未启用 Federation
  • automatic failover 已启用,且 ZooKeeper 服务正常
  • 目标主机在集群中
  • Hue 服务的 HDFS Web Interface Role 属性设置为 HttpFS
  • 备份所有 NameNode 和 JournalNode 上的数据目录(dfs.namenode.name.dirdfs.journalnode.edits.dir)[可让namenode进入安全模式,做一次check point再备份最新fsimage文件即可]
  • Finalize the metadata upgrade (NameNode)
  • 迁移namenode主机acl用户

迁移过程中:

  • 确保多数 JournalNode 正常运行
  • 一次只迁移一台主机上的服务

迁移操作:

  • HDFS –> Instances –> Migrate Roles
  • 选择待迁移的主机,然后勾选 NameNode、JournalNode、Failover Controller
  • 选择目标主机,并勾选 Delete existing role data on the destination host
  • 勾选 Yes, I am ready to restart the cluster now

问题汇总

迁移问题

Saving namespace of NameNode on host nfjd-hadoop02-node56.jpushoa.com.
Command aborted because of exception: Command timed-out after 90 seconds
# 执行check point超时,正常情况下无法在90s内完成check point,但是CM这步写死了只能在90秒完成,否则迁移终止(目前结论)

解决步骤
根据日志信息找到执行的hdfs.sh脚本所在位置(主机需正确)

-bash-4.1$ locate hdfs.sh
/opt/cloudera/parcels/CDH-5.6.0-1.cdh5.6.0.p0.45/lib/hadoop/libexec/init-hdfs.sh
/opt/cloudera/parcels/CDH-5.7.0-1.cdh5.7.0.p0.45/lib/hadoop/libexec/init-hdfs.sh
/opt/cloudera/parcels/CDH-5.7.3-1.cdh5.7.3.p0.5/lib/hadoop/libexec/init-hdfs.sh
/opt/cloudera/parcels/CDH-5.7.5-1.cdh5.7.5.p0.3/lib/hadoop/libexec/init-hdfs.sh
/opt/cloudera/parcels/CDH-5.8.4-1.cdh5.8.4.p0.5/lib/hadoop/libexec/init-hdfs.sh
/opt/cloudera/parcels/CDH-5.9.0-1.cdh5.9.0.p0.23/lib/hadoop/libexec/init-hdfs.sh
/usr/lib64/cmf/service/dr/snapshot-hdfs.sh
/usr/lib64/cmf/service/hdfs/hdfs.sh <--这一个

debug脚本,未发现可调超时参数(页面也无相关参数)

sh -x /usr/lib64/cmf/service/hdfs/hdfs.sh "dfsadmin" "-fs" "hdfs://nfjd-hadoop02-node27.jpushoa.com:8020" "-saveNamespace"

尝试修改脚本(务必确保最近一次check point完成,检查fsimage文件是否生成)

$ vi /usr/lib64/cmf/service/hdfs/hdfs.sh
# 在行'#!/bin/bash'后添加以下代码,执行saveNamespace命令直接退出
if [ ${4} == "-saveNamespace" ];then
exit
fi

重新执行migrate操作

后续操作

HIVE 服务
  • 停止 Hive 服务
  • Update Hive Metastore NameNodes
  • 启动 Hive 服务
迁移 HttpFS
  • 在新主机上添加一个 HttpFS
  • Hue 服务的 HDFS Web Interface Role 属性设置为新的 HttpFS
  • 更新其他依赖于 HttpFS 的配置
  • 删除旧主机上的 HttpFS 服务
迁移 NFS Gateway
  • 在新主机上添加一个 NFS Gateway
  • 更新依赖于 NFS Gateway 的配置
  • 删除旧主机上的 NFS Gateway 服务
迁移 Balancer
重新部署客户端配置文件

推荐阅读
  • 本文详细介绍了在Linux虚拟化部署中进行VLAN配置的方法。首先要确认Linux系统内核是否已经支持VLAN功能,然后配置物理网卡、子网卡和虚拟VLAN网卡的关系。接着介绍了在Linux配置VLAN Trunk的步骤,包括将物理网卡添加到VLAN、检查添加的VLAN虚拟网卡信息以及重启网络服务等。最后,通过验证连通性来确认配置是否成功。 ... [详细]
  • Nginx使用AWStats日志分析的步骤及注意事项
    本文介绍了在Centos7操作系统上使用Nginx和AWStats进行日志分析的步骤和注意事项。通过AWStats可以统计网站的访问量、IP地址、操作系统、浏览器等信息,并提供精确到每月、每日、每小时的数据。在部署AWStats之前需要确认服务器上已经安装了Perl环境,并进行DNS解析。 ... [详细]
  • centos安装Mysql的方法及步骤详解
    本文介绍了centos安装Mysql的两种方式:rpm方式和绿色方式安装,详细介绍了安装所需的软件包以及安装过程中的注意事项,包括检查是否安装成功的方法。通过本文,读者可以了解到在centos系统上如何正确安装Mysql。 ... [详细]
  • Hadoop2.6.0 + 云centos +伪分布式只谈部署
    3.0.3玩不好,现将2.6.0tar.gz上传到usr,chmod-Rhadoop:hadophadoop-2.6.0,rm掉3.0.32.在etcp ... [详细]
  • Kylin 单节点安装
    软件环境Hadoop:2.7,3.1(sincev2.5)Hive:0.13-1.2.1HBase:1.1,2.0(sincev2.5)Spark(optional)2.3.0K ... [详细]
  •        在搭建Hadoop环境之前,请先阅读如下博文,把搭建Hadoop环境之前的准备工作做好,博文如下:       1、CentOS6.7下安装JDK,地址:http:b ... [详细]
  • Linux服务器密码过期策略、登录次数限制、私钥登录等配置方法
    本文介绍了在Linux服务器上进行密码过期策略、登录次数限制、私钥登录等配置的方法。通过修改配置文件中的参数,可以设置密码的有效期、最小间隔时间、最小长度,并在密码过期前进行提示。同时还介绍了如何进行公钥登录和修改默认账户用户名的操作。详细步骤和注意事项可参考本文内容。 ... [详细]
  • 本文介绍了Web学习历程记录中关于Tomcat的基本概念和配置。首先解释了Web静态Web资源和动态Web资源的概念,以及C/S架构和B/S架构的区别。然后介绍了常见的Web服务器,包括Weblogic、WebSphere和Tomcat。接着详细讲解了Tomcat的虚拟主机、web应用和虚拟路径映射的概念和配置过程。最后简要介绍了http协议的作用。本文内容详实,适合初学者了解Tomcat的基础知识。 ... [详细]
  • HDFS2.x新特性
    一、集群间数据拷贝scp实现两个远程主机之间的文件复制scp-rhello.txtroothadoop103:useratguiguhello.txt推pushscp-rr ... [详细]
  • 利用Visual Basic开发SAP接口程序初探的方法与原理
    本文介绍了利用Visual Basic开发SAP接口程序的方法与原理,以及SAP R/3系统的特点和二次开发平台ABAP的使用。通过程序接口自动读取SAP R/3的数据表或视图,在外部进行处理和利用水晶报表等工具生成符合中国人习惯的报表样式。具体介绍了RFC调用的原理和模型,并强调本文主要不讨论SAP R/3函数的开发,而是针对使用SAP的公司的非ABAP开发人员提供了初步的接口程序开发指导。 ... [详细]
  • 本文讨论了如何在codeigniter中识别来自angularjs的请求,并提供了两种方法的代码示例。作者尝试了$this->input->is_ajax_request()和自定义函数is_ajax(),但都没有成功。最后,作者展示了一个ajax请求的示例代码。 ... [详细]
  • iOS Swift中如何实现自动登录?
    本文介绍了在iOS Swift中如何实现自动登录的方法,包括使用故事板、SWRevealViewController等技术,以及解决用户注销后重新登录自动跳转到主页的问题。 ... [详细]
  • 【重识云原生】第四章云网络4.8.3.2节——Open vSwitch工作原理详解
    2OpenvSwitch架构2.1OVS整体架构ovs-vswitchd:守护程序,实现交换功能,和Linux内核兼容模块一起,实现基于流的交换flow-basedswitchin ... [详细]
  • 本文介绍了一个Magento模块,其主要功能是实现前台用户利用表单给管理员发送邮件。通过阅读该模块的代码,可以了解到一些有关Magento的细节,例如如何获取系统标签id、如何使用Magento默认的提示信息以及如何使用smtp服务等。文章还提到了安装SMTP Pro插件的方法,并给出了前台页面的代码示例。 ... [详细]
  • Hbase1.2.0cdh5.16.2使用PREFIX_TREE编码导致集群压缩队列异常
    Hbase1.X版本中PREFIX_TREE作为BlockEncoding存在bug,会造成RegionServer节点compactionqueue持续升高,甚至影响fl ... [详细]
author-avatar
烂在心底
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有