ConfiguringHiveHighAvailability

作者：舍舍与你-6 | 来源：互联网 | 2023-10-10 22:10

Hive从0.14开始，使用Zookeeper实现了HiveServer2的HA功能（ZooKeeperServiceDiscovery）

Hive从0.14开始&＃xff0c;使用Zookeeper实现了HiveServer2的HA功能&＃xff08;ZooKeeper Service Discovery&＃xff09;&＃xff0c;Client端可以通过指定一个nameSpace来连接HiveServer2&＃xff0c;而不是指定某一个host和port。本文描述了hive的metastore和HiveServer2的高可用配置。使用的Hive版本为2.3.2。
单实例的构成如下图&＃xff1a;
Configuring Hive High Availability
如果使用HiveServer2的Client并发比较少&＃xff0c;可以使用一个HiveServer2实例&＃xff0c;绝对没问题。
而都多实例的构成如下图&＃xff1a;

如图&＃xff0c;本文在hdp01和hdp04上分别启用两个HiveServer2的实例&＃xff0c;并通过zookeeper完成HA的配置(ZooKeeper已安装并配置)。
一、Hive Metastore HA配置
1、编辑hive-site.xml文件
配置很简单&＃xff0c;只需要指定 hive.metastore.uris的值即可。多个server之间以逗号隔开&＃xff0c;如下图&＃xff1a;
Configuring Hive High Availability
完了之后&＃xff0c;同步hive-site.xml到hdp04节点上&＃xff1a;

[hadoop&＃64;hdp01 ~]$ scp /u01/hive/conf/hive-site.xml hdp04:/u01/hive/conf/

2、重启各个节点的hive服务

[hadoop&＃64;hdp01 ~]$ hive --service metastore >/dev/null & [hadoop&＃64;hdp01 ~]$ hive --service hiveserver2 >/dev/null & [hadoop&＃64;hdp04 ~]$ hive --service metastore >/dev/null & [hadoop&＃64;hdp04 ~]$ hive --service hiveserver2 >/dev/null &

3、更新FS Roots
Hive的元数据信息是存放在关系型数据库中的&＃xff0c;我们只要找到存放这些数据的Table&＃xff0c;然后用SQL去修改就行了。但是这样比较麻烦&＃xff0c;你还得去登录数据库&＃xff0c;最重要的是这样还很容易出错&＃xff0c;所以不推荐使用。
查看当前的FS Root信息&＃xff1a;

[hadoop&＃64;hdp01 ~]$ hive --service metatool -listFSRoot Listing FS Roots.. hdfs://hdp01:9000/user/hive/warehouse/hivedb.db hdfs://hdp01:9000/user/hive/warehouse [hadoop&＃64;hdp04 ~]$ hive --service metatool -listFSRoot Listing FS Roots.. hdfs://hdp01:9000/user/hive/warehouse/hivedb.db hdfs://hdp01:9000/user/hive/warehouse

使用下面的命令进行模拟更新&＃xff1a;

[hadoop&＃64;hdp01 ~]$ hive --service metatool -updateLocation hdfs://hdp04:9000 hdfs://hdp01:9000 -dryRun Initializing HiveMetaTool.. Looking for LOCATION_URI field in DBS table to update.. Dry Run of updateLocation on table DBS.. old location: hdfs://hdp01:9000/user/hive/warehouse/hivedb.db new location: hdfs://hdp04:9000/user/hive/warehouse/hivedb.db old location: hdfs://hdp01:9000/user/hive/warehouse new location: hdfs://hdp04:9000/user/hive/warehouse Found 2 records in DBS table to update Looking for LOCATION field in SDS table to update.. Dry Run of updateLocation on table SDS.. old location: hdfs://hdp01:9000/user/hive/warehouse/hivedb.db/exam_score new location: hdfs://hdp04:9000/user/hive/warehouse/hivedb.db/exam_score old location: hdfs://hdp01:9000/user/hive/warehouse/hivedb.db/tbdelivermsg new location: hdfs://hdp04:9000/user/hive/warehouse/hivedb.db/tbdelivermsg old location: hdfs://hdp01:9000/user/hive/warehouse/hivedb.db/hivedb__exam_score_exam_idx__ new location: hdfs://hdp04:9000/user/hive/warehouse/hivedb.db/hivedb__exam_score_exam_idx__ old location: hdfs://hdp01:9000/user/hive/warehouse/hivedb.db/hivedb__xj_student_xj_student_idx__ new location: hdfs://hdp04:9000/user/hive/warehouse/hivedb.db/hivedb__xj_student_xj_student_idx__ old location: hdfs://hdp01:9000/user/hive/warehouse/hivedb.db/xj_student new location: hdfs://hdp04:9000/user/hive/warehouse/hivedb.db/xj_student Found 5 records in SDS table to update

如果模拟更换成功&＃xff0c;则使用不加-dryRun参数进行实际替换&＃xff1a;

[hadoop&＃64;hdp01 ~]$ hive --service metatool -updateLocation hdfs://hdp04:9000 hdfs://hdp01:9000 Initializing HiveMetaTool.. Looking for LOCATION_URI field in DBS table to update.. Successfully updated the following locations.. old location: hdfs://hdp01:9000/user/hive/warehouse/hivedb.db new location: hdfs://hdp04:9000/user/hive/warehouse/hivedb.db old location: hdfs://hdp01:9000/user/hive/warehouse new location: hdfs://hdp04:9000/user/hive/warehouse Updated 2 records in DBS table Looking for LOCATION field in SDS table to update.. Successfully updated the following locations.. old location: hdfs://hdp01:9000/user/hive/warehouse/hivedb.db/exam_score new location: hdfs://hdp04:9000/user/hive/warehouse/hivedb.db/exam_score old location: hdfs://hdp01:9000/user/hive/warehouse/hivedb.db/tbdelivermsg new location: hdfs://hdp04:9000/user/hive/warehouse/hivedb.db/tbdelivermsg old location: hdfs://hdp01:9000/user/hive/warehouse/hivedb.db/hivedb__exam_score_exam_idx__ new location: hdfs://hdp04:9000/user/hive/warehouse/hivedb.db/hivedb__exam_score_exam_idx__ old location: hdfs://hdp01:9000/user/hive/warehouse/hivedb.db/hivedb__xj_student_xj_student_idx__ new location: hdfs://hdp04:9000/user/hive/warehouse/hivedb.db/hivedb__xj_student_xj_student_idx__ old location: hdfs://hdp01:9000/user/hive/warehouse/hivedb.db/xj_student new location: hdfs://hdp04:9000/user/hive/warehouse/hivedb.db/xj_student Updated 5 records in SDS table [hadoop&＃64;hdp04 ~]$ hive --service metatool -listFSRoot Initializing HiveMetaTool.. Listing FS Roots.. hdfs://hdp04:9000/user/hive/warehouse/hivedb.db hdfs://hdp04:9000/user/hive/warehouse

4、测试
将一个节点的metastore关闭&＃xff0c;然后使用beeline命令进行测试&＃xff0c;如下&＃xff1a;

beeline> !connect jdbc:hive2://hdp04:10000 hadoop redhat org.apache.hive.jdbc.HiveDriver Connecting to jdbc:hive2://hdp04:10000 Connected to: Apache Hive (version 2.3.2) Driver: Hive JDBC (version 2.3.2) Transaction isolation: TRANSACTION_REPEATABLE_READ 0: jdbc:hive2://hdp04:10000> use hivedb; OK No rows affected (0.069 seconds) 0: jdbc:hive2://hdp04:10000> show tables;

Configuring Hive High Availability
二、Hive HA配置
1、Hive配置
各个节点上编辑hive-site.xml文件&＃xff0c;设置以下参数的值&＃xff1a;

[hadoop&＃64;hdp01 ~]$ vi /u01/hive/conf/hive-site.xml hive.server2.support.dynamic.service.discovery&＃61;true hive.server2.zookeeper.namespace&＃61;hivesrv2 hive.zookeeper.quorum&＃61;hdp01:2181,hdp02:2181,hdp03:2181,hdp04:2181 hive.zookeeper.client.port&＃61;2181 hive.server2.thrift.bind.host&＃61;0.0.0.0 hive.server2.thrift.port&＃61;10000

2、启动第一个节点hive服务
启动服务&＃xff1a;

[hadoop&＃64;hdp01 ~]$ hive --service metastore >/dev/null & [hadoop&＃64;hdp01 ~]$ hive --service hiveserver2 >/dev/null & [hadoop&＃64;hdp01 ~]$ zkCli.sh

Configuring Hive High Availability
如图&＃xff0c;hive服务已注册到ZooKeeper。
3、启动第二个节点的hive服务

[hadoop&＃64;hdp04 ~]$ hive --service hiveserver2 >/dev/null & [hadoop&＃64;hdp04 ~]$ zkCli.sh

Configuring Hive High Availability
如图&＃xff0c;第二个hive也注册成功。
4、连接测试
Beeline 是一个 Hive 客户端&＃xff0c;包含在 HDInsight 群集的头节点上。 Beeline 使用 JDBC 连接到 HiveServer2&＃xff0c;后者是 HDInsight 群集上托管的一项服务。还可以使用 Beeline 通过 Internet 远程访问 Hive on HDInsight。

[hadoop&＃64;hdp01 ~]$ beeline -u "jdbc:hive2://hdp01:2181,hdp02:2181,hdp03:2181,hdp04:2181/;serviceDiscoveryMode&＃61;zooKeeper;zooKeeperNamespace&＃61;hivesrv2" -n hadoop -p Connecting to jdbc:hive2://hdp01:2181,hdp02:2181,hdp03:2181,hdp04:2181/;serviceDiscoveryMode&＃61;zooKeeper;zooKeeperNamespace&＃61;hivesrv2;user&＃61;hadoop Enter password for jdbc:hive2://hdp01:2181,hdp02:2181,hdp03:2181,hdp04:2181/: ****** 17/12/13 15:48:16 [main]: INFO jdbc.HiveConnection: Connected to 0.0.0.0:10000 Connected to: Apache Hive (version 2.3.2) Driver: Hive JDBC (version 2.3.2) Transaction isolation: TRANSACTION_REPEATABLE_READ Beeline version 2.3.2 by Apache Hive 0: jdbc:hive2://hdp01:2181,hdp02> show databases; &＃43;----------------&＃43; | database_name | &＃43;----------------&＃43; | default | | hivedb | &＃43;----------------&＃43; 2 rows selected (0.43 seconds) 0: jdbc:hive2://hdp01:2181,hdp02> use hivedb; No rows affected (0.048 seconds) 0: jdbc:hive2://hdp01:2181,hdp02> show tables; &＃43;--------------------------------------&＃43; | tab_name | &＃43;--------------------------------------&＃43; | exam_score | | hivedb__exam_score_exam_idx__ | | hivedb__xj_student_xj_student_idx__ | | tbdelivermsg | | xj_student | &＃43;--------------------------------------&＃43; 5 rows selected (0.143 seconds)

参考文献&＃xff1a;
1、将 Beeline 客户端与 Apache Hive 配合使用
2、HiveServer2的高可用-HA配置

转:https://blog.51cto.com/candon123/2050259

推荐阅读

jar
Maven + Spring + MyBatis + MySQL 环境搭建与实例解析

本文详细介绍如何使用MySQL数据库进行环境搭建，包括创建数据库表并插入示例数据。随后，逐步指导如何配置Maven项目，整合Spring框架与MyBatis，实现高效的数据访问。 ... [详细]

蜡笔小新 2024-11-21 18:39:23
web
Oracle 11g 创建表空间与基础配置

本文详细介绍了Oracle 11g中的创建表空间的方法，以及如何设置客户端和服务端的基本配置，包括用户管理、环境变量配置等。 ... [详细]

蜡笔小新 2024-11-21 18:54:39
web
使用Service Locator模式实现高效的服务命名访问

本文探讨了如何通过Service Locator模式来简化和优化在B/S架构中的服务命名访问，特别是对于需要频繁访问的服务，如JNDI和XMLNS。该模式通过缓存机制减少了重复查找的成本，并提供了对多种服务的统一访问接口。 ... [详细]

蜡笔小新 2024-11-20 19:26:30
jar
Hibernate框架简述

Hibernate全自动全映射ORM框架，旨在消除sql，是一个持久层的ORM框架1）、基础概念DAO(DataAccessorOb ... [详细]

蜡笔小新 2024-11-22 16:36:49
require
Linux环境下MySQL的安装与部署指南

本文详细介绍了在Linux操作系统上安装和部署MySQL数据库的过程，包括必要的环境准备、安装步骤、配置优化及安全设置等内容。 ... [详细]

蜡笔小新 2024-11-20 18:10:53
post
ArcBlock 发布 ABT 节点 1.0.31 版本更新

2020年11月9日，ArcBlock 区块链基础平台发布了 ABT 节点开发平台的1.0.31版本更新，此次更新带来了多项功能增强与性能优化。 ... [详细]

蜡笔小新 2024-11-22 21:02:58
web
Python3爬虫入门：pyspider的基本使用[python爬虫入门]

Python学习网有大量免费的Python入门教程，欢迎大家来学习。本文主要通过爬取去哪儿网的旅游攻略来给大家介绍pyspid ... [详细]

蜡笔小新 2024-11-22 18:00:41
web
为何Compose与Swarm之后仍有Kubernetes的诞生？

探讨在已有Compose和Swarm的情况下，Kubernetes是如何以其独特的设计理念和技术优势脱颖而出，成为容器编排领域的领航者。 ... [详细]

蜡笔小新 2024-11-22 09:26:11
get
调试利器SSH隧道

在开发微信公众号或小程序的时候，由于微信平台规则的限制，部分接口需要通过线上域名才能正常访问。但我们一般都会在本地开发，因为这能快速的看到 ... [详细]

蜡笔小新 2024-11-21 11:15:53
post
spring boot使用jetty无法启动

spring boot使用jetty无法启动 ... [详细]

蜡笔小新 2024-11-21 10:15:52
post
CentOS下ProFTPD的安装与配置指南

本文详细介绍在CentOS操作系统上安装和配置ProFTPD服务的方法，包括基本配置、安全设置及高级功能的启用。 ... [详细]

蜡笔小新 2024-11-21 09:45:56
get
如何在PHP中安装Xdebug扩展

本文介绍了如何从PECL下载并编译安装Xdebug扩展，以及如何配置PHP和PHPStorm以启用调试功能。 ... [详细]

蜡笔小新 2024-11-20 18:31:50
require
MongoDB 高可用集群搭建指南：分片、读写分离与负载均衡

本文详细介绍了如何搭建一个高可用的MongoDB集群，包括环境准备、用户配置、目录创建、MongoDB安装、配置文件设置、集群组件部署等步骤。特别关注分片、读写分离及负载均衡的实现。 ... [详细]

蜡笔小新 2024-11-20 18:28:16
web
在IIS上部署Orchard时遇到的技术挑战

本文记录了在Windows 8.1系统环境下，使用IIS 8.5和Visual Studio 2013部署Orchard 1.7.2过程中遇到的问题及解决方案，包括503服务不可用错误和web.config配置错误。 ... [详细]

蜡笔小新 2024-11-20 16:51:36
jar
fleaframedb使用之JPA封装介绍

flea,frame,db,使用,之 ... [详细]

蜡笔小新 2024-11-20 12:00:16

舍舍与你-6

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章