当前位置: 开发笔记 > 编程语言 > 正文

hivejdbc访问配置_什么是hive？一篇文章讲解清楚

作者：吾车吾家 | 来源：互联网 | 2023-08-12 19:10

开门见山，什么是hive？一个hadoop的客户端。hive能做什么？hive是基于Hadoop的一个数据仓库工具用来进行数据提取、转化、

开门见山&＃xff0c;什么是hive&＃xff1f;
一个 hadoop 的客户端。

hive能做什么&＃xff1f;
hive是基于Hadoop的一个数据仓库工具
用来进行数据提取、转化、加载&＃xff0c;这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。
hive数据仓库工具能将结构化的数据文件映射为一张数据库表&＃xff0c;并提供SQL查询功能&＃xff0c;能将SQL语句转变成MapReduce任务来执行。
hive可以通过类似SQL语句实现快速MapReduce统计&＃xff0c;使MapReduce变得更加简单&＃xff0c;而不必开发专门的MapReduce应用程序。hive十分适合对数据仓库进行统计分析。

HIVE的基本架构
　　作为Hadoop的主要数据仓库解决方案&＃xff0c;底层存储依赖于HDFS&＃xff0c;而Hive SQL是主要交互接口&＃xff0c;而真正的计算和执行则由MapReduce完成&＃xff0c;它们之间的桥梁是Hive引擎。接下来&＃xff0c;具体看下HIVE的引擎架构&＃xff1a;
Hive的主要组件包括UI组件、Driver组件(Complier、Optimizer和Executor)、Metastore组件、CLI(Command Line Interface&＃xff0c;命令行接口)、JDBC/ODBC、Thrift Server和Hive Web Interface(HWI)等。&＃xff0c;接下来分别对这几个组件进行介绍。
Drvier组件
　　　　该组件是Hive的核心组件&＃xff0c;该组件包括Complier(编译器)、Optimizer(优化器)和Executor(执行器),它们的作用是对Hive SQL语句进行解析、编译优化、生成执行计划&＃xff0c;然后调用底层MR计算框架。
MetaStore组件
　　　　该组件是Hive用来负责管理元数据的组件。Hive的元数据存储在关系型数据库中&＃xff0c;其支持的关系型数据库有Derby和mysql&＃xff0c;其中Derby是Hive默认情况下使用的数据库&＃xff0c;它内嵌在Hive中&＃xff0c;但是该数据库只支持单会话&＃xff0c;也就是说只允许一个会话链接&＃xff0c;所以在生产中并不适用&＃xff0c;其实其实在平时我们的测试环境中也很少使用。在我们日常的团队开发中&＃xff0c;需要支持多会话&＃xff0c;所以需要一个独立的元数据库&＃xff0c;用的最多的也就是Mysql&＃xff0c;而且Hive内部对Mysql提供了很好的支持。
CLI
　　　　Hive的命令行接口
Thrift Server
　　　　该组件提供JDBC和ODBC接入的能力&＃xff0c;用来进行可扩展且跨语言的服务开发。Hive集成了该服务&＃xff0c;能让不同的编程语言调用Hive的接口
Hive Web Interface
　　　　该组件是Hive客户端提供的一种通过网页方式访问Hive所提供的服务。这个接口对应Hive的HWI组件
　Hive通过CLI&＃xff0c;JDBC/ODBC或HWI接受相关的Hive SQL查询&＃xff0c;并通过Driver组件进行编译&＃xff0c;分析优化&＃xff0c;最后编程可执行的MapReduce任务&＃xff0c;但是具体里面是怎么执行的&＃xff0c;看图&＃xff1a;

推荐阅读

client
sqoop自定义分隔符的实现方法及步骤详解

本文介绍了在sqoop1.4.*版本中，如何实现自定义分隔符的方法及步骤。通过修改sqoop生成的java文件，并重新编译，可以满足实际开发中对分隔符的需求。具体步骤包括修改java文件中的一行代码，重新编译所需的hadoop包等。详细步骤和编译方法在本文中都有详细说明。 ... [详细]

蜡笔小新 2023-12-10 11:29:22
client
hadoop基础----hadoop实战(六)-----hadoop管理工具---Cloudera Manager---CDH介绍

我们在之前的文章中已经初步介绍了Cloudera。hadoop基础----hadoop实战(零)-----hadoop的平台版本选择从版本选择这篇文章中我们了解到除了hadoop官方版本外很多 ... [详细]

蜡笔小新 2023-10-16 14:21:13
config
Nginx使用AWStats日志分析的步骤及注意事项

本文介绍了在Centos7操作系统上使用Nginx和AWStats进行日志分析的步骤和注意事项。通过AWStats可以统计网站的访问量、IP地址、操作系统、浏览器等信息，并提供精确到每月、每日、每小时的数据。在部署AWStats之前需要确认服务器上已经安装了Perl环境，并进行DNS解析。 ... [详细]

蜡笔小新 2023-12-14 19:42:01
config
每天收获一点点Hadoop概述

一、Hadoop来历Hadoop的思想来源于Google在做搜索引擎的时候出现一个很大的问题就是这么多网页我如何才能以最快的速度来搜索到，由于这个问题Google发明 ... [详细]

蜡笔小新 2023-12-14 18:58:01
client
Thrift教程初级篇——RPC框架Thrift的安装环境变量配置与第一个实例

本文介绍了RPC框架Thrift的安装环境变量配置与第一个实例，讲解了RPC的概念以及如何解决跨语言、c++客户端、web服务端、远程调用等需求。Thrift开发方便上手快，性能和稳定性也不错，适合初学者学习和使用。 ... [详细]

蜡笔小新 2023-12-13 17:36:52
config
HDFS2.x新特性

一、集群间数据拷贝scp实现两个远程主机之间的文件复制scp-rhello.txtroothadoop103:useratguiguhello.txt推pushscp-rr ... [详细]

蜡笔小新 2023-12-13 13:52:40
web
如何在Windows环境下配置php+apache环境

本文介绍了在Windows环境下如何配置php+apache环境，包括下载php7和apache2.4、安装vc2015运行时环境、启动php7和apache2.4等步骤。希望对需要搭建php7环境的读者有一定的参考价值。摘要长度为169字。 ... [详细]

蜡笔小新 2023-12-13 10:39:24
web
windows部署hadoop2.7.0

这里使用自己编译的hadoop-2.7.0版本部署在windows上，记得几年前，部署hadoop需要借助于cygwin，还需要开启ssh服务，最近发现，原来不需要借助cy ... [详细]

蜡笔小新 2023-10-17 21:04:04
web
什么是大数据lambda架构

一、什么是Lambda架构Lambda架构由Storm的作者[NathanMarz]提出，根据维基百科的定义，Lambda架构的设计是为了在处理大规模数 ... [详细]

蜡笔小新 2023-10-17 16:06:09
search
Hadoop源码解析1Hadoop工程包架构解析

1 Hadoop中各工程包依赖简述 Google的核心竞争技术是它的计算平台。Google的大牛们用了下面5篇文章，介绍了它们的计算设施。 GoogleCluster：ht ... [详细]

蜡笔小新 2023-10-17 13:28:20
config
hadoop学习；block数据块；mapreduce实现样例；UnsupportedClassVersionError异常；关联项目源代码...

对于开源的东东，尤其是刚出来不久，我认为最好的学习方式就是能够看源代码和doc，測试它的样例为了方便查看源代码，关联导入源代 ... [详细]

蜡笔小新 2023-10-17 09:49:38
config
MR程序的几种提交运行模式

MR程序的几种提交运行模式本地模型运行1在windows的eclipse里面直接运行main方法，就会将job提交给本地执行器localjobrunner执行-- ... [详细]

蜡笔小新 2023-10-16 18:29:26
client
伸缩性|发生_分布式文件系统设计，该从哪些方面考虑？

篇首语：本文由编程笔记#小编为大家整理，主要介绍了分布式文件系统设计，该从哪些方面考虑？相关的知识，希望对你有一定的参考价值。点击上方关注“ ... [详细]

蜡笔小新 2023-10-16 17:43:40
client
Hadoop （CDH4发行版）集群部署（部署脚本，namenode高可用，hadoop管理）

前言折腾了一段时间hadoop的部署管理，写下此系列博客记录一下。为了避免各位做部署这种重复性的劳动，我已经把部署的步骤写成脚本，各位只需要按着本文把脚本执行完，整个环境基本就部署 ... [详细]

蜡笔小新 2023-10-16 15:11:51
client
MapReduce工作流程最详细解释

MapReduce是我们再进行离线大数据处理的时候经常要使用的计算模型，MapReduce的计算过程被封装的很好，我们只用使用Map和Reduce函数，所以对其整体的计算过程不是太 ... [详细]

蜡笔小新 2023-10-16 14:14:27

吾车吾家

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章

hivejdbc访问配置_什么是hive？一篇文章讲解清楚

开门见山&＃xff0c;什么是hive&＃xff1f;一个 hadoop 的客户端。

开门见山&＃xff0c;什么是hive&＃xff1f;
一个 hadoop 的客户端。