当前位置: 开发笔记 > 编程语言 > 正文

Hive基础之Hive体系架构和运行模式新安江山水画廊

作者：熊金涟_473 | 来源：互联网 | 2023-09-04 15:06

Hive架构1）用户接口：包括CLI(hiveshell)、JDBCODBC(java访问hive)，WEBUI(浏览器访问hive)；2）元数据存储（Metastore）：默认存

Hive架构

1）用户接口：包括CLI(hive shell)、JDBC/ODBC(java访问hive)，WEBUI(浏览器访问hive)；

2）元数据存储（Metastore）：

默认存储在自带的数据库derby中，线上使用时一般采用MySQL；

元数据包括：表名、表所属的数据库（默认是default）、表的拥有者、列/分区字段、列/分区属性、表的类型（是否是外部表）、表的数据所在目录等；

database是表(table)的名字空间。默认的数据库是default；

table的原数据信息有：列和它们的类型、拥有者(owner)，存储空间和SerDe信息；

partition每个分区都有自己的列，存储空间和SerDe信息

3）驱动器（Driver）

调用编译器compiler处理hiveql字符串，这些字符串可能是一条DDL、DML、查询语句

解析器、编译器、优化器、执行器；

完成HQL查询语句从词法分析、语法分析、编译、优化以及查询计划的生成；

生成的查询计划存储在HDFS中，并在随后的MapReduce调用执行；

4）Hadoop

用MapReduce计算，用HDFS存储 ；

Hive的数据存储在HDFS之上；

大部分的查询由MapReduce计算完成；两种情况不跑MapReduce： select * from xxx 和 select * from xxx where 分区字段 不跑mapreduce

Hive单机环境部署图

Hive集群环境部署图

注：在生产环境中元数据需要采用主备服务器的方式防止宕机；

Hive运行模式

Hive运行模式即任务的执行环境，分为：本地和集群两种

可以通过mapred.job.tracker来指定，指定方式：

hive> SET mapred.job.tracker=local

不设置默认为集群方式。

推荐阅读

stream
什么是大数据lambda架构

一、什么是Lambda架构Lambda架构由Storm的作者[NathanMarz]提出，根据维基百科的定义，Lambda架构的设计是为了在处理大规模数 ... [详细]

蜡笔小新 2023-10-17 16:06:09
ip
Android 新闻App的本地服务器搭建教程

本文介绍了在开发Android新闻App时，搭建本地服务器的步骤。通过使用XAMPP软件，可以一键式搭建起开发环境，包括Apache、MySQL、PHP、PERL。在本地服务器上新建数据库和表，并设置相应的属性。最后，给出了创建new表的SQL语句。这个教程适合初学者参考。 ... [详细]

蜡笔小新 2023-12-14 17:15:19
ip
oracle11g 过程,oracle11g 安装过程

安装oracle软件1创建用户组、用户和目录bjdb节点下：[rootnode1]#groupadd-g200oinstall[rootnode1]#groupad ... [详细]

蜡笔小新 2023-12-09 08:41:56
ip
Kylin 单节点安装

软件环境Hadoop:2.7,3.1(sincev2.5)Hive:0.13-1.2.1HBase:1.1,2.0(sincev2.5)Spark(optional)2.3.0K ... [详细]

蜡笔小新 2023-10-16 16:09:42
ip
hadoop基础----hadoop实战(六)-----hadoop管理工具---Cloudera Manager---CDH介绍

我们在之前的文章中已经初步介绍了Cloudera。hadoop基础----hadoop实战(零)-----hadoop的平台版本选择从版本选择这篇文章中我们了解到除了hadoop官方版本外很多 ... [详细]

蜡笔小新 2023-10-16 14:21:13
ip
.NET中各种数据库连接大全 (转)

.NET中各种数据库连接大全(转)[more].NET中各种数据库连接大全sql.gif)SQLSERVEROdbCStandardSecurity:driver{SQLSe ... [详细]

蜡笔小新 2023-10-16 12:38:05
java
Azkaban（三）Azkaban的使用

界面介绍首页有四个菜单projects：最重要的部分，创建一个工程，所有flows将在工程中运行。scheduling:显示定时任务executing:显示当前运行的任务histo ... [详细]

蜡笔小新 2023-10-15 23:43:11
ip
mysql主机地址是什么????下面的该怎么添？？

mysql主机地址是什么????下面的该怎么添？？mysql主机地址是什么????下面的该怎么添？？答：SQLyogEnterprise中，mysql的主机地址如果你是本机，就填写 ... [详细]

蜡笔小新 2023-10-15 20:59:32
java
Java开发实战讲解！字节跳动三场技术面+HR面

二、回顾整理阿里面试题基本就这样了，还有一些零星的问题想不起来了，答案也整理出来了。自我介绍JVM如何加载一个类的过程，双亲委派模型中有 ... [详细]

蜡笔小新 2023-10-15 19:48:25
ip
Hadoop之Yarn

目录1Hadoop1.x和Hadoop2.x架构区别2Yarn概述3Yarn基本架构4Yarn工作机制5作业提交全过程6资源调度器7任务的推测执行1Hadoop1.x和Hadoo ... [详细]

蜡笔小新 2023-10-15 12:16:30
java
Hadoop——Hive简介和环境配置

一、Hive的简介和配置1.简介Hive是构建在Hadoop之上的数据操作平台lHive是一个SQL解析引擎，它将SQL转译成MapReduce作业，并 ... [详细]

蜡笔小新 2023-10-14 16:22:56
main
使用C++编写程序实现增加或删除桌面的右键列表项

本文介绍了使用C++编写程序实现增加或删除桌面的右键列表项的方法。首先通过操作注册表来实现增加或删除右键列表项的目的，然后使用管理注册表的函数来编写程序。文章详细介绍了使用的五种函数：RegCreateKey、RegSetValueEx、RegOpenKeyEx、RegDeleteKey和RegCloseKey，并给出了增加一项的函数写法。通过本文的方法，可以方便地自定义桌面的右键列表项。 ... [详细]

蜡笔小新 2023-12-10 10:08:46
java
windows部署hadoop2.7.0

这里使用自己编译的hadoop-2.7.0版本部署在windows上，记得几年前，部署hadoop需要借助于cygwin，还需要开启ssh服务，最近发现，原来不需要借助cy ... [详细]

蜡笔小新 2023-10-17 21:04:04
java
hadoop学习；block数据块；mapreduce实现样例；UnsupportedClassVersionError异常；关联项目源代码...

对于开源的东东，尤其是刚出来不久，我认为最好的学习方式就是能够看源代码和doc，測试它的样例为了方便查看源代码，关联导入源代 ... [详细]

蜡笔小新 2023-10-17 09:49:38
stream
《Spark核心技术与高级应用》——1.2节Spark的重要扩展

本节书摘来自华章社区《Spark核心技术与高级应用》一书中的第1章，第1.2节Spark的重要扩展，作者于俊向海代其锋马海平，更多章节内容可以访问云栖社区“华章社区”公众号查看1. ... [详细]

蜡笔小新 2023-10-16 18:07:56

熊金涟_473

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章