当前位置: 开发笔记 > 编程语言 > 正文

Hive详解之lateralview、视图和索引

作者：彭菜菜 | 来源：互联网 | 2023-09-13 14:31

一、 HiveLateralView虚表LateralView用于和UDTF函数（explode、split）结合来使用。

一、 Hive Lateral View虚表

Lateral View用于和UDTF函数&＃xff08;explode、split&＃xff09;结合来使用。
首先通过UDTF函数拆分成多行&＃xff0c;再将多行结果组合成一个支持别名的虚拟表。
主要解决在select使用UTF做查询过程中&＃xff0c;查询只能包含单个UDTF&＃xff0c;不能包含其他字段、以及多个UDTF的问题

语法&＃xff1a; LATERAL VIEW udtf(expression) tableAlias AS columnAlias (&＃39;,&＃39; columnAlias)

示例&＃xff1a; 统计人员表中共有多少种爱好、多少个城市?

查询01&＃xff1a;将爱好和城市用UDTF函数分开

查询02&＃xff1a;使用聚合函数计数

select count(distinct(myCol1)), count(distinct(myCol2)), count(distinct(myCol3))from psn LATERAL VIEW explode(likes) myTable1 AS myCol1 LATERAL VIEW explode(address) myTable2 AS myCol2, myCol3;

结果 &＃xff1a;

二、hive View视图

和关系型数据库中的普通视图一样&＃xff0c;hive也支持视图

特点&＃xff1a;

不支持物化视图
只能查询&＃xff0c;不能做加载数据操作
视图的创建&＃xff0c;只是保存一份元数据&＃xff0c;查询视图时才执行对应的子查询
view定义中若包含了ORDER BY/LIMIT语句&＃xff0c;当查询视图时也进行ORDER BY/LIMIT语句操作&＃xff0c;view当中定义的优先级更高
view支持迭代视图

语法&＃xff1a;

创建视图&＃xff1a; CREATE VIEW [IF NOT EXISTS] [db_name.]view_name [(column_name [COMMENT column_comment], ...) ] [COMMENT view_comment] [TBLPROPERTIES (property_name &＃61; property_value, ...)] AS SELECT ... ; 查询视图&＃xff1a; select colums from view; 删除视图&＃xff1a; DROP VIEW [IF EXISTS] [db_name.]view_name;

示例&＃xff1a;

hive> create view psn_view as select name, age, likes from psn;
hive> select * from psn_view ;
hive> select * from psn_view ;

三、Hive 索引

目的&＃xff1a;优化查询以及检索性能

创建索引&＃xff1a;

create index t1_index on table psn14(name)
as &＃39;org.apache.hadoop.hive.ql.index.compact.CompactIndexHandler&＃39; with deferred rebuild
in table t1_index_table;
as&＃xff1a;指定索引器&＃xff1b;
in table&＃xff1a;指定索引表&＃xff0c;若不指定默认生成在default__psn14_t1_index__表中

create index t1_index on table psn14(name)
as &＃39;org.apache.hadoop.hive.ql.index.compact.CompactIndexHandler&＃39; with deferred rebuild;

查询索引&＃xff1a;show index on psn14;

重建索引&＃xff08;建立索引之后必须重建索引才能生效&＃xff09;&＃xff1a;ALTER INDEX t1_index ON psn14 REBUILD;

删除索引&＃xff1a;DROP INDEX IF EXISTS t1_index ON psn14;

推荐阅读

stream
日志处理流程：Flume+MapReduce+Hive+Sqoop+MySQL

本文介绍了如何使用Flume从Linux文件系统收集日志并存储到HDFS，然后通过MapReduce清洗数据，使用Hive进行数据分析，并最终通过Sqoop将结果导出到MySQL数据库。 ... [详细]

蜡笔小新 2024-11-13 18:47:34
spring
Spring Boot 中使用 spring-boot-starter-quartz 实现定时任务

本文介绍了如何在 Spring Boot 项目中使用 spring-boot-starter-quartz 组件实现定时任务，并将 cron 表达式存储在数据库中，以便动态调整任务执行频率。 ... [详细]

蜡笔小新 2024-11-14 18:55:09
string
Java 中 com.apollographql.apollo.api.internal.Optional.orNull() 方法详解与示例

本文详细介绍了 com.apollographql.apollo.api.internal.Optional 类中的 orNull() 方法，并提供了多个实际代码示例，帮助开发者更好地理解和使用该方法。 ... [详细]

蜡笔小新 2024-11-14 15:03:23
spring
MySQL初级篇——字符串、日期时间、流程控制函数的相关应用

文章目录：1.字符串函数2.日期时间函数2.1获取日期时间2.2日期与时间戳的转换2.3获取年月日、时分秒、星期数、天数等函数2.4时间和秒钟的转换2. ... [详细]

蜡笔小新 2024-11-14 10:57:02
sum
机器学习算法：SVM（支持向量机）

SVM算法（SupportVectorMachine，支持向量机）的核心思想有2点：1、如果数据线性可分，那么基于最大间隔的方式来确定超平面，以确保全局最优， ... [详细]

蜡笔小新 2024-11-14 04:33:58
import
HDFS API

Hadoop的文件操作位于包org.apache.hadoop.fs里面，能够进行新建、删除、修改等操作。比较重要的几个类：(1)Configurati ... [详细]

蜡笔小新 2024-11-13 17:31:50
sum
com.sun.javadoc.PackageDoc.exceptions()方法的使用及代码示例

com.sun.javadoc.PackageDoc.exceptions()方法的使用及代码示例 ... [详细]

蜡笔小新 2024-11-13 10:47:33
include
解决Only fullscreen opaque activities can request orientation错误的方法

本文介绍了在使用PictureSelectorLight第三方框架时遇到的Only fullscreen opaque activities can request orientation错误，并提供了一种有效的解决方案。 ... [详细]

蜡笔小新 2024-11-13 09:46:25
split
Spark与HBase结合处理大规模流量数据结构设计

本文将详细介绍如何利用Spark和HBase进行大规模流量数据的分析与处理，包括数据结构的设计和优化方法。 ... [详细]

蜡笔小新 2024-11-12 19:49:05
process
优化Hadoop 2.7.2源代码以支持Snappy压缩和解压功能的Native编译

为了在Hadoop 2.7.2中实现对Snappy压缩和解压功能的原生支持，本文详细介绍了如何重新编译Hadoop源代码，并优化其Native编译过程。通过这一优化，可以显著提升数据处理的效率和性能。此外，还探讨了编译过程中可能遇到的问题及其解决方案，为用户提供了一套完整的操作指南。 ... [详细]

蜡笔小新 2024-11-09 19:45:36
get
Apache Hadoop HDFS QJournalProtocol 中 getJournalCTime 方法的应用与代码实例分析

Apache Hadoop HDFS QJournalProtocol 中 getJournalCTime 方法的应用与代码实例分析 ... [详细]

蜡笔小新 2024-11-08 11:32:58
get
如何在本地环境中高效连接MySQL数据库的详细指南

本指南详细介绍了在Linux环境中高效连接MySQL数据库的方法。用户可以通过安装并使用`mysql`客户端工具来实现本地连接，具体命令为：`mysql -u 用户名 -p 密码 -h 主机`。例如，使用管理员账户连接本地MySQL服务器的命令为：`mysql -u root -p pass`。此外，还提供了多种配置优化建议，以确保连接过程更加稳定和高效。 ... [详细]

蜡笔小新 2024-11-08 08:38:45
get
在VSCode中添加自定义外部命令

通过将常用的外部命令集成到VSCode中，可以提高开发效率。本文介绍如何在VSCode中配置和使用自定义的外部命令，从而简化命令执行过程。 ... [详细]

蜡笔小新 2024-11-13 16:57:15
sum
Python 使用 DOM 和 SAX 解析 XML 的应用实例

本文介绍如何使用 Python 的 DOM 和 SAX 方法解析 XML 文件，并通过示例展示了如何动态创建数据库表和处理大量数据的实时插入。 ... [详细]

蜡笔小新 2024-11-12 16:10:39
import
如何在Nginx服务器上轻松配置CertBot以实现SSL证书自动化管理

为了确保iOS应用能够安全地访问网站数据，本文介绍了如何在Nginx服务器上轻松配置CertBot以实现SSL证书的自动化管理。通过这一过程，可以确保应用始终使用HTTPS协议，从而提升数据传输的安全性和可靠性。文章详细阐述了配置步骤和常见问题的解决方法，帮助读者快速上手并成功部署SSL证书。 ... [详细]

蜡笔小新 2024-11-10 08:42:08

彭菜菜

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章