hive分区表的创建以及代替MR编程

作者：自由战狼2012 | 来源：互联网 | 2023-07-28 16:21

分区表createexternaltabletrack_info(ipstring,countrystring,provincestring,citystring,ur

分区表

create external table track_info( ip string, country string, province string, city string, url string, time string, page string ) partitioned by (day string)ROW FORMAT DELIMITED FIELDS TERMINATED BY &＃39;\t&＃39; location &＃39;/project/trackinfo/&＃39;;

crontab表达式进行调度

Azkaban调度&＃xff1a;ETLApp&＃61;&＃61;》其他的统计分析

之后将清洗过后的数据加载进去分区表

LOAD DATA INPATH &＃39;hdfs://hadoop000:8020/project/input/etl&＃39; OVERWRITE INTO TABLE track_info partition(day&＃61;&＃39;2013-07-21&＃39;) ;

在这里插入图片描述

select count(*) from track_info where day&＃61;&＃39;2013-07-21&＃39;;

在这里插入图片描述

统计省份

select province,count(*) from track_info where day&＃61;&＃39;2013-07-21&＃39; group by province;

在这里插入图片描述

省份统计表

create external table track_info_province_stat( province string, cnt bigint ) partitioned by (day string)ROW FORMAT DELIMITED FIELDS TERMINATED BY &＃39;\t&＃39;;

insert overwrite table track_info_province_stat partition(day&＃61;&＃39;2013-07-21&＃39;) select province,count(*) as cnt from track_info where day&＃61;&＃39;2013-07-21&＃39; group by province;

在这里插入图片描述

统计的数据已经在Hive表track_info_province_stat而且这个表是一个分区表&＃xff0c;后续统计报表的数据可以直接从这个表中查询&＃xff0c;也可以将hive表中的数据导出到关系型数据库中去&＃xff08;sqoop&＃xff09;

第一步&＃xff1a;etl
第二步&＃xff1a;把elt中输出中的数据加载到track_info分区表中去
第三步&＃xff1a;各个维度统计结果的数据输出到各自维度的表里&＃xff08;track_info_province_stat&＃xff09;
第四步&＃xff1a;将数据导出&＃xff08;optional&＃xff09;

推荐阅读

get
HDU 2537 键盘输入处理

题目描述了一个名叫Pirates的男孩想要开发一款键盘输入软件，遇到了大小写字母判断的问题。本文提供了该问题的解决方案及实现方法。 ... [详细]

蜡笔小新 2024-11-24 11:01:59
uri
UVa 11683: 激光雕刻技术解析

自1958年发明以来，激光技术已在众多领域得到广泛应用，包括电子设备、医疗手术工具、武器等。本文将探讨如何使用激光技术进行材料雕刻，并通过编程解决一个具体的激光雕刻问题。 ... [详细]

蜡笔小新 2024-11-24 09:58:15
python
Hadoop集群搭建：实现SSH无密码登录

本文介绍了如何在CentOS 7 64位操作系统环境下配置Hadoop集群中的SSH无密码登录，包括环境准备、用户创建、密钥生成及配置等步骤。 ... [详细]

蜡笔小新 2024-11-24 19:47:28
python
使用R语言进行Foodmart数据的关联规则分析与可视化

本文探讨了如何利用R语言中的arules和arulesViz包对Foodmart数据集进行关联规则的挖掘与可视化。文章首先介绍了数据集的基本情况，然后逐步展示了如何进行数据预处理、规则挖掘及结果的图形化呈现。 ... [详细]

蜡笔小新 2024-11-24 19:13:01
get
为何引入jQuery UI自动完成功能后，我的列表框也受到影响？

我在尝试将组合框转换为具有自动完成功能时遇到了一个问题，即页面上的列表框也被转换成了自动完成下拉框，而不是保持原有的多选列表框形式。 ... [详细]

蜡笔小新 2024-11-24 12:02:48
get
Android 开发技巧：动态修改 strings.xml 文件中的字符串值

本文介绍了一种在 Android 开发中动态修改 strings.xml 文件中字符串值的有效方法。通过使用占位符，开发者可以在运行时根据需要填充具体的值，从而提高应用的灵活性和可维护性。 ... [详细]

蜡笔小新 2024-11-24 11:51:17
schema
详解Linux命令：mysqlshow的使用方法

本文详细介绍了如何使用Linux下的mysqlshow命令来查询MySQL数据库的相关信息，包括数据库、表以及字段的详情。通过本文的学习，读者可以掌握mysqlshow命令的基本语法及其常用选项。 ... [详细]

蜡笔小新 2024-11-24 11:25:08
get
深入解析Android联系人数据库设计：AbstractContactsProvider

本文探讨了Android系统中联系人数据库的设计，特别是AbstractContactsProvider类的作用与实现。文章提供了对源代码的详细分析，并解释了该类如何支持跨数据库操作及事务处理。源代码可从官方Android网站下载。 ... [详细]

蜡笔小新 2024-11-24 18:04:54
typescript
在VSCode中集成Prettier与TypeScript的最佳实践

本文详细介绍了如何在VSCode环境中配置Prettier工具以支持TypeScript项目，同时结合ESLint实现代码风格的一致性和自动化格式化。 ... [详细]

蜡笔小新 2024-11-24 17:50:24
uri
深入理解命名空间与作用域

本文详细探讨了编程中的命名空间与作用域概念，包括其定义、类型以及在不同上下文中的应用。 ... [详细]

蜡笔小新 2024-11-24 15:08:15
get
使用 Babylon.js 实现地球模型与切片地图交互（第三部分）

本文继续探讨在上一章节中构建的地球模型基础上，如何通过自定义的 `CameraEarthWheelControl` 类来实现更精细的地图缩放控制。我们将深入解析该类的实现细节，并展示其在实际项目中的应用。 ... [详细]

蜡笔小新 2024-11-24 14:39:58
get
使用jQuery与百度地图API实现地址转经纬度功能

本文详细介绍了如何利用jQuery和百度地图API将地址转换为经纬度，包括申请API密钥、页面构建及核心代码实现。 ... [详细]

蜡笔小新 2024-11-24 14:33:10
rsa
Adversarial Personalized Ranking for Recommendation

目录概主要内容基础对抗扰动对抗训练细节代码HeX.,HeZ.,DuX.andChuaT.Adversarialpersonalizedrankingforrecommendatio ... [详细]

蜡笔小新 2024-11-23 18:18:17
go
Excel技巧：单元格中显示公式而非结果的解决方法

本文探讨了在Excel中如何通过简单的方法解决单元格显示公式而非计算结果的问题，包括使用快捷键和调整单元格格式两种方法。 ... [详细]

蜡笔小新 2024-11-23 18:06:16
io
PyQt5简易对话框深入解析

本文详细介绍了如何在PyQt5中创建简易对话框，包括对话框的基本结构、布局管理以及源代码实现。通过实例代码，展示了如何设置窗口部件、布局方式及对话框的基本操作。 ... [详细]

蜡笔小新 2024-11-23 17:32:44

自由战狼2012

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章