当前位置: 开发笔记 > 数据库 > 正文

kylin2.3版本启用jdbc数据源（可以直接通过sql生成hive表，省去手动导数据到hive,并建hive表的麻烦）

作者：虚假爱情2502873563_918 | 来源：互联网 | 2023-01-11 13:41

kylin2.3版本启用jdbc数据源（可以直接通过sql生成hive表，省去手动导数据到hive,并建hive表的麻烦）说明：jdbc数据源，本质上还是hive数据源。由于数据库做

说明：

jdbc数据源，本质上还是hive数据源。

由于数据库做大表关联方面性能还是不行。所以kylin的默认数据源仍然是hive,我觉得是非常合理的。

对应jdbc数据源，其实就是一种便利的方式。其基本原理就是通过连接数据库，选取所要用的表（或者sql查询）。

通过sqoop并行的抽取数据，并按照表名生成对应的hive表。cube的构建就根据生成的hive表进行。

每次构建的时候都重新抽取数据，生成hive表，构建完成之后，就把这个hive表删除掉。

相当于是自动做了之前开发需要自己做的数据同步到hdfs、新建hive表、同步hive表到kylin这些繁琐重复的工作。

缺点：

1、基于以上说明，很容易得出其缺点就是这些hive表是瞬时的。每次构建都要现场去抽取全量的数据（从而增大了数据库的压力，增加了网络开销，并且拖慢了cube整体构建速度）。（这里可以通过定制其源码改成可配置的增量更新的方式，会更好用；但是要考虑表结构变更，是删除全表重建，还是要怎么处理）

2、由于表是瞬时的，就不能同时把这些表提供给其他方使用。

3、数据源方式不能共用，就是不能同时使用hive和jdbc数据源。这个对需要大数据平台处理的数据就不那么友好了，数据处理完再写会数据库会非常慢。

参考其官网说明和git

https://issues.apache.org/jira/browse/KYLIN-3044

设置sqoop导入的默认并行度

推荐阅读

数据库
databasesync适配openGauss使用指导书

一、database-sync简介database-sync作为一种开源辅助工具，用于数据库之间的表同步，更确切的说法是复制，可以从一个数据库复制表到另一个数据库该工具支持的功能如 ... [详细]

蜡笔小新 2024-12-02 18:31:18
数据库
构建基于BERT的中文NL2SQL模型：一个简明的基准

本文探讨了将自然语言转换为SQL语句（NL2SQL）的任务，这是人工智能领域中一项非常实用的研究方向。文章介绍了笔者在公司举办的首届中文NL2SQL挑战赛中的实践，该比赛提供了金融和通用领域的表格数据，并标注了对应的自然语言与SQL语句对，旨在训练准确的NL2SQL模型。 ... [详细]

蜡笔小新 2024-12-27 17:36:19
数据库
数据库内核开发入门 | 搭建研发环境的初步指南

本课程将带你从零开始，逐步掌握数据库内核开发的基础知识和实践技能，重点介绍如何搭建OceanBase的开发环境。 ... [详细]

蜡笔小新 2024-12-27 16:38:48
数据库
HBase运维工具全解析

本文深入探讨了HBase常用的运维工具，详细介绍了每种工具的功能、使用场景及操作示例。对于HBase的开发人员和运维工程师来说，这些工具是日常管理和故障排查的重要手段。 ... [详细]

蜡笔小新 2024-12-24 17:00:59
数据库
离线安装Grafana Cloudera Manager插件并监控CDH集群

本文详细介绍如何离线安装Cloudera Manager (CM) 插件，并通过Grafana监控CDH集群的健康状况和资源使用情况。该插件利用CM提供的API接口进行数据获取和展示。 ... [详细]

蜡笔小新 2024-12-21 17:56:30
数据库
深入解析Hadoop的核心组件与工作原理

本文详细介绍了Hadoop的三大核心组件：分布式文件系统HDFS、资源管理器YARN和分布式计算框架MapReduce。通过分析这些组件的工作机制，帮助读者更好地理解Hadoop的架构及其在大数据处理中的应用。 ... [详细]

蜡笔小新 2024-12-19 17:17:51
数据库
探索Hive UDF的应用

本文介绍了在解决Hive表中复杂数据结构平铺化问题后，如何通过创建视图来准确计算广告日志的曝光PV，特别是针对用户对应多个标签的情况。同时，详细探讨了UDF的使用方法及其在实际项目中的应用。 ... [详细]

蜡笔小新 2024-11-26 11:08:12
hbase
Hadoop——实验七：MapReduce编程实践

文章目录一.实验目的二.实验内容三.实验步骤及结果分析 1.基于ubuntukylin14.04(7)版本，安装hadoop-eclipse-kepler-plugi ... [详细]

蜡笔小新 2024-10-14 18:07:40
数据库
【PPT 下载】这杯网红茶饮，到底赢在哪里？

【PPT 下载】这杯网红茶饮，到底赢在哪里？ ... [详细]

蜡笔小新 2023-10-12 21:43:10
数据库
SQL中UPDATE SET FROM语句的使用方法及应用场景

本文详细介绍了SQL中UPDATE SET FROM语句的使用方法，通过具体示例展示了如何利用该语句高效地更新多表关联数据。适合数据库管理员和开发人员参考。 ... [详细]

蜡笔小新 2024-12-28 10:22:16
数据库
解决Hive启动时权限被拒问题

本文详细分析了Hive在启动过程中遇到的权限拒绝错误，并提供了多种解决方案，包括调整文件权限、用户组设置以及环境变量配置等。 ... [详细]

蜡笔小新 2024-12-26 19:14:29
数据库
深入解析三大范式与JDBC集成

本文详细探讨了数据库设计中的三大范式，并结合Java数据库连接（JDBC）技术，讲解如何在实际开发中应用这些概念。通过实例和图表，帮助读者更好地理解范式理论及其在数据操作中的重要性。 ... [详细]

蜡笔小新 2024-12-25 20:12:13
hbase
在Linux系统中配置环境变量以切换不同版本Python的方法与实践

在Linux系统中，原本已安装了多个版本的Python 2，并且还安装了Anaconda，其中包含了Python 3。本文详细介绍了如何通过配置环境变量，使系统默认使用指定版本的Python，以便在不同版本之间轻松切换。此外，文章还提供了具体的实践步骤和注意事项，帮助用户高效地管理和使用不同版本的Python环境。 ... [详细]

蜡笔小新 2024-10-30 09:39:09
join
Cube的高级设置

分享来源地址：http:bigdata.51cto.comart201705538648.htmCube的高级设置随着维度数目的增加，Cuboid的数量 ... [详细]

蜡笔小新 2024-10-20 20:14:38
join
解决Linux下RTL8723be无线网卡搜索不到wifi的问题——华硕笔记本安装deepin15.11无wifi信号

解决Linux下RTL8723be无线网卡搜索不到wifi的问题——华硕笔记本安装deepin15.11无wifi信号,Go语言社区,Golang程序员人脉社 ... [详细]

蜡笔小新 2023-10-12 18:09:50

虚假爱情2502873563_918

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章