ApacheKylin的入门安装

作者：坏尐骇MB_549 | 来源：互联网 | 2023-09-15 11:08

ApacheKylin™是一个开源的分布式分析引擎，提供Hadoop之上的SQL查询接口及多维分析（OLAP）能力以支持超大规模数据，最初由eBayInc.开发并贡献至开源社区。它能在亚秒内查询

Apache Kylin™是一个开源的分布式分析引擎，提供Hadoop之上的SQL查询接口及多维分析（OLAP）能力以支持超大规模数据，最初由eBay Inc. 开发并贡献至开源社区。它能在亚秒内查询巨大的Hive表。

从官网的介绍来看Kylin是一个OLAP的数据查询引擎，其特点就是快。公司最近准备引入Kylin做数据分析，原来也听说过但一直没有接触，现在正好可以验证下Kylin是否是传说中那么NB，今天我们先来看看如何安装部署Kylin。

由于Kylin本身只是一个Server，所以安装部署还是比较简单的，但是它的前提要求是Hadoop，Hive，Hbase必须已经安装而且能正常工作，在这里关于Hadoop生态的一些框架的安装部署就不再重复写了，有兴趣的可以看我以前的博文。

下面来看下一些基础软件的版本：

Hadoop2.7.2
Hive2.1.1
Hbase1.2.0
Zookeeper3.4.8
Kylin2.0.0

在这里假设你的Hadoop，Hive，Hbase都已经安装成功并能正常运行。

然后去Kylin官网下载对应的kylin版本，链接如下： http://kylin.apache.org/cn/download/

下载的具体版本是： apache-kylin-2.0.0-bin-hbase1x.tar.gz

下载成功后，解压到根目录，然后重命名目录为kylin并在.bash_profile 文件中，配置kylin的环境变量：

export KYLIN_HOME=/home/search/kylin
export CLASSPATH=$CLASSPATH:$KYLIN_HOME/lib
export PATH=$KYLIN_HOME/bin:$PATH

然后执行bin/check-env.sh 脚本，检查环境变量是否有缺失的，校验通过之后，可以执行如下脚本启动：

bin/kylin.sh start // 启动

bin/kylin.sh stop // 停止

这里需要注意一点，Kylin当前最新的版本只支持spark1.6.0的版本，原来我的机器中，安装了一个spark2.0的版本，导致启动kylin失败，终端仅仅输出spark assembly lib not found这个提示信息，别的什么也没有，导致我误以为我编译的spark有问题，后来我将我的spark移除，重新启动kylin才成功，另外一个注意的地方是Hadoop的mr-jobhistory-daemon.sh 进程也要启动起来。

启动成功之后，访问地址：http://hostname:7070/kylin（kylin的启动过程感觉有点慢，差不多1分钟之后，在访问这个地址基本能生效）

并输入默认的用户名和密码：ADMIN / KYLIN 成功登录之后，看到下面的页面，就代表安装部署成功了。

推荐阅读

export
在Linux系统中配置环境变量以切换不同版本Python的方法与实践

在Linux系统中，原本已安装了多个版本的Python 2，并且还安装了Anaconda，其中包含了Python 3。本文详细介绍了如何通过配置环境变量，使系统默认使用指定版本的Python，以便在不同版本之间轻松切换。此外，文章还提供了具体的实践步骤和注意事项，帮助用户高效地管理和使用不同版本的Python环境。 ... [详细]

蜡笔小新 2024-10-30 09:39:09
export
HBase 数据复制与灾备同步策略

本文探讨了HBase在企业级应用中的数据复制与灾备同步解决方案，包括存量数据迁移及增量数据实时同步的方法。 ... [详细]

蜡笔小新 2024-11-21 19:20:03
export
CentOS 中 SWAP 分区的创建与管理

本文详细介绍了在 CentOS 系统中如何创建和管理 SWAP 分区，包括临时创建交换文件、永久性增加交换空间的方法，以及如何手动释放内存缓存。 ... [详细]

蜡笔小新 2024-11-21 19:01:54
main
探索阿里巴巴的开源世界

从理想主义者的内心深处萌发的技术信仰，推动了云原生技术在全球范围内的快速发展。本文将带你深入了解阿里巴巴在开源领域的贡献与成就。 ... [详细]

蜡笔小新 2024-11-21 09:06:54
string
Redis：缓存与内存数据库详解

本文介绍了数据库的基本分类，重点探讨了关系型与非关系型数据库的区别，并详细解析了Redis作为非关系型数据库的特点、工作模式、优点及持久化机制。 ... [详细]

蜡笔小新 2024-11-18 14:16:11
bit
华为捐赠欧拉操作系统，承诺不推商用版

华为近日宣布将欧拉开源操作系统捐赠给开放原子开源基金会，并承诺不会推出欧拉的商用发行版。此举旨在推动欧拉和鸿蒙操作系统的全场景融合与生态发展。 ... [详细]

蜡笔小新 2024-11-14 13:19:40
main
HDFS API

Hadoop的文件操作位于包org.apache.hadoop.fs里面，能够进行新建、删除、修改等操作。比较重要的几个类：(1)Configurati ... [详细]

蜡笔小新 2024-11-13 17:31:50
plugins
Hadoop——实验七：MapReduce编程实践

文章目录一.实验目的二.实验内容三.实验步骤及结果分析 1.基于ubuntukylin14.04(7)版本，安装hadoop-eclipse-kepler-plugi ... [详细]

蜡笔小新 2024-10-14 18:07:40
plugins
Kylin 单节点安装

软件环境Hadoop:2.7,3.1(sincev2.5)Hive:0.13-1.2.1HBase:1.1,2.0(sincev2.5)Spark(optional)2.3.0K ... [详细]

蜡笔小新 2023-10-16 16:09:42
plugins
一种基于X_CORBA的远程对象调用实现方法

本文介绍了如何利用X_CORBA实现远程对象调用，并通过多个示例程序展示了其功能与应用，包括基础的Hello World示例、文件传输工具以及一个完整的聊天系统。 ... [详细]

蜡笔小新 2024-11-19 19:18:07
post
PGXC中的两阶段提交机制及其对事务一致性的保障

PGXC作为一款基于PostgreSQL的分布式数据库系统，利用Sharding技术将数据分散存储于多个数据库实例中。本文探讨了PGXC的两阶段提交过程及其实现事务强一致性的方法。 ... [详细]

蜡笔小新 2024-11-19 14:14:02
php
Java EE 平台的 13 种核心技术

Java EE 平台集成了多种服务、API 和协议，旨在支持基于 Web 的多层应用程序开发。本文将详细介绍 Java EE 中的 13 种关键技术规范，帮助开发者更好地理解和应用这些技术。 ... [详细]

蜡笔小新 2024-11-15 21:15:35
php
MongoDB核心概念详解

本文介绍了NoSQL数据库的概念及其应用场景，重点解析了MongoDB的基本特性、数据结构以及常用操作。MongoDB是一个高性能、高可用且易于扩展的文档数据库系统。 ... [详细]

蜡笔小新 2024-11-15 10:24:19
select
Cube的高级设置

分享来源地址：http:bigdata.51cto.comart201705538648.htmCube的高级设置随着维度数目的增加，Cuboid的数量 ... [详细]

蜡笔小新 2024-10-20 20:14:38
select
【PPT 下载】这杯网红茶饮，到底赢在哪里？

【PPT 下载】这杯网红茶饮，到底赢在哪里？ ... [详细]

蜡笔小新 2023-10-12 21:43:10

坏尐骇MB_549

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章