Kylin单节点安装

作者：翔溢_142 | 来源：互联网 | 2023-10-16 16:09

软件环境Hadoop:2.7,3.1(sincev2.5)Hive:0.13-1.2.1HBase:1.1,2.0(sincev2.5)Spark(optional)2.3.0K

软件环境

Hadoop: 2.7&＃43;, 3.1&＃43; (since v2.5)
Hive: 0.13 - 1.2.1&＃43;
HBase: 1.1&＃43;, 2.0 (since v2.5)
Spark (optional) 2.3.0&＃43;
Kafka (optional) 1.0.0&＃43; (since v2.5)
JDK: 1.8&＃43; (since v2.5)
OS: Linux only, CentOS 6.5&＃43; or Ubuntu 16.0.4&＃43;

硬件要求

运行Kylin的服务器的最低配置是4核CPU&＃xff0c;16 GB RAM和100 GB磁盘。对于高负载情况&＃xff0c;建议使用24核CPU&＃xff0c;64 GB RAM或更高。

Hadoop环境

Kylin依靠Hadoop集群来处理大型数据集。您需要准备一个Hadoop集群&＃xff0c;其中包含HDFS&＃xff0c;YARN&＃xff0c;MapReduce&＃xff0c;Hive&＃xff0c;HBase&＃xff0c;Zookeeper和其他服务&＃xff0c;以便Kylin运行。
Kylin可以在Hadoop集群中的任何节点上启动。为方便起见&＃xff0c;您可以在主节点上运行Kylin。为了获得更好的稳定性&＃xff0c;建议与配置单元&＃xff0c;HBase的&＃xff0c;HDFS和安装的其他命令行和客户端配置&＃xff08;如干净的Hadoop客户端节点上部署麒麟core-site.xml&＃xff0c;hive-site.xml&＃xff0c;hbase-site.xml及其他&＃xff09;也被合理地配置&＃xff0c;并且可以与其他节点被自动同步。

运行Kylin的Linux帐户必须能够访问Hadoop集群&＃xff0c;包括创建/写入HDFS文件夹&＃xff0c;Hive表&＃xff0c;HBase表以及提交MapReduce任务的权限。

Kylin安装

从Apache Kylin下载站点下载 Hadoop版本的二进制包。例如&＃xff0c;可以从以下命令行下载Kylin 2.5.0 for HBase 1.x&＃xff1a;

cd /usr/local/ wget http://mirror.bit.edu.cn/apache/kylin/apache-kylin-2.5.0/apache-kylin-2.5.0-bin-hbase1x.tar.gz

解压缩tarball并将环境变量配置$KYLIN_HOME为Kylin文件夹。

tar -zxvf apache-kylin-2.5.0-bin-hbase1x.tar.gz cd apache-kylin-2.5.0-bin-hbase1x export KYLIN_HOME&＃61;&＃96;pwd&＃96;

从v2.6.1起&＃xff0c;Kylin将不再发布Spark二进制文件; 您需要单独安装Spark&＃xff0c;然后将SPARK_HOME系统环境变量指向它&＃xff1a;

export SPARK_HOME&＃61;/path/to/spark

或运行脚本下载它&＃xff1a;

$KYLIN_HOME/bin/download-spark.sh

Kylin 目录结构

bin&＃xff1a;用于启动/停止Kylin服务&＃xff0c;备份/恢复元数据以及一些实用程序脚本的shell脚本。
conf&＃xff1a;XML配置文件。可以在配置页面中找到这些xml文件的功能
lib&＃xff1a;外部使用的Kylin jar文件&＃xff0c;如Hadoop作业jar&＃xff0c;JDBC驱动程序&＃xff0c;HBase协处理器jar等。
meta_backups&＃xff1a;运行“bin / metastore.sh backup”时的默认备份文件夹;
sample_cube&＃xff1a;用于创建示例多维数据集及其表的文件。
spark&＃xff1a;使用Kylin构建的默认spark二进制文件。
tomcat 运行Kylin应用程序的tomcat Web服务器。
tool&＃xff1a;用于运行实用程序CLI的jar文件。

检查操作环境

Kylin在Hadoop集群上运行&＃xff0c;对每个组件的版本&＃xff0c;访问权限和CLASSPATH有一定的要求。为了避免各种环境问题&＃xff0c;您可以运行脚本&＃xff0c;$KYLIN_HOME/bin/check-env.sh对您的环境进行测试&＃xff0c;如果您的环境有任何问题&＃xff0c;脚本将打印详细的错误消息。如果没有错误消息&＃xff0c;则表示您的环境适合运行Kylin。

[root&＃64;bj-hadoop006 apache-kylin-2.5.0-bin-hbase1x]# bin/check-env.sh Retrieving hadoop conf dir... KYLIN_HOME is set to /data/apache-kylin-2.5.0-bin-hbase1x

开始Kylin

运行脚本&＃xff0c;$KYLIN_HOME/bin/kylin.sh start启动Kylin。界面输出如下&＃xff1a;

Retrieving hadoop conf dir... KYLIN_HOME is set to /usr/local/apache-kylin-2.5.0-bin-hbase1x ...... A new Kylin instance is started by root. To stop it, run &＃39;kylin.sh stop&＃39; Check the log at /usr/local/apache-kylin-2.5.0-bin-hbase1x/logs/kylin.log Web UI is at http://:7070/kylin

使用Kylin

启动Kylin后&＃xff0c;您可以通过浏览器访问它&＃xff0c;http://:7070/kylin并
指定IP地址或域名&＃xff0c;默认端口为7070.
初始用户名和密码为 ADMIN/KYLIN
服务器启动后&＃xff0c;您可以查看运行时日志$KYLIN_HOME/logs/kylin.log。

停止Kylin

运行$KYLIN_HOME/bin/kylin.sh stop脚本以停止Kylin。控制台输出如下&＃xff1a;

Retrieving hadoop conf dir... KYLIN_HOME is set to /usr/local/apache-kylin-2.5.0-bin-hbase1x Stopping Kylin: 25964 Stopping in progress. Will check after 2 secs again... Kylin with pid 25964 has been stopped.

您可以运行ps -ef | grep kylin 以查看Kylin进程是否已停止。

HDFS文件夹结构

Kylin将在HDFS上生成文件。根文件夹是“/kylin/”&＃xff0c;但是每个Kylin集群都有第二级文件夹&＃xff0c;以元数据表名称命名&＃xff0c;默认情况下是“kylin_metadata”&＃xff08;可以自定义conf/kylin.properties&＃xff09;。

通常情况下&＃xff0c;至少有这四种类型的目录下/kylin/kylin_metadata&＃xff1a;cardinality&＃xff0c;coprocessor&＃xff0c;kylin-job_id&＃xff0c;resources。
1. cardinality&＃xff1a;当Kylin加载配置单元表的基数计算作业的输出文件夹。无工作时可以清理;
2 . coprocessor: Kylin把HBase协处理器jar文件放到的文件夹。请不要删除它。
3 . kylin-job_id: Cubing作业的输出文件夹。请保留它们; 如果需要清理&＃xff0c;请按照存储清理指南进行操作。
4 . resources:在HBase中持续存在的元数据条目太大&＃xff08;例如&＃xff0c;字典或表快照&＃xff09;; 请不要删除它; 如果需要清理&＃xff0c;请遵循元数据
5中的清理资源。jdbc-resources&＃xff1a;类似于resources&＃xff0c;仅在使用MySQL作为元数据存储时出现。

原文: http://kylin.apache.org/docs/install/index.html

推荐阅读

function
在Linux系统中配置环境变量以切换不同版本Python的方法与实践

在Linux系统中，原本已安装了多个版本的Python 2，并且还安装了Anaconda，其中包含了Python 3。本文详细介绍了如何通过配置环境变量，使系统默认使用指定版本的Python，以便在不同版本之间轻松切换。此外，文章还提供了具体的实践步骤和注意事项，帮助用户高效地管理和使用不同版本的Python环境。 ... [详细]

蜡笔小新 2024-10-30 09:39:09
function
Hadoop入门与核心组件详解

本文详细介绍了Hadoop的基础知识及其核心组件，包括HDFS、MapReduce和YARN。通过本文，读者可以全面了解Hadoop的生态系统及应用场景。 ... [详细]

蜡笔小新 2024-12-26 13:12:48
function
基于KVM的SRIOV直通配置及性能测试

SRIOV介绍、VF直通配置，以及包转发率性能测试小慢哥的原创文章，欢迎转载目录?1.SRIOV介绍?2.环境说明?3.开启SRIOV?4.生成VF?5.VF ... [详细]

蜡笔小新 2024-12-25 19:26:39
function
龙蜥社区开发者访谈：技术生涯的三次蜕变 | 第3期

龙蜥社区的开发者们通过自己的实践和经验，推动着开源技术的发展。本期「龙蜥开发者说」聚焦于一位资深开发者的三次技术转型，分享他在龙蜥社区的成长故事。 ... [详细]

蜡笔小新 2024-11-21 11:12:28
function
大数据领域的职业路径与角色解析

本文将深入探讨大数据领域的各种职业和工作角色，帮助读者全面了解大数据行业的需求、市场趋势，以及从入门到高级专业人士的职业发展路径。文章还将详细介绍不同公司对大数据人才的需求，并解析各岗位的具体职责、所需技能和经验。 ... [详细]

蜡笔小新 2024-11-16 08:54:03
process
如何构建更好的数据立方体系统(Cube)

看到了kylin关于cube的设计，难以抑制的觉得这部分设计得太巧妙了，确实比我们的产品要好上很多，不得不学习一下！ ... [详细]

蜡笔小新 2023-10-10 20:46:30
runtime
解决Hive启动时权限被拒问题

本文详细分析了Hive在启动过程中遇到的权限拒绝错误，并提供了多种解决方案，包括调整文件权限、用户组设置以及环境变量配置等。 ... [详细]

蜡笔小新 2024-12-26 19:14:29
process
深入探讨CPU虚拟化与KVM内存管理

本文详细介绍了现代服务器架构中的CPU虚拟化技术，包括SMP、NUMA和MPP三种多处理器结构，并深入探讨了KVM的内存虚拟化机制。通过对比不同架构的特点和应用场景，帮助读者理解如何选择最适合的架构以优化性能。 ... [详细]

蜡笔小新 2024-12-25 19:15:51
uri
Hadoop发行版本选择指南：技术解析与应用实践

本文详细介绍了Hadoop的不同发行版本及其特点，帮助读者根据实际需求选择最合适的Hadoop版本。内容涵盖Apache Hadoop、Cloudera CDH等主流版本的特性及应用场景。 ... [详细]

蜡笔小新 2024-12-22 20:38:12
sum
Linux 文件权限与用户配置管理

本文详细介绍了 Linux 系统中用户、组和文件权限的设置方法，包括基本权限（读、写、执行）、特殊权限（SUID、SGID、Sticky Bit）以及相关配置文件的使用。 ... [详细]

蜡笔小新 2024-12-20 09:27:23
process
58同城的Elasticsearch应用与平台构建实践

本文由58同城高级架构师于伯伟分享，由陈树昌编辑整理，内容源自DataFunTalk。文章探讨了Elasticsearch作为分布式搜索和分析引擎的应用，特别是在58同城的实施案例，包括集群优化、典型应用实例及自动化平台建设等方面。 ... [详细]

蜡笔小新 2024-12-11 19:31:21
sum
面试中如何回答“零拷贝”技术问题？

零拷贝技术是提高I/O性能的重要手段，常用于Java NIO、Netty、Kafka等框架中。本文将详细解析零拷贝技术的原理及其应用。 ... [详细]

蜡笔小新 2024-11-13 02:03:52
sum
Hadoop集群搭建常见问题与解决方案（一）：避免配置过程中的常见陷阱

在搭建Hadoop集群以处理大规模数据存储和频繁读取需求的过程中，经常会遇到各种配置难题。本文总结了作者在实际部署中遇到的典型问题，并提供了详细的解决方案，帮助读者避免常见的配置陷阱。通过这些经验分享，希望读者能够更加顺利地完成Hadoop集群的搭建和配置。 ... [详细]

蜡笔小新 2024-11-03 19:59:23
select
优化后的标题：利用Hive分析用户最长连续登录天数

本文介绍了如何使用Hive分析用户最长连续登录天数的方法。首先对数据进行排序，然后计算相邻日期之间的差值，接着按用户ID分组并累加连续登录天数，最后求出每个用户的最大连续登录天数。此外，还探讨了该方法在其他领域的应用，如股票市场中最大连续涨停天数的分析。 ... [详细]

蜡笔小新 2024-10-27 21:47:17
select
Hadoop——实验七：MapReduce编程实践

文章目录一.实验目的二.实验内容三.实验步骤及结果分析 1.基于ubuntukylin14.04(7)版本，安装hadoop-eclipse-kepler-plugi ... [详细]

蜡笔小新 2024-10-14 18:07:40

翔溢_142

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章