热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Kylin单节点安装

软件环境Hadoop:2.7,3.1(sincev2.5)Hive:0.13-1.2.1HBase:1.1,2.0(sincev2.5)Spark(optional)2.3.0K
 

软件环境


  • Hadoop: 2.7+, 3.1+ (since v2.5)
  • Hive: 0.13 - 1.2.1+
  • HBase: 1.1+, 2.0 (since v2.5)
  • Spark (optional) 2.3.0+
  • Kafka (optional) 1.0.0+ (since v2.5)
  • JDK: 1.8+ (since v2.5)
  • OS: Linux only, CentOS 6.5+ or Ubuntu 16.0.4+

 

硬件要求

运行Kylin的服务器的最低配置是4核CPU,16 GB RAM和100 GB磁盘。对于高负载情况,建议使用24核CPU,64 GB RAM或更高。

Hadoop环境

Kylin依靠Hadoop集群来处理大型数据集。您需要准备一个Hadoop集群,其中包含HDFS,YARN,MapReduce,Hive,HBase,Zookeeper和其他服务,以便Kylin运行。
Kylin可以在Hadoop集群中的任何节点上启动。为方便起见,您可以在主节点上运行Kylin。为了获得更好的稳定性,建议与配置单元,HBase的,HDFS和安装的其他命令行和客户端配置(如干净的Hadoop客户端节点上部署麒麟core-site.xml,hive-site.xml,hbase-site.xml及其他)也被合理地配置,并且可以与其他节点被自动同步。

运行Kylin的Linux帐户必须能够访问Hadoop集群,包括创建/写入HDFS文件夹,Hive表,HBase表以及提交MapReduce任务的权限。

 

Kylin安装


  1. 从Apache Kylin下载站点下载 Hadoop版本的二进制包。例如,可以从以下命令行下载Kylin 2.5.0 for HBase 1.x:

 

cd /usr/local/
wget http://mirror.bit.edu.cn/apache/kylin/apache-kylin-2.5.0/apache-kylin-2.5.0-bin-hbase1x.tar.gz

 

  1. 解压缩tarball并将环境变量配置$KYLIN_HOME为Kylin文件夹。

tar -zxvf apache-kylin-2.5.0-bin-hbase1x.tar.gz
cd apache-kylin-2.5.0-bin-hbase1x
export KYLIN_HOME=`pwd`

从v2.6.1起,Kylin将不再发布Spark二进制文件; 您需要单独安装Spark,然后将SPARK_HOME系统环境变量指向它:

export SPARK_HOME=/path/to/spark

 

或运行脚本下载它:

$KYLIN_HOME/bin/download-spark.sh

 

Kylin 目录结构


  • bin:用于启动/停止Kylin服务,备份/恢复元数据以及一些实用程序脚本的shell脚本。
  • conf:XML配置文件。可以在配置页面中找到这些xml文件的功能
  • lib:外部使用的Kylin jar文件,如Hadoop作业jar,JDBC驱动程序,HBase协处理器jar等。
  • meta_backups:运行“bin / metastore.sh backup”时的默认备份文件夹;
  • sample_cube:用于创建示例多维数据集及其表的文件。
  • spark:使用Kylin构建的默认spark二进制文件。
  • tomcat 运行Kylin应用程序的tomcat Web服务器。
  • tool:用于运行实用程序CLI的jar文件。

检查操作环境

Kylin在Hadoop集群上运行,对每个组件的版本,访问权限和CLASSPATH有一定的要求。为了避免各种环境问题,您可以运行脚本,$KYLIN_HOME/bin/check-env.sh对您的环境进行测试,如果您的环境有任何问题,脚本将打印详细的错误消息。如果没有错误消息,则表示您的环境适合运行Kylin。

[root@bj-hadoop006 apache-kylin-2.5.0-bin-hbase1x]# bin/check-env.sh
Retrieving hadoop conf dir...
KYLIN_HOME is set to /data/apache-kylin-2.5.0-bin-hbase1x

 

开始Kylin

运行脚本,$KYLIN_HOME/bin/kylin.sh start启动Kylin。界面输出如下:

 

Retrieving hadoop conf dir...
KYLIN_HOME is set to /usr/local/apache-kylin-2.5.0-bin-hbase1x
......
A new Kylin instance is started by root. To stop it, run 'kylin.sh stop'
Check the log at /usr/local/apache-kylin-2.5.0-bin-hbase1x/logs/kylin.log
Web UI is at http://:7070/kylin

使用Kylin

启动Kylin后,您可以通过浏览器访问它,http://:7070/kylin
指定IP地址或域名,默认端口为7070. 
初始用户名和密码为 
ADMIN/KYLIN 
服务器启动后,您可以查看运行时日志$KYLIN_HOME/logs/kylin.log

 

 

 

 

 

停止Kylin

运行$KYLIN_HOME/bin/kylin.sh stop脚本以停止Kylin。控制台输出如下:

Retrieving hadoop conf dir...
KYLIN_HOME is set to /usr/local/apache-kylin-2.5.0-bin-hbase1x
Stopping Kylin: 25964
Stopping in progress. Will check after 2 secs again...
Kylin with pid 25964 has been stopped.

 

您可以运行ps -ef | grep kylin 以查看Kylin进程是否已停止。

HDFS文件夹结构

Kylin将在HDFS上生成文件。根文件夹是“/kylin/”,但是每个Kylin集群都有第二级文件夹,以元数据表名称命名,默认情况下是“kylin_metadata”(可以自定义conf/kylin.properties)。

通常情况下,至少有这四种类型的目录下/kylin/kylin_metadata:cardinality,coprocessor,kylin-job_id,resources
1. cardinality:当Kylin加载配置单元表的基数计算作业的输出文件夹。无工作时可以清理; 
2 . coprocessor: Kylin把HBase协处理器jar文件放到的文件夹。请不要删除它。
3 . kylin-job_id: Cubing作业的输出文件夹。请保留它们; 如果需要清理,请按照存储清理指南进行操作。
4 . resources:在HBase中持续存在的元数据条目太大(例如,字典或表快照); 请不要删除它; 如果需要清理,请遵循元数据 
5中的清理资源。jdbc-resources:类似于resources,仅在使用MySQL作为元数据存储时出现。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

原文: http://kylin.apache.org/docs/install/index.html


推荐阅读
  • 在Linux系统中,原本已安装了多个版本的Python 2,并且还安装了Anaconda,其中包含了Python 3。本文详细介绍了如何通过配置环境变量,使系统默认使用指定版本的Python,以便在不同版本之间轻松切换。此外,文章还提供了具体的实践步骤和注意事项,帮助用户高效地管理和使用不同版本的Python环境。 ... [详细]
  • 本文介绍如何通过整合SparkSQL与Hive来构建高效的用户画像环境,提高数据处理速度和查询效率。 ... [详细]
  • 本文介绍了如何在 MapReduce 作业中使用 SequenceFileOutputFormat 生成 SequenceFile 文件,并详细解释了 SequenceFile 的结构和用途。 ... [详细]
  • 大数据领域的职业路径与角色解析
    本文将深入探讨大数据领域的各种职业和工作角色,帮助读者全面了解大数据行业的需求、市场趋势,以及从入门到高级专业人士的职业发展路径。文章还将详细介绍不同公司对大数据人才的需求,并解析各岗位的具体职责、所需技能和经验。 ... [详细]
  • 第二章:Kafka基础入门与核心概念解析
    本章节主要介绍了Kafka的基本概念及其核心特性。Kafka是一种分布式消息发布和订阅系统,以其卓越的性能和高吞吐量而著称。最初,Kafka被设计用于LinkedIn的活动流和运营数据处理,旨在高效地管理和传输大规模的数据流。这些数据主要包括用户活动记录、系统日志和其他实时信息。通过深入解析Kafka的设计原理和应用场景,读者将能够更好地理解其在现代大数据架构中的重要地位。 ... [详细]
  • HBase Java API 进阶:过滤器详解与应用实例
    本文详细探讨了HBase 1.2.6版本中Java API的高级应用,重点介绍了过滤器的使用方法和实际案例。首先,文章对几种常见的HBase过滤器进行了概述,包括列前缀过滤器(ColumnPrefixFilter)和时间戳过滤器(TimestampsFilter)。此外,还详细讲解了分页过滤器(PageFilter)的实现原理及其在大数据查询中的应用场景。通过具体的代码示例,读者可以更好地理解和掌握这些过滤器的使用技巧,从而提高数据处理的效率和灵活性。 ... [详细]
  • 在搭建Hadoop集群以处理大规模数据存储和频繁读取需求的过程中,经常会遇到各种配置难题。本文总结了作者在实际部署中遇到的典型问题,并提供了详细的解决方案,帮助读者避免常见的配置陷阱。通过这些经验分享,希望读者能够更加顺利地完成Hadoop集群的搭建和配置。 ... [详细]
  • HBase在金融大数据迁移中的应用与挑战
    随着最后一台设备的下线,标志着超过10PB的HBase数据迁移项目顺利完成。目前,新的集群已在新机房稳定运行超过两个月,监控数据显示,新集群的查询响应时间显著降低,系统稳定性大幅提升。此外,数据消费的波动也变得更加平滑,整体性能得到了显著优化。 ... [详细]
  • Hadoop——实验七:MapReduce编程实践
    文章目录一.实验目的二.实验内容三.实验步骤及结果分析 1.基于ubuntukylin14.04(7)版本,安装hadoop-eclipse-kepler-plugi ... [详细]
  • 深入理解云计算与大数据技术
    本文详细探讨了云计算与大数据技术的关键知识点,包括大数据处理平台、社会网络大数据、城市大数据、工业大数据、教育大数据、数据开放与共享的应用,以及搜索引擎与Web挖掘、推荐技术的研究及应用。文章还涵盖了云计算的基础概念、特点和服务类型分类。 ... [详细]
  • 2012年9月12日优酷土豆校园招聘笔试题目解析与备考指南
    2012年9月12日,优酷土豆校园招聘笔试题目解析与备考指南。在选择题部分,有一道题目涉及中国人的血型分布情况,具体为A型30%、B型20%、O型40%、AB型10%。若需确保在随机选取的样本中,至少有一人为B型血的概率不低于90%,则需要选取的最少人数是多少?该问题不仅考察了概率统计的基本知识,还要求考生具备一定的逻辑推理能力。 ... [详细]
  • 本文详细介绍了HDFS的基础知识及其数据读写机制。首先,文章阐述了HDFS的架构,包括其核心组件及其角色和功能。特别地,对NameNode进行了深入解析,指出其主要负责在内存中存储元数据、目录结构以及文件块的映射关系,并通过持久化方案确保数据的可靠性和高可用性。此外,还探讨了DataNode的角色及其在数据存储和读取过程中的关键作用。 ... [详细]
  • NoSQL数据库,即非关系型数据库,有时也被称作Not Only SQL,是一种区别于传统关系型数据库的管理系统。这类数据库设计用于处理大规模、高并发的数据存储与查询需求,特别适用于需要快速读写大量非结构化或半结构化数据的应用场景。NoSQL数据库通过牺牲部分一致性来换取更高的可扩展性和性能,支持分布式部署,能够有效应对互联网时代的海量数据挑战。 ... [详细]
  • 本文介绍了如何使用Hive分析用户最长连续登录天数的方法。首先对数据进行排序,然后计算相邻日期之间的差值,接着按用户ID分组并累加连续登录天数,最后求出每个用户的最大连续登录天数。此外,还探讨了该方法在其他领域的应用,如股票市场中最大连续涨停天数的分析。 ... [详细]
  • Phoenix 使用体验分享与深度解析
    闲来无事看了下hbase方面的东西,发现还好理解不过不大习惯于是找到个phoenix感觉不错性能指标如下好像还不错了准备工作:启动hadoop集群启动zookkeeper启动hba ... [详细]
author-avatar
翔溢_142
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有