在读此文章前建议读一下核心概念:
Kylin多维分析核心概念树立
1.创建项目Project;
2.导入数据
load hive table 通过表名导入数据;
load hive table from tree 可以直接选择表;
最后是实时数据接入,Kafka等;
3.创建模型
输入模型名称,注意模型名称在整个Kylin应用下具有唯一性,而不是只在单个项目下的唯一性;
下一步的话选择维度表盒事实表,事实表是唯一的,我们选择后单击Add Lookup Table,选择维度表;然后添加四个维度表,添加维度表的时候选择连接的类型Inner还是Left,然后选择主键和外键,这里也支持多主键;
选择维度和度量列,度量只能在事实表中选择,维度表在事实表和维度表中选择,一个列只能是维度或度量中的一个。这里只是选择一个范围,不代表这些列将来一定要用做Cube的维度和度量,你可以把所有可能用到的列都选进来,后续创建Cube的时候,将只能从这些列中进行选择;
最后一步是为了模型补充分割时间列信息和过滤条件。如果此模型中事实表记录是按时间增长的,那么可以指定一个日期/时间列作为模型的分割时间列,从而可以让Cube按此列做增量构建,如果想做全局构建,这一步就不用填,我们选择增量构建;