事实表(FactTable)指的是存储有事实记录的表,包含每个时间的具体要素,以及具体发生的事情如系统记录、销售记录以及库存记录等。
维度表(Dimension Table)是对事实表中时间要素的描述信息。它保存了维度属性值,可以跟事实表关联:相当于把事实表上经常重复出现的属性抽取、规范出来用作一张表。
常见的维度表:日期表(日期对应的周月季度等属性)、地点表(包含国家、省、州、城市)。
维度表要求:
要具有数据一致性,主键值必须是唯一的;
维度表越小越好,默认的阈值是300MB;
改变频率低;
维度表最好不要是Hive视图表(View);
维度表的好处:
缩小了事实表的大小;
便于维度的管理和维护,对维度表的修改不必对事实表进行大力那个的改动;
维度表可以为多个事实表重用。