零
数据仓库需要解决的一个重要的东西就是数据的粒度;
当数据仓库的粒度确定后,设计和实现的其他问题就会非常容易解决了,相反如果没有合理地确定粒度的话,就会影响其他每个方面;
一、粗略估算
确定合适的粒度级别的起点,是粗略估算数据仓库中将来的数据行数和所需DASD(直接存取存储设备)数;
有一个计算数据仓库所占空间的算法,如上图;
第一步,确定数据仓库中将要创建的所有表。然后,估计没张表中的行的大小。确切大小可能难以知道,估计一下下界和一个上届就可以了;
第二步,估计一年内表中的最少行数和最多的行数。这是设计者所要解决的最大问题;
第三步,如果数据仓库是用来存放业务活动的话,就要估计某些数据量,以及估计每个时间单位内业务活动量。同样,可用相同的方法分析当前的业务量、竞争对手的业务量、经济学家的预测报告;
第四