SQL Server 2008是一个重大的产品版本,它推出了许多新的特性和关键的改进,使得它成为至今为止的最强大和最全面的SQL Server版本。这篇文章详细介绍了Microsoft SQL Server 2008中的新的特性、优点和功能…… 在现今数据的世界里,公司要获得成功和不断发展
SQL Server 2008是一个重大的产品版本,它推出了许多新的特性和关键的改进,使得它成为至今为止的最强大和最全面的SQL Server版本。这篇文章详细介绍了Microsoft SQL Server 2008中的新的特性、优点和功能…… 在现今数据的世界里,公司要获得成功和不断发展,他们需要定位主要的数据趋势的愿景。微软的这个数据平台愿景帮助公司满足这些数据爆炸和下一代数据驱动应用程序的需求。微软将继续投入和发展以下的关键领域来支持他们的数据平台愿景:关键任务企业数据平台、动态开发、关系数据和商业智能。
SQL Server 2008中有一个新的语法叫做MERGE,这种语法可以融合UPDATE、DELETE和INSERT。特别适合于将交易型的记录集合并到快照性的结果集中去。非常具有代表性的应用场景就是库存管理,库存管理应用(俗称进销存)中经常需要获得某个时间点上的库存,也称为库存结余。
讨论一下一些基础的东西,在建模中有两种基本模型:
纯交易事务型:这种方法主要是在一张交易表中记录下所有商品的进出仓记录,然后根据所有的进出仓详细记录来计算得出库存结余。
这种方法的优势就在于它保存了所有的交易明细记录,所以理论上面可以计算出过往任何一个时间点上的结余库存(只能说是理论上的,因为通常情况结余库存的计算不一定仅仅按照SKU,还可能根据品类、部门等其他因素,而这些信息一般都存放在基础信息表中。
因此如果要追溯以往的库存结余,有可能需要这些基础信息表也能够追溯历史,其实这也就是我们经常在数据仓库中提到的维度变化问题。)。
这种方法的缺点在于如果要获得库存结余则需要进行大量的聚合工作,所以会在库存结余查询的性能方面面临挑战,特别是需要查询实时的库存结余时(尽管这种需求在库存管理应用中并不多见)。
纯时点快照型:直接创建一张库存结余表,每次有进出仓操作的时候,直接更新库存结余表,因此这张库存结余表里面的数据实际上就是当前的库存结余。
这种方法的优势非常明显,就是查询当前库存的速度会非常快。
当然这种方法的缺点也非常明显——由于这种方法丢弃了交易明细记录,因此要想追溯历史库存的话比较麻烦。(当然也是有办法的,数据仓库中有一种方法就是定期快照,也就是每隔一段时间存档这个时间点上的库存,当然这种方法需要平衡两个因素,一是对存储空间的消耗,二是快照的连续性,存档越频繁快照就越连续,存储空间就会消耗的越厉害。通常这种频率是由企业对数据分析的需求决定的,根据库存商品的流动特性一般会在一小时到一周不等。)
这种方法最致命的缺定还不在这儿,最为困扰DBA的问题应该是这种模型对应用并发能力的影响。由于所有进出仓操作都需要更新库存结余表,所以库存结余表会成为数据应用的逻辑瓶颈。
因此一般我们都会用混合模型,为了保证历史的可追溯,进出仓的事务明细是一定要保留的(至少在一段时间内),而为了满足对库存结余查询的及时性和性能则需要维护一张快照表,并且保证定期更新这张快照表。为了保证性能并满足应用的逻辑弹性,这些混和模型的设计是相当重要的,也就是如何更新快照表,不过在这里我们就不多说了。