静态分区,让每个服务器负责特定区域,技术上相对简单;而动态分区实际上更接近于集群技术,按照负载自动调整区域,但技术更加复杂。上面所论述的计算迁移就是为了讨论动态分区做的准备。
在 魔兽世界中,暴风城和闪金镇是2个典型,暴风城是个主城,人多、地形复杂,而闪金镇周围都是森林,人也多是匆匆过客,除了少数升级做任务。一般说来,我们 可以拿2个服务器,一个负责暴风城,而另外一个负责闪金镇。显然,这种划分,会导致2个服务器严重不平衡,动态分区就是为了处理这种情况。在晚上的时候, 没什么人在暴风城,2个服务器的负荷差不多,可以按照固定区域。随着暴风城人越来越多,暴风城的服务器肯定负荷会越来越高,那么,就逐步扩大闪金镇服务器 负责的场景,而进一步收缩暴风城的负责的场景,这是一种策略。在某种极端的情况,比如发生部落进攻暴风城的情况,那么闪金镇服务器可能要并入暴风城,或者 由其他地方,比如西部荒野服务器并入暴风城,共同承当计算任务。
要实现动态分区,除了计算迁移外,还必须有个基础,就是地图的小区化【CELL】,移动手机的蜂窝一样。每个服务器负责相邻的一组CELL,CELL是服务器的最小划分单位。下面我们将继续讨论动态分区的一些问题。
1、 动态分区的首要问题CELL迁移问题。首先必须有个完整地图的服务器,来负责分配所有的CELL,哪个CELL在哪个服务器上,至少是知道。当CELL迁 移时,实时更新这个信息。同时将整个CELL相关的数据迁移到另外一个机器上。比如,我们将暴风城划分为1000个区,迁移时只要指定哪些区转移到闪金镇 就可以了。
2、分区的边界冲突。不管是静态分区,还是动态分区,由于区之间在逻辑是无缝的,所以区之间的冲突是不可避免的。我们在考查魔兽 世界时,会发现有趣的事情。从艾泽拉斯到外域,必须穿过黑暗之门,穿过的时候,就不再看到原有的世界,而且有明显的延时。从这个现象,我推测艾泽拉斯和外 域是分布在不同的服务器上,所以他不需要解决区之间边界冲突问题。至于艾泽拉斯是否是一个CELL,或者是无数个CELL,我不知道。
3、 区的形状。每个CELL在实现上,必须有个严格的边界,毕竟服务器是很难计算出模糊边界的。同时,由于分区边界冲突的存在,我们必须让边界尽可能的小,于 是这个分区的形状必须满足最大的面积而边长最小,显然圆形是最高的选择。但在实现圆形在划分边界时,运算比较复杂。在实践中,我们参考蜂窝的六边形形状, 应该效果最好,至于为什么,可以找资料,但移动就是这么干的,我相信还是有道理,这种核心的东西是经得起考验的。
4、分区同步是指在2个服务器上,边界的区必须是同步的,并且内容完全一样。这主要是为了解决某个事件在边界往返时,出现各种异常。但这也不是没有问题的,我们想下,如果有个区是被同步的,那么同步区和非同步区之间边界由谁处理呢?另外,同步区由谁计算呢?如果是共同计算,就会有结果一致性问题,如果由其中一个计算,那么同步和非同步区的边界计算同样是个问题。
其实,区的形状和同步没有异议,最多将有6个服务器需要同步这个区的数据。我倾向于一个服务器计算这个CELL,其他服务向他传递边界数据,同时同步该CELL的数据。
5、分区的大小。一个分区应该多大呢?有3个原则,一个是分区内部计算量必须是一个服务器能够容忍的。另外一个是分区传递的数据,必须是网络能够容忍的。最后一个是分区内部的数据是逻辑上能够容忍的。前面2点很容易理解,第三个有点难理解,其实也简单,如果一个分区只有一个桌子那么大,那么围着桌子的6个人来往走动,将导致剧烈的网络传输。