已发表在《网管员世界》
转载支持,批评更支持,另投就不支持喽!
机房落成以后,窗明几净的环境,整体划一的布局,很容易让我们放松心情并沉浸在成功的喜悦之中,当慵懒的情绪占据我们大脑太多空间的时候,前期精心策划的机房也将逐渐步入危险地境界,恐怕一个网线的短路即能给机房造成致命打击,因此时间久了我们的担心也逐渐强了起来。
担心机房设备增加,UPS安时过小不能满足需求;担心单个空调不能满足整个机房的温、湿度要求;担心机架凌乱的网线对网络造成强烈串扰;再或者担心终端无限制的扩容,给网络、交换机带来巨大的负载。当越来越多的担心充斥在我们内心深处时,慵懒的心情该收敛一下了,机房维护中长期而持久的主旋律将是—改造。
迁址
这应该是所有网络管理员最为头痛的事情。机房建设之初,充其量也只是考虑未来5~10年的网络发展,时间久了服务器增多,原始的机房已经装不下那些服务设备,或者公司主营业务拓宽,建设了新的厂房,更多的信息点,更稳定的使用环境注定要将机房迁移到新的地址。搬新家的喜悦感虽然能很长时间主导我们的思想,但是由迁址带来的一系列问题却是不能忽视的。
1、考虑用途
迁移机房并不是迁移所有设备,留给旧机房的至少还包括原核心交换机和机架,当偌大的机房只剩下一、两个独立设备时该如何处理呢?留作其他人员使用,IT部门不会答应,更何况防静电地板、消防系统、门禁系统都是经过严格测试后搭建的,所以原始机房不能拆,也不能借用,最好的结果就是作为其他服务器的备用机房。
理论上讲,备份服务器和主服务器最好要隔离100米,尤其是备份用的磁盘、磁带等存储设备,更要远离主服务器,于是在迁移机房时,看似闲置的原始机房我们可以用来存放备份域服务器、冗余的代理服务器、备份的文件服务器、磁盘、磁带等存储设备,这样原始机房能够充分利用,主机房也可以免去无框玻璃隔断的建设,节约成本。
2、考虑距离
公司园区内能够落成新的建筑占地自然不菲,距离的限制让双绞线不能作为主要的传输介质,光纤是必选项,但是这里也有一个注意的事项,光纤的传输速率和传输距离的限制。
传输速率在1Gb/s,波长为850nm,普通50μm多模光纤传输距离550m,62.5μm多模光纤传输距离为275m,而传输速率10Gb/s,波长为850nm,普通50μm多模光纤传输距离则锐减至250m,普通62.5μm多模光纤传输距离只有100m。
这里我们可以得知,传输速率越高则距离越近,如果我们需要长距离传输,又要求维持高传输速率,那么我们就需要采用单模光纤,传输速率10Gb/s,波长在1550nm,g.652单模光纤传输距离可达到60km,这足够满足大部分企业的需要了。
以上数据我们可以作为参考,合适的距离和速率选择合适的介质。
3、考虑分层
公司园区的地理规模较大,那么涉及的交换机的就会越多。一般会是这样分布:核心交换机→建筑群子系统的交换机→垂直干线子系统的交换机→桌面交换机→最终用户,如果这一路径跨越多达七层的交换机,那么网络的负担将会相当大的,不管是核心层的还是桌面级的数据通讯都会很吃力,所以,在迁址时要严格控制的网络的分层,这个分层不是OSI分层(开放式通信系统互联参考模型),而是从核心交换机到最后的桌面级交换机需要经过的路径。这个路径不要超过7层。
4、考虑时间
如果交换机、服务器迁移的过程中众多终端用户正在使用网络,那么ERP的数据无法进行查询、邮件的发送接收也会中断,文件服务器的存储工作即告失败,基于网络的信息化流程全部瘫痪,所以做迁移工作对时间的选择非常重要。如果遇到十一或者春节长假那最好不过了,我们可以有充分的转移服务器和测试网络的时间,但是长假可遇而不可求,通常给我们的时间只是周六、周日这两天的时间,于是我们可以这样做。
周五之前联系各部门经理询问休息日的加班情况,先期安排时间,尽量避开大规模加班日,然后邮件通知网内所有用户,告知具体的网络停机维护时间(这里假设个别部门周六加班,则我们选择周日维护)。
周六晚22:00之前关闭所有需转移服务器→等待30分钟降低设备温度→转移服务器→连接所有服务器和网络设备,进行初步测试→周日全天对所有服务进行全面测试→周一观察并记录网络整体使用情况,有问题,进行相应改造,无问题,机房迁址成功。
整个机房的搬家在网络规划中是重中之重,我们要根据企业的实际情况和网络的自身情况做出合理的安排,同时也要与建筑安全公司、物业部门精诚合作,共同完成。
机房设施改造
在机房建设的那篇文章中,笔者介绍了几个需要注意的地方,但是随着网络环境的不断扩充,终端的不断增加,服务器、交换机等设备的持续升级,除了无框玻璃隔断、防静电活动地板这些内部的装饰,很多设备需要我们进行升级改造。
线路改造
5年前的网络多采用超五类双绞线作为主要传输介质,包括机房内的网络的传输。随着
网络终端的不断扩充,用户对网络速度的要求越来越高,时常会抱怨某个服务器提供的数据回送比较慢,其实服务器的硬件速度倒是完全能跟得上节奏,跟不上的是网络的速度。当然,将整个网络全部予以重新布线显然不现实,但是对机房内的主干线路进行一下改造和重新规划是完全有必要的。
这里我们可以选择六类布线系统。
首先它的速度可迅速提升一个新的高度,达到千兆网络,最大可达到1.2Gbit/s,同时它在物理层也影响着电气指标,在新一代全双工的高速网络中,最大的敌人就是RERURN LOSS(回波损耗)和NEXT(串扰),这两个干扰值越大对网路速度的影响也就越强,而六类布线系统自身的质量特性即可有效的屏蔽这两大影响网络的天敌,可保证信道的整体性能长期处在最优状态。
机柜改造
单一的工作做久了,漫不经心的情绪会越来越强,最直观的现象就是机柜中的网线,常因此变得杂乱无章。网管把它推脱于工作的繁忙,无暇整理,殊不知这种无序的堆放网线会对网络造成巨大影响,这是我们要整改的一部分。
首先,考虑将网线部分与电话线部分分开布线,即左侧全部走网线,右侧全部走电话线,然后将线缆每隔1.5米进行绑扎,防止线缆相互拉拽产生损坏,也可以有效地减少近端串扰;
其次,将网线和电话线超长部分进行截取,规范布线,同时对出现氧化层或者卡头松弛的水晶头重新制作(日常维护中很多时候都是一号线通讯失败,后测均是水晶头出现问题,这种情况在闷热、潮湿的夏天尤为严重),这可以有效减少网络通断故障的发生,更减少回波损耗造成的干扰。
第三,如遇网线与电话线共同使用的情况(注:网线使用1、2、3、6号线,其余的可做电话线),严格拆除,只做电话线路使用,同时找寻网络另一端,采用接驳HUB的方式重新予以布线,可减少电话振铃时产生的72V瞬间高电压击穿交换机现象,以避免损坏交换机。
第四,清理废弃线路,节省网络资源,也便于我们进行控制。
经过上述处理,机柜的整洁性会大大提高,同时也方便我们查找线路,最大的好处是可以在物理层面先行减少网络信号的干扰。
空调系统改造
机房建设之初我们考虑空气环境的洁净度、温湿度等情况。设备比较少的时候单一空调能满足控温、控湿的需求,但随着机房设备的不断增加,单一的空调已经不能满足日常的需要,更何况一台空调7×24小时的不停运转,多强悍的设备也终会有罢工的一天,所以这时候有两种选择。
1、联动空调
购买2台或者更多台空调,将其做成联动系统,由软件控制每一台空调的运行时间、停机时间,并周期性地自由切换。当一台空调出现故障时,其余正常使用的空调自动接管联动任务,同时通知机房管理员以作应急处理。它可保证每台空调都会有充分的“休息”时间,能有效延长空调的使用寿命。
2、精密空调
这是一个大成本的解决方案,因为精密空调的造价非常昂贵,但是它所能提供的工作精度、可靠性和稳定服务却是一般空调设备不能比拟的。它可以在室外温度达到-45℃仍能提供服务,而且它对机房内部的温湿度监控更为精确,温度差不会超过1℃,湿度不会超过5%,同时,它的使用寿命相当长,最低也要求使用10年,连续运行超过85000小时,平均无故率要达到25000小时。所以,精密空调无疑是空调系统中最为稳定的设备,它多用于银行、通讯、证劵、石化、航天等大型企业中。
UPS系统改造
设备的增加不仅加大了空调系统的压力,还考验着UPS系统,当负荷超过UPS可控范围,那么光是UPS无休止的报警就够我们脑袋疼一天的,严重的是这种满负荷运行极易损坏UPS设备,小至减少使用寿命,大至直接爆掉电池,这样的损失太大有些得不偿失。UPS不是买来就一劳永逸的物件,它也是需要改造的。
首先,重新核算机房内需要UPS供电的电源功率,根据下列公式重新计算UPS电池的安时数:
UPS电源功率(VA)×延时时间(小时数)÷UPS电源启动直流=所需蓄电池安时数(AH)
得出结果后,采购足量的电池以满足机房供电需求,这是其一。
其二,为了更加安全的使用UPS,我们可以做成冗余UPS方案,即购买2组UPS系统(最好是同一型号的),通过控制台将其并行连接,这两组UPS系统的输出电流、电压等指标一定要保持同一状态,当一组UPS因故障而停机时,控制台通过变换器迅速切换到另一组UPS,保证电力系统不中断连接,如果再配合使用2路供电系统,那么它的可靠性更能得以保证。
供电系统改造
设备增加,空调升级,UPS改造都会要求拥有足够的电力系统,当停电是“拒绝”选项的时候,我们对供电系统更要进行近乎严格的改造。
首先,为了保证电力的绝对可靠,至少配备两路供电系统,当一条线路出现故障的时候可以迅速切换到备用线路,保证数据通讯不中断。
其次,如果对电力要求极高,不允许出现任何闪失,那么还需要配备一台柴油发电机。当供电系统运转正常是,柴油发电机组处于待机状态,一旦两路市电都中断时,机组立即接管,马达动力可提供100%负荷的能力。市电恢复时,机组自动退出运行开始延时停机工作,等待市电重新接掌供电系统。
以上是对机房基础设施的改造,很多小的细节方面也要注意,比如电源的插排,我们一定要选择正规厂家的产品,并且在使用插排时务必要留出一、两个空闲插座,这不是为了日后使用方便,而是保证插排的负荷不是处在最大强度,避免过载产生火灾。这些细微之处也时刻威胁着机房的安全,这要求我们时刻保持警惕状态,发现问题立刻整改。
服务改造
交换机也好,服务器也罢,它们都是为网络和用户提供最终服务的设备,它们的稳定与否,性能好坏直接影响着网络的正常运行。终端接入的越多,它们的压力也就越大,网络速度也越缓慢,不能正常提供服务这是最常见的表象,也是我们最不愿意看到的情形,为了网络能够流畅、稳定、安全的运行,这两者的改造也是我们要重点关注的。
交换机、路由器改造
网络发展速度之迅猛可能连交换机、路由器的生产厂家都不曾预见,所以早期的设备在功能、使用等方面多少会有点缺陷。随着网络的规模越来越大,先前的网络设备已经无法满足快速、可靠的网络连接,升级设备是必然的。我们在升级网络设备时最好要考虑一下这几方面的内容。
1、需求
既然要升级网络通讯设备,那么肯定是对当前网络的的某个方面不太满意,或者是包转发率过低,或者是端口容量太小,亦或者是对背压不满意,每个企业的网络不同,考虑的侧重点也不一样,这就要求从实际情况出发,选择适合自己的产品。并不是越贵的产品就越好,超高的性能闲置不用本身就是一种浪费。
再有,我们选购设备还要有一些侧重点。
比如:针对性。
早期规划中,交换机出现在OSI七层模型中的第二层,即数据链路层,路由器则出现在第三层,网络层。如今随着网络设备的不断发展,交换机已经可以做到第三层甚至第四层,很多交换机已然能够囊括路由器的部分功能,但是三层交换机的路由功能和支持的路由协议都十分有限,它只适合中小企业等较少路径的网络环境,而路由器可以根据自身的携带的协议处理复杂的网络环境,并且可以计算出最优的网络路径,这多用于大型网络。
再比如:考虑未来。
无线网络逐步迈入企业,这是未来网络的发展方向,这样我们就需要考虑无线设备的规划,如AP的覆盖位置,怎样走线,如何与有线网络完美的结合,当一台电脑同时接入有线与无线时,交换机分配的IP地址又会是怎样?也些都是我们要考虑的对象。
2、兼容性
不是每个产品买来就能适用的,它能否与先前产品完美的协同工作,基于某种协议的通讯是否有障碍,速度是否得以提升都是我们要甄别的地方,它的兼容性我们要多做考虑。
a、协议的兼容性
设备越多,升级时我们越要全面考虑。比如:网络中使用EIGRP作为路由通讯协议,它结合了最短距离矢量和快速收敛链路状态等路由优点,这个协议在实际应用方面能大大提高网络的使用效率,但是它的使用很有局限性,因为这个协议是思科的专有协议,其他路由厂家或许不集成EIGRP。
这样的情形还有很多,比如:端口聚集协议(PAgP)、思科发现协议(CDP)、思科交换链路内协议(ISL)和动态 ISL 协议(DISL),这些单一厂家开发的协议在别的产品上是否适用是个问题,所以我们在升级时首先要考虑协议的兼容性。
b、速度的兼容性
几乎所有的核心交换机都能提供100/1000M自适应功能,但是不同品牌之间的交换机自适应能力却值得商榷,曾经遇到过这样一个案例。
联想D-LINK的一款三层交换机通过光纤连接至华为的一款核心级交换机时网络不通,没有任何数据流量,采用D-LINK DFE-855光电转换模块连接到交换机时,网络即恢复正常。光纤自然是通的,交换机也是好的,网络不通的原因就是2台交换机不能同步相互的速度,这个时候需要我们强行设置它们的交换速度,在主核心上将通往联想D-LINK的光口上把速度设置为1000M/FUL,这样就能交换机就能够相互识别、通讯了。
本例中,强行限速能够实现握手通讯,如果限速了也不能连接那就只能靠DFE-855来维持了,需要明确的是DFE-855只能提供100M的速率,虽然是连接了,但速度没有任何提升,这样的升级不做也罢,所以速度的兼容性亦要考虑。
这些都是我们在对交换机、路由器进行升级改造时需要注意的几个方面,其它的细节方面还有很多,我们还需要适时而动。
服务器改造
企业主营业务增长必然带动信息化的联动升级,随着信息化项目的不断增加,很多网管都经历了机房内从几台服务器膨胀到的几十台服务器的过程,这种爆发式的增长必须要有软硬件的配合方能实现。
1、硬件的改造
越来越多的服务器占据的机房空间也会越来越饱满,如果存在大量的塔式服务器,终有一天机房会被它庞大的身躯所占满,为了节省不太充裕的机房空间我们不妨选购性能相当,体型娇小的服务器,这其中当属机架式服务器和刀片服务器。
a、机架服务器
这种服务器是按U为计量单位的,它的大小基本上是按照普通19英寸机柜定做的,从1U至8U不等,多数控制在4U以下。相对于塔式服务器它的体积非常小,这是优点,但是也由此带来一些不便,多数机架服务器只提供2个PCI插槽,内存插槽也不是很多,这样可扩展性就相对差一些,另外散热方面也颇为不畅,如机房温度过高,则需外力协助散热才可以。
b、刀片服务器
它需要的只是一个大型主体机箱,在它的内部可以放置多块“刀片”(也就是我们所说的系统母版),每一片刀片都有一个独立的硬盘,独立的系统,提供独立的服务,它只活动于主体机箱内,占据的空间更小,同时也改善了机架服务器的两大弊端。
可扩展性,当需要升级的时候只需将新的刀片插入主体机箱中即完成操作,此相当于添加一台新的服务器;散热方面则被刀片服务器处理得更为简单,它在主体机箱内部安装一个超大的散热风扇,多热的温度也能瞬间排放一空,因此刀片服务器多是小型机房的选购重点。
另外,市场中新一代服务器—“模块化服务器”逐渐转露头角,更经济的价格、更灵活的配置、更简单的管理正在大肆挖角服务器市场的份额,未来服务器的选购,它也应该步入我们的视野范围之内了。
2、系统的改造
中小型企业多数还是采用微软的“域”结构,虽然将“域”定义为安全边界,但是它的安全性却饱受诟病,毕竟用Windows的企业和***Windows的***实在是太多了,所以改变一下思路,使用安全性更高一点的Linux作为服务器在很多方面能够抵御***的***,而它所能提供的服务丝毫不比Windows少,邮件服务、代理服务、WEB服务该有的应有尽有,配置简单、性能也很好,注重安全的企业不妨多关注一下Linux。
另外,诸如网络版杀毒软件、防火墙系统、IDS/IPS系统、网管软件系统等等安全防御和控制系统也需要及时的升级以应对网络的不断扩充,不过这些系统级的改造工程是复杂而又长期工作,这里不再细细赘述。
结语
一个机房可能也就占据公司整个面积的1%,甚至更小,但是不要忽略这个近乎可以忽略不计的地方,公司园区的所有数据全部经此流转,或者是商业机密数据,或者是研发数据,再或者是服务器之间的核心数据,都是不容有任何闪失的。发挥我们的想象,哪些设备还徘徊在危险地边缘?哪些手段能够为我们提供更深层的保障?哪些地方我们还能做的更安全?只要可行,立刻去做!
改造不能给我带来立竿见影的实际效果,但是却能为整个网络的安全、稳定的运行打下坚实的基础,让我们时刻准备着。