ITSM的绩效考核向来是一个令人头疼的问题,有时就像一团乱麻,既无章可循,又无从下手。其实,只要掌握正确的思想方法,就能拨云见日。“斩乱麻”需“快刀”,“合规性考核”就是斩ITSM绩效考核这团乱麻的快刀。
合规性考核是第一要则
通常,业内将IT系统的稳定性作为考核IT运维的重要标准,比如系统宕机与否、宕机频率、宕机时长等。笔者认为,这仅可作为一个并不重要的参考标准,因为该标准具有很大的不确定性,即系统稳定与IT运维之间有关系,但并无绝对的直接关系——运维好未必系统就稳定,比如遇到各种不可抗力或其他突发事件;运维不好也未必会一定导致系统不稳定,比如系统本身的性能极好,或侥幸某一段时间很稳定……此外,具体到系统的哪一部分宕机,这又是一个极难考量的因素。比如非核心业务部分的宕机,尽管宕机时间较长,频率也较大,但与核心业务的极其短暂、偶然的宕机相比,造成的损失也有着天壤之别。
也就是说,系统的稳定性并非操作性很强的IT运维考核指标。在笔者看来,“合规性”才是IT系统运维绩效考核的最根本指标。合规性是来自审计学的一个概念,它将有没有好的规范,以及是否很好地执行了既有规范作为考核的标准。具体而言,合规性考核的第一步,就是要解决有没有好的规范的问题,即必须要有指导IT运维的规范,这个规范还必须要合理、严密、完整,并能够对IT运维工作提供非常具体有效的指导。只有这样,才是好的规范,才能使IT运维做到有法可依。第二步,在制定出好规范以后,还要对规范的执行程度,即执行是否全面到位进行考核。只有依据这个规范,一丝不苟地执行,IT运维工作才能达到设定的目标,IT运维才能做到有法必依。
如上所述,建立在合规性考核基础上的IT运维方式可以最大程度地实现IT运维的目标。那么,这种运维方式会不会大幅度提高成本呢?恰恰相反,它可以有效降低运维成本,因为一个制定得合理、严密、完整的规范,可以使一些维护工作的操作性得到改善。如一项复杂的测试工作,在没有规范的前提下,必须使用一个对该测试产品非常了解,操作熟练、规范的工程师来实施;而有了规范后,需要的便可以只是一个能够执行操作规程的技术工人,他只要根据规范的要求一步一步完成操作、记录数据,而不用关心自己做的工作深层的技术内容是什么,甚至不用关心测试的对象是什么设备。规范降低了对操作者熟练程度的要求,这样便可以不断降低用工成本,同时还可以降低培训成本等。
考核与外包有关系吗
现在,很多业者都在讨论运维外包的问题,并将运维的绩效考核与运维业务是否外包挂起钩来。非凡公司认为如果以合规性作为运维绩效考核的基本原则,那么,外包与否跟运维考核是没有直接关系的。无论是外包还是自己做,在对运维绩效进行考核的时候,都同样要坚持有法可依和有法必依的原则。当然,在具体怎么样做到这两点的时候,确实有自己做和外包两个选择。
首先,我们来看规范的制定环节。在这个环节上,企业可以自己搞,也可以请专业的顾问公司帮忙。一些自身技术力量比较强的企业,尤其是以IT为核心业务的技术型企业,通常自己做。而自己做,就必须考虑规范是否合理、严密、完整的问题。目前,业内已经有一些指示性的标准可供企业参考,比如目前非常流行的ITIL。
除了自己制定规范,企业还可聘请专业的顾问公司,帮助其制定规范。一般来说,一些自身运维力量较弱、IT技术力量相对单薄的非技术型企业,比如制造类、商业类等传统企业,通常考虑聘请专业的顾问公司帮其制定规范。在选择顾问公司时,企业需要对这些顾问公司进行综合考察,最关键的是要考察其在运维管理方面的经验。有些公司在某些运维规范(如机房和系统环境的运维规范)的制定方面已经具备了非常丰富的经验。举例来说,某银行企业将机房的运维分为例行事务、日常维护业务、维修业务、应急业务等多个类别,并相应拟定了一套严格的检查办法,包括“问题处理及时率”、“作业计划完成率”、“作业质量系数”、“文档质量系数”等多个具体指标,这些指标都为指导与考核IT系统的运维管理绩效提供了非常具有可操作性的标准。
其次是规范的执行环节。在这个环节,企业同样有自己做和请人做两种选择。在实际情况中,这两种方式通常是交错混杂。非技术型企业的做法通常是简单的自己做,复杂的找人帮;技术型企业的做法通常是复杂的自己做,简单的找人帮。但无论采取哪种方式,只要按规范一步步去做了,运维就是合格的。比如,规范要求每日巡查15个点,每点巡查5分钟,如果该运维人员在巡查过程中既没有减少巡查点,又没有在每个点减少巡查时间,那么该运维人员的考核结果就是合格的。或者,在某个点出问题后,要看运维人员能否在规定的时间内响应,如果能做到这一点,他的考核就是合格的。(转帖)