科学的IT运维服务管理之道
IT运维服务包括自有运维、外包运维、自有与外包相结合的方式。下面将对两种不同模式下的管理进行阐述。
基于最佳实践的IT运维管理
1 、ITIL概述
IT运维管理作为IT服务管理的主要范畴,目前国际上的研究和论证比较成熟,主要成果包括ISO20000系列的国际标准以及ITIL最佳实践方法论,两者从理论基础上是一致的,区别在于标准和标准的实践。下面以ITIL为例介绍IT运维管理的最佳实践。
ITIL 是基于流程的方法论。IT部门可用其检查是否用一种可控的和训练有素的方法为最终用户交付所需的IT服务。ITIL合并了一套最佳的实践惯例,可适用于几乎所有IT组织, 无论其规模大小, 或采取何种技术。ITIL被用来建立和交付服务管理流程;这些管理任务可被某些服务及系统管理工具所简化。
ITIL对IT服务管理实践中涉及的许多重要问题进行了系统的分析, 包括全面的检查清单(checklist)、任务、程序、责任等与任何IT服务组织密切相关的问题。这些概念的定义也涵盖了大多数IT服务组织的主要行为。IT服务组织可以借助ITIL的指导建立和拓展自己的IT服务流程。
ITIL V3的核心设施是基于服务生命周期的, 服务生命周期框架下图所示, 服务战略是生命周期运转的轴心;服务设计、服务转换和服务运营是实施阶段;服务改进则在于对服务的定位,基于战略目标对有关的进程和项目的优化改进。
2 、ITIL五大模块
ITIL V3包含的各模块内容如下:
(1)服务战略(Service Strategy)
服务战略为组织在设计、开发和实施服务管理从组织能力和战略资产两个战略角度来提供指导。该部分内容提出了服务管理实践过程中整个服务生命周期的策略、指南和过程。服务战略是服务设计、服务转换、服务运营和服务改进的基础,它的主题包括了市场开发、、内部和外部的服务提供、服务资产、服务目录,以及整个服务生命周期过程中战略的实施。
(2)服务设计(Service Design)
服务设计描述了对服务及服务管理过程设计和开发的知道,它包括将战略目标转变成服务投资组合和服务资产的原则和方法,服务设计的范围不仅限于新的服务,它还包括为保持和增加客户价值而实行服务生命周期过程中必要的变更和改进,服务的连续性,服务水平的满足,以及对标准,规则的遵从性。它指导组织如何开发设计服务管理的能力。
(3)服务转换(Service Transition)
服务转换为如何将新的或变更的服务转换到运营过程中有关能力的开发和改进的指导,服务战略需求通过服务设计进行编码,而服务转换则是探讨如何将这种编码有效导入到服务运营的体系中,与此同时,还应控制失败的风险和服务的中断。
(4)服务运营(Service Operation)
服务运营包含了在服务运营方面的实践,它对如何达到服务支持和交付的效果与效率,确保客户与服务供应商的价值提供了指导,并最终通过服务运营实现战略目标。
(5)持续服务改进(Continual Service Improvement)
服务改进为创造和保持客户价值而用更优化的服务设计、转换和运营提供指导。它结合了质量管理、变更管理和能力改进方面的原则、实践和方法。组织要学会在服务质量、运营效率和业务连续性方面的不断提高和改进意识。此外,它还为改进所取得的成就与服务战略、服务设计和服务转换之间如何建立关联提供指导,为基于戴明环(PDCA)形成计划性变更的闭环反馈系统的建立提供思路。
3、 ITIL关键流程
在IT运维服务体系中,ITIL是一套基于流程的方法和规则。在组织信息化建设中,ITIL可以指导信息化部门向用户提供更为高效可靠的服务。下面对这些关键流程进行简要的介绍。
(1)服务台
服务台是用户与IT部门进行沟通的唯一平台。服务台为用户提供了服务联系点,利用这个联系点促进组织业务流程与服务管理基础架构的集成。服务台的主要设计目标是加强用户与IT服务部门之间沟通,为组织的信息化建设服务。
(2)事件与故障管理
事件与故障管理的主要功能包括对事件与故障进行记录,分类,并安排专家管理故障处理的全过程。事件与故障管理的目标是在避免影响客户和用户业务的前提下让IT系统能够迅速恢复到安全级别。
(3)问题管理
问题管理流程是指通过事件发生的原因进行分析,制定问题的解决方案以及预防措施,降低因问题和事件而产生的消极影响。与故障管理单纯强调故障的处理速度不同,问题管理模块的核心功能是找到事件发生的深层次原因,并相应的提出合理的解决方案防止问题的再次发生。
(4)配置管理
配置管理模块负责识别和确认系统配置项、记录和报告配置项状态和变更请求、检验配置项的正确性和完整性等活动。设置配置管理的主要目的在于为组织提供IT基础架构的逻辑模型,对变更管理和发布管理提供有效的支持。
(5)变更管理
变更管理是在最短的时间内完成系统架构,并在服务的任一方面发生变更时对其进行控制的服务管理流程。该模块的设计目标是确保在变更实施过程中使用标准的方法体系并提高变更的效率,并降低由业务变更导致的业务中断对组织产生的影响。
(6)发布管理
发布管理流程负责对经过测试后导入实际应用的新增或修改的配置项进行分发和宣传。发布管理之前进行的是软件的控制和分发,该过程由变更管理流程进行管理。
(7)服务级别的管理
该项管理的目的在于为签订服务级别的协议而进行一系列活动所组成的服务管理流程,其中主要的活动包括协议的计划、草拟、以及签订服务级别等方面。有效的服务级别管理可以保证IT服务质量在不提高成本的前提下能够稳步提高。
(8)IT服务财务管理
IT服务财务管理模块主要是指IT服务过程中所需的成本进行预算和核算,根据预算情况向客户收取相应的费用。所涉及的费用主要包括投资预算、服务成本的核算以及服务计费三部分。合理的财务管理以及计费方法可以通过量化服务成本降低开销,避免风险的发生并引导客户的合理行为。财务管理流程产生的预算和核算信息可以为IT服务提供有效的辅助决策信息。
(9)IT服务持续性管理
IT服务持续性管理指当系统发生故障时有可靠的技术、财务和管理资源保证组织的IT服务能够正常运行。保持IT服务持续性的关键在于当故障发生时,系统仍可以提供预定级别的服务,从而确保系统的业务可以稳定持续的运行。
(10)能力管理
能力管理既考虑运营成本也考虑业务需求,对服务能力进行合理配置从而达到IT资源发挥最大效能的目的。该流程包括服务能力管理、业务能力管理和资源能力管理等方面。
(11)可用性管理
可用性管理流程通过分析用户和业务方的可用性需求并以此为依据来优化和设计IT基础架构的可用性,有效的可用性管理可以在控制成本的前提下提高系统的可用性。有效的可用性管理可以通过定位业务以及对用户的可用性需求进行分析,从而使IT服务的设计能够满足用户的需求,并且可以避免IT服务运作中可用性级别过高的情况发生,这一设计思想对于降低IT服务的运作成本具有重要意义。