最佳实践介绍
完整的IT运维服务框架包括管理咨询、外包服务以及工具服务,以IT运维咨询服务为先导进行顶层设计,规范组织内部IT运维和IT外包业务;以IT运维外包为过程环节,实现IT运维的专业化和高效化;以IT运维服务工具为支撑,实现流程的固化和实时监测,提高IT运维服务的效率。总体框架图如下:
针对IT运维服务管理,国内外的大量实践已经为我们提供了优秀的经验。
借助第三方咨询力量可有效实现IT运维服务管理最佳实践落地
很多客户都希望加强自身内部的IT运维服务管理或者加强对IT外部服务的管控,但是苦于没有经验,在实际建设过程中出现设计不完善、不能落地的现象。实践证明,通过引入第三方咨询服务可以有效解决此问题。第三方咨询服务依靠大量的服务实践和成熟的实施方法论,可以帮助客户在最短时间内实现适合客户自身特点的IT运维服务管理体系的设计,并能辅导客户实现管理体系与日常管理的有效融合,帮助客户最大程度上发挥最佳实践的功效。
IT运维服务外包可实现IT运维成本与质量的平衡
在IT运维服务过程中,很困扰客户的一个问题就是业务对于IT运维服务质量的要求与IT运维服务能力和服务成本间的矛盾。伴随着组织IT系统复杂程度的不断增加,为保证IT运维服务质量,IT运维服务成本激增,如何来解决?
通过引入IT运维服务外包,将部分或全部IT运维服务交付给专业的第三方IT运维服务提供商,可有效解决IT运维成本与运维质量的矛盾。
选择IT外包有以下好处:专业公司提供的外包服务,比组织自身服务部门的工作更为高效、专业;利用第三方的资源和技术优势,降低组织管理与运行成本;组织自身则集中精力发展其核心业务,增强核心竞争力。
应用自动化巡检工具能够降低运维工作强度,提高巡检效率
信息系统的运维工作,涉及对网络、业务应用、桌面、安全、告警、运维服务模块等上百个指标的检查,对于这些指标的检查如果通过人工巡检的方式进行,巡检效率低,并且可能出现漏检、重检的情况。
自动巡检时,巡检中心按照巡检表要求定时启动巡检;巡检指令由适配器接收并执行,并将检查结果反馈到巡检中心;巡检中心实时展现当前巡检过程执行情况,发现异常情况即以工单、告警等方式及时通知给应急维护人员;针对每次巡检过程,能够自动产生巡检结果报告。对于所有历史巡检结果报告,支持按照多种查询条件进行快速检索。自动巡检系统还能够根据设定,定期自动产生统计分析和趋势分析报告,支持高层领导决策。
相对于人工巡检,自动巡检系统由中心和适配器分工协作实现自动巡检。运维中心负责执行巡检计划、分发指令、人机交互等;适配器通过调用资产数据接口或执行命令脚本,实现对资产信息状况的检查。自动巡检很好的解决了上述这些问题,是运维巡检的最佳实践之一。
应用服务水平协议有助于提升服务质量和服务认可度
服务水平协议(Service Level Agreement,SLA)是一种由服务供应商与用户签署的法律文件,其中承诺只要用户向服务供应商支付相应费用,就应享受到服务供应商提供的相应服务质量,是定义服务提供者和用户之间关系的一个文件。
服务水平协议内容一般包括提供的服务、服务水平、问题管理、法律适用和解决争端、客户的义务和责任、安全、知识产权和机密资料等。
有效的应用服务水平协议,将有助于确定并界定用户需求、提供便于理解的框架、简化复杂问题、减少冲突范围、在发生争议时加强对话、消除双方不切实际的期望等。服务水平协议将建立服务双方共同的愿景和考量标准,实现对服务水平的统一理解,有助于改善服务接收方对服务提供方服务水平和服务质量的认可度。
持续监测有助于防患于未然,降低IT故障发生几率
持续监测就是通过部署监测工具对IT系统的关键指标进行7*24小时不间断的监测,一旦指标出现异常,将自动通过邮件、短信等方式提醒IT运维服务人员进行关注并分析。
通过持续监测IT系统的关键指标,IT运维服务人员可以在故障发生前提前介入并进行调查分析,并将故障在萌芽阶段予以排除,实现提前预警、提前处理,避免故障发生给业务造成的影响,降低客户损失,提高IT系统的可用性。
定期巡检是一种比较经济的故障预防手段
由于持续监测需要部署专业工具,还需要IT运维人员24小时的驻场服务,总体投资比较大,对于可用性要求比较高的IT系统是必须的。如果客户所应用的IT系统并不要求非常高的可用性,持续监测这种服务方式就显得昂贵了,此时采用定期巡检的方式不失为一个好的选择。
定期巡检就是周期性地对IT系统进行一次全面的健康检查,周期的频率取决于客户对于IT系统可用性的要求。定期巡检的检查项目与持续巡检检查项目一致,通过规定项目的定期检查和日志分析,可以判断IT系统的健康状况,查找系统漏洞和安全隐患,并采取措施进行加固。由于定期巡检不需要一次性的工具和人员投入,也能取得较好的故障预防效果,是一种投入产出比较高的故障预防手段。