(完整版)事件管理过程


1 事件管理的定义
突发事件是指在IT服务中的一个无计划中断或IT服务本身服务性能的降低,包括系统崩溃、硬件或软件故障、任何影响用户当前业务使用和系统正常运作的故障以及影响业务流程或违背服务级别协议的情况。
突发事件管理流程是为企业业务系统尽快恢复正常工作状态而设计的,其所关心的重点是如何达到快速响应、快速恢复,使故障对企业业务的影响最小化。
事件管理的责任是记录、分类、调查与诊断、解决已知问题、监控跟踪事件,与用户和问题管理流程交互并最终解决事件。
2 事件管理的目的
事件管理流程的主要功能是尽快解决出现的事件,保持企业业务系统的稳定性。例如,中国移动10086的服务控制台接线员会去负责记录突发事件的相关信息,并向用户提供对已知问
题的处理方法,报告事件到相关的技术支持部门和尽快恢复用户的服务。解决突发事件的目的是获得尽可能高的事件解决率,其主要目的包括:
(1)在成本允许的范围内尽快恢复服务
提供电话或网络与帮助,通过自动监控和快速响应系统对故障进行及时告警等环节来保证服务能够尽快被恢复。
(2)事件控制和监控
记录任何事件,并对事件的优先级进行分类和处理。服务控制台工作人员要对当前事件进行分析和诊断,必要时把事件升级到相关的技术部门去处理,而且服务控制台工作人员要对事件的全称进行监控,直到事件得到圆满的解决。
(3)提供事件统计信息给IT管理层
可以对事件进行分类统计,比如可以通过Parato分析法分析出哪些事件是经常发生的,这些信息可以提供给管理层进行决策分析。管理者会关注那些主要的事件或缺失环节,并采取相应的措施对服务环节进行调整和提高。
3 事件管理的范围
事件管理是和该公司的IT基础架构与具体的商业业务相关的。突发事件可以包括服务故障申告、业务咨询、业务投诉和业务处理等。一般的事件产生会有两类:一类是由监控管理平台(如Tivoli监控软件)自动发现并产生的告警事件,另一类是由用户/IT运维人员报告的事件。突发事件管理流程不一定必须到问题发生的根本原因,其重点在于如何在尽量短的时间内,恢复已经中断的IT服务,并提高服务的可用性。
4 事件的优先级定义
优先级是事件管理的一个关键要素,优先级决定处理事件的顺序及所需的资源。事件优先级可分为四类,如下表1所示:
表1 事件优先级定义
级别定义
描述
一级
IT系统/设备宕机,服务网络不可用,业务不可用,或大批用户在使用上出现问题
二级
服务业务或服务网络的性能出现问题,一个以上的设备出现严重警告信息
三级
紧急的用户请求或投诉处理
四级
一般常规的用户受理或服务请求
服务控制台的工作人员在接到来及监控管理平台的告警事件或终端用户报告的事件时,迅速根据事件相关IT系统/设备、网络的关键级别及事件的性质,定义该事件的优先级别。如果为紧急和棘手的事件,应立即升级到相关的技术或业务部门。事件升级的目的的是确保事件在解决时限内及时通知有关技术人员和领导,引起更多的重视,提供合适的资源,从而快速到解决事件的方案。可根据所要求的处理时间定义事件优先级升级规则,包括不同等级的事件在不同的事件被升级到不同级别的人员。当技术或业务部门接受到服务控制台升级上来的事件后,会根究具体的事件级别在规定的事件内解决。
与事件优先级对应的事件解决时限参考表如下表2所示:
表2 事件解决时限参考表
优先级
一级
二级
运维流程管理三级
四级
解决时限(小时)
4
8
24
48
5 事件升级
如果某一事件不能在规定的时间内由一线支持小组解决,那么更多有经验的人员和有更高权限的人员将不得不参与进来。这就是升级,它可能发生在时间解决过程的任何时间和任何支持级别。升级分为职能性升级和结构性升级。两者的区别如下:
职能性升级(又称为水平升级、技术升级):职能性升级意味着需要具有更多时间、专业技能或访问权限(技术授权)的人员来参与事件的解决。这种升级可能会超越部门界限而且可能会包括外部支持着。
结构性升级(又称为垂直升级、管理升级):结构性升级意味着当经授权的当前级别的机构不足以保证事件能及时、满意地得到解决时,需要更高级别的机构参与进来。
事件管理经理对事件管理流程负有全部责任,他的目标是要为满足一个事件的职能性升级的需要做好预备工作,以避免结构性升级的发生。
事件的处理流程线路是由所需的专业等级、紧急度和权限等因素决定的。1线支持通常由服务台来提供、而2线支持则通常由管理部门提供;3线支持则多由软件开发人员和系统结构人员提供;4线支持由供应商提供。公司(组织)越小,则可供升级的级别数就越少。在较
大的公司(组织)里,事件管理经理可在相关部门指定故障协调人来支持自己的工作。例如,协调人在整个事件管理过程与处于各线的支持机构之间可充当接口的角。每一个协调人协调他本身所在的支持团队。图5-1描述了升级的过程。
图5-1 事件升级过程
6 事件管理的流程
事件管理流程应起始于事件的接受和报告,结束于事件的解决和关闭。该流程包含下述主要内容:
(1)记录和接受事件
是事件流程的起点,所有用户或系统报告的IT事件必须由此开始,目的是快速准确地发现事件,以协助事件的诊断和解决并通知相关人员。在此步骤中将会收集创建事件记录所需的信息。该环节的关键是信息的准确性和完整性。在执行突发事件管理流程时,所需要记录的事件信息项如下表6-3所示:

本文发布于:2024-09-21 18:57:48,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/356472.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:事件   升级   管理   服务   解决   流程   业务
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议