事故后的回顾为自我反思所发生的事件和事故管理团队的应对方式提供了机会。但是,如何避免演变成责备和指责?重要的是,要为审查会议确立正确的重点和基调,以保持对话的建设性,并产生有效的持续改进意见。做这些回顾的目的是为了改善未来事件的处理过程。
设定一个积极的基调,让正确的人参与进来
许多公司将参与事故后审查的人员名单保持在较小的范围内--希望在利益相关者眼中 "保住面子",不引起对可能没有处理好的事情的注意。经验表明,这是个错误。你要确保所有参与或观察过事故的关键人物都能在审查过程中提出自己的想法。
至少,PIR应包括以下内容。
- 从事这一问题的事件管理者和支持人员
- 负责根本原因分析的问题管理者
- 负责整体服务保证的服务所有者
- 受事件影响的业务职能部门的代表。
根据事件的性质,PIR可能还包括服务提供商代表、通信人员,在某些情况下,还包括最初报告问题的用户。
回顾完整的时间线
事故后审查的最大错误之一是关注票据打开后发生的事情。事件的时间线从业务功能或用户首次受到影响时开始,在打开票据和宣布事件之前可能会有一些时间延迟。这个早期阶段是流程中最容易改善的部分之一,但在PIR中经常被忽视。以下是一个问题清单,它将 PIR 讨论的重点放在事件的早期阶段,并确定改进的机会。
1.商业影响何时真正开始?
2.我们是如何发现这个问题的?是有人打电话给服务台,还是自动监测器发现的?
3.花了多长时间来捕捉这个问题并确定它是一个事件?
4.是否需要升级?升级程序的效果如何?
5.让支持人员参与进来是否有任何挑战(确定联系人、可用性等)?
评估数据和工具的使用情况,以便进行诊断
事件的故障排除经常归结为拥有正确的工具和数据,供主题专家用来了解发生了什么并诊断潜在问题。事故后的审查应包括审查有哪些数据和工具可用,哪些被使用,以及团队希望有哪些数据和工具可以让这个过程更容易。事故支持团队经常不知道实际可用的工具和资源。PIR可以帮助确定这些资源,并确保工作人员能够获得并知道在下一次事件中如何使用这些资源。
澄清决策
事故可能是高压力、对时间和成本敏感的情况,具有快速恢复服务的巨大压力。在解决事件的过程中,必须做出许多决定,例如:指定影响/紧急程度分类;弄清楚与谁沟通以及何时沟通;选择何种故障排除途径;决定采取哪些行动步骤来解决服务问题等等。其中许多决定将由团队中的某个人自发地做出(这可能是好的)。但有些决定应该由一个小组或有指定权限的人做出。PIR是审查已作出的决定和如何达成这些决定的好时机,以确保将来在权力和决策过程方面不会出现混乱。
加强未来的事件响应
事故后审查是您的持续改进工具箱中最有力的工具之一。利用这个机会,使事件得到最好的解决,并对你现有的事件管理流程以及如何在未来改进这些流程获得宝贵的见解。
关于Kepner-Tregoe
Kepner-Tregoe已经使数以千计的公司有能力解决数以百万计的问题。KT为运营、制造、IT服务管理、技术支持以及学习和发展领域的客户提供了一种数据驱动的、一致的、可扩展的方法。我们赋予你解决问题的能力。KT提供独特的技能发展和咨询服务的组合,专门设计来揭示问题的根源,并永久地解决组织的挑战。我们解决问题的方法将为任何希望提高质量和效率同时降低总体成本的公司提供可衡量的结果。