联系我们

重大事件管理--当变革出现可怕的错误时做好准备

当一个公司制定重大事件流程时,他们首先考虑什么是重大事件。组织会倾向于从外部关注黑客和网络攻击对网络造成破坏的可能性,并产生数据安全问题。他们相应地定义事件的优先级,强调外部原因。

这种担忧不无道理。在当今的企业环境中,系统漏洞不一定是 "如果 "的问题,而是 "何时 "的问题。因此,企业将重大事件管理团队的职责集中在可能导致服务中断的外部因素上。然而,他们往往没有记住,重大事故并不仅仅是由系统故障或外部攻击造成的。它们也可能是计划中的变更出错造成的。

当变革管理引起的重大事件发生时,会发生什么?

首先,你应该认识到,不仅你的用户会受到影响,而且你很可能也会遇到流程、角色和责任方面的混乱。

当你有一个由变化引起的重大事件时,系统往往处于不同的状态,许多利益相关者由于计划中的停机时间而失去参与。您的变更管理和事件管理流程被迫平行运作,每个团队可能有不同的流程负责人。所产生的复杂性使得在业务影响升高的时候管理事件变得非常困难--导致你的企业处于高风险状态。

如果不事先考虑这种情况并弄清楚你将如何处理它,你的变更管理和事件管理流程很有可能发生冲突。这将使技术支持人员和管理层不知道谁在控制,谁应该进行沟通,以及应该如何做出决定以尽快恢复服务。


 
在重大事件发生时做好准备。 重大事件管理培训


如何使你的变革管理和事件管理计划协调一致

在分析和准备公司处理变革引发的重大事件的计划时,以下是正常的变革管理和事件管理方法不同并需要协调的一些关键领域。

通讯

第一个冲突领域是沟通。在正常的变革环境中,沟通计划都是按部就班、例行公事且不频繁的--省略了有关情况、正在开展的活动以及对运营的影响等技术细节。在重大事故情况下,沟通需求几乎相反。相反,您需要将重点放在让利益相关者经常了解影响、诊断活动和状态。这可以向利益相关者保证,支持团队已经控制住了问题。

当这些情况发生碰撞时,冲突的沟通方式也会导致解决时间延长。当这两种情况同时发生时,重要的是确定谁应该进行沟通以及沟通的频率。界定每次沟通的重点是什么。最重要的是,所有的更新请求都应该通过指定的联系人来进行,以避免造成混乱和分心。

决策结构

变革管理的决策机构通常高度结构化,有固定的节奏、标准化的文档,并注重所提建议的可信度。在发生重大事故的情况下,决策需要实时做出,以解决事故问题,同时关注成本/效益、权衡和风险。

为了避免混乱,应该明确决策权何时从变更管理转换到事件管理,然后一旦事件得到解决,如何再过渡到变更管理。

前滚翻与后滚翻

大多数变更管理流程在处理失败的变更时通常采用的方法是回滚变更,恢复到系统先前的工作配置。除非涉及重大事故,否则这种方法基本上能成功确保服务恢复。

当一个重大事件发生时,你的公司可能需要考虑一个不同的选择:向前滚动而不是向后滚动。开发和部署一个新的变化可能会导致更短的解决时间。向前滚动的决定也可能是由于回滚计划失败的结果。它也可能是由于重新定义了实施计划中的变化的业务关键性,或者是对不同选项的成本/效益/风险的比较评估的结果。

根本原因分析

当因变更而发生重大事故时,必须开展两项根本原因分析工作。首先是对变更进行技术分析,以了解变更失败的原因,以及需要采取哪些措施来纠正问题并防止再次发生。其次是对变更管理流程进行分析,以确定有缺陷的变更是如何被批准发布的。这第二部分对于发现开发和测试过程中的问题以及加强变更管理过程中的过程控制至关重要。

由变化引起的重大事件对你的公司来说是一种高风险的情况--既极有可能发生,又在发生时具有非常大的影响。它们会导致收入损失,更重要的是,在你的客户中失去信誉。

为应对由变革管理引发的重大事件,最好的办法就是规划团队在这些情况发生时的应对措施,并提前进行演练。如果您尚未制定计划,那么关注基本要素(沟通、决策、技术选择和持续改进/根本原因分析)是一个很好的开始。如果您有现有流程,则应完善和调整流程,以最大限度地减少业务影响,提供有针对性的利益相关者沟通,并添加步骤,以便在诊断和决策过程中获取根本原因分析信息。


 
有关 Kepner-Tregoe's 的更多信息 IT 和服务运营咨询服务


相关文章

重大事件要点。沟通和有效行动。帮助!我们现在该怎么做?
重大事件管理:即刻规划你的重大事件响应
事件和问题--同一个硬币的对立面
修复事件或解决问题 - 选择你的毒药

我们专注于:

联系我们

如需咨询、了解详情,或提出建议