Gestion des incidents majeurs : N'attendez pas pour planifier votre réponse aux incidents majeurs

La pandémie actuelle nous rappelle l'importance d'être prêt lorsque quelque chose d'important se produit. Lorsque la menace du Covid-19 est devenue évidente, les perturbations des chaînes d'approvisionnement, le manque de stocks et d'équipements EPI et les politiques de santé contradictoires ont entravé la capacité à réagir avec une clarté et une rapidité optimales.

Les coûts des interruptions de service peuvent être énormes

Les incidents majeurs ou de haute gravité sont ceux qui ont un impact important et significatif. Dans les organisations qui dépendent fortement des systèmes informatiques, ces incidents ne se produisent pas très souvent, mais lorsqu'ils se produisent, une réponse rapide et planifiée est essentielle. Le coût d'une interruption de service informatique peut être énorme. Les coûts estimés vont de $427 par minute pour les petites entreprises à $9,000/minute pour les moyennes et grandes entreprises. Pour le géant du commerce électronique Amazon, il y a quelques années, le coût des temps d'arrêt a été estimé à plus de 1 000 euros par minute. $220,000/minute.

Les processus quotidiens de gestion des incidents sont généralement efficaces pour traiter le grand volume d'incidents informatiques et de demandes de service ayant un impact relativement faible. La tendance est à l'évolution des processus de gestion des incidents vers le libre-service, l'automatisation et l'engagement asynchrone avec le personnel d'assistance (c'est-à-dire les interactions par e-mail avec les centres d'appels internationaux). Le personnel du service d'assistance, dont la formation et les compétences techniques sont limitées, peut traiter les fonctions quotidiennes de gestion des incidents grâce à des diagnostics de base, des arbres de décision/de connaissance binaires et des réponses écrites. Les problèmes plus difficiles sont acheminés vers des équipes d'escalade de deuxième et troisième niveaux dotées d'une expertise technique, mais l'objectif est toujours d'appliquer les ressources les moins techniques et les moins coûteuses disponibles pour résoudre l'incident.

Les incidents majeurs sont différents de leurs homologues plus petits et quotidiens et nécessitent une approche distincte. Un incident normal ne touche généralement que quelques utilisateurs. Pour les incidents majeurs, le coût de l'impact dépasse largement le coût de la résolution. Les facteurs clés de succès sont le temps de réponse et la qualité de la réponse. Le temps étant un facteur essentiel, l'objectif est d'utiliser les ressources humaines qui peuvent résoudre l'incident le plus rapidement possible afin de minimiser l'impact sur l'entreprise. Ces ressources sont généralement des experts en la matière hautement qualifiés (et grassement payés), dotés d'une grande expérience et de compétences techniques approfondies en matière de dépannage. Les objectifs sont de réagir rapidement, de résoudre les impacts immédiats, de préserver la réputation de l'organisation et d'atténuer le risque opérationnel et le risque client.

La gestion des perceptions est essentielle

Lors d'un incident actif, le personnel de soutien et les dirigeants doivent s'appuyer sur les ressources de gestion des incidents majeurs pour les aider à prendre en main le processus de bout en bout et à guider leurs activités :

  • Comprendre l'incident et les symptômes
  • Atténuer l'impact et gérer les risques
  • S'assurer que les décisions sont visibles et fondées sur des données.
  • Évaluer les causes possibles (si nécessaire)
  • Gérer les perceptions et les attentes
  • Retour à la normale

Une mauvaise gestion des incidents majeurs peut être désastreuse. Le contrôle du flux des communications et la gestion des perceptions sont essentiels à la gestion des incidents majeurs. Si les messages officiels de l'équipe de gestion des incidents majeurs ne sont pas clairs et opportuns, il y a un risque que la désinformation prenne le dessus sur les messages officiels, ce qui entraînera une plus grande confusion et une expérience négative pour le client.

Outre l'impact global sur la technique et les performances, les activités liées aux incidents majeurs s'étendent souvent au-delà des limites des fonctions commerciales, ce qui entraîne des problèmes d'autorité décisionnelle. Il s'agit d'un environnement à enjeux élevés où la direction doit évaluer les résultats attendus de certaines actions par rapport à leurs risques. Cela nécessite non seulement des données claires et accessibles sur ce que l'on sait, mais aussi sur ce que l'on ignore. Un processus de gestion des incidents majeurs doit inclure des directives de prise de décision interfonctionnelles afin d'éviter les retards et la confusion lors d'un incident majeur actif.

Ne vous arrêtez pas une fois l'incident géré

Les défis de la gestion des incidents majeurs ne s'arrêtent pas lorsque le service est rétabli. Comme pour les processus normaux de gestion des incidents, l'objectif principal d'un incident majeur "réel" est d'atténuer l'impact et de prendre des mesures correctives pour que l'entreprise retrouve un fonctionnement normal. La gestion des problèmes entre alors en jeu et la cause profonde doit être parfaitement comprise. Identifier la cause profonde et mettre en œuvre des actions pour éviter que le problème ne se reproduise peut être un défi. Dans la confusion de la gestion de l'incident majeur actif, les informations de diagnostic critiques sont souvent perdues ou détruites, ce qui empêche l'identification de la cause première. Pour atteindre une véritable stabilité informatique, un processus intégré de gestion des incidents majeurs et des problèmes est nécessaire pour sécuriser et documenter les "informations sur les causes" critiques et garantir la poursuite de l'amélioration du service.

Les coûts et les menaces liés aux interruptions de service peuvent être énormes. Un investissement dans la réponse aux incidents majeurs est essentiel pour maintenir la stabilité de l'informatique et le succès de l'entreprise.

À propos de Kepner-Tregoe

Les logiciels et les modèles ne résolvent pas les problèmes. Ce sont les gens qui les résolvent !

Quel genre de personnes ? Des personnes curieuses, qui posent de bonnes questions, prennent des décisions basées sur des faits et sont habilitées à diriger. Elles restent concentrées sous la pression et agissent avec confiance pour faire ce qui doit être fait. Vous trouverez ces leaders capables de résoudre des problèmes tant chez nos clients qu'ici, chez Kepner-Tregoe. Depuis plus de 60 ans, Kepner-Tregoe a permis à des milliers d'entreprises de résoudre des millions de problèmes. Si nous pouvons faire économiser des millions à un fabricant, rétablir le service informatique d'une bourse et aider Apollo 13 à revenir de l'espace, nous pouvons aider votre entreprise à réussir.

Image du blog 1
Gestion des incidents majeurs - Être prêt lorsqu'un changement tourne mal
Image du blog 1
La planification est essentielle en cas de panne de système à New York : 10 éléments essentiels de votre manuel de gestion des incidents
Image du blog 1
Utilisation du processus d'AC pour la gestion des incidents
Image du blog 1
Comment devenir une superstar de la gestion des incidents et des problèmes ?

Nous contacter

Pour des demandes de renseignements, des détails ou une proposition !