Les entreprises et les organismes publics du monde entier ont découvert que les services en nuage peuvent rendre leurs organisations plus rapides, plus évolutives et plus souples lorsqu'il s'agit de répondre aux changements commerciaux. Avec des environnements d'infrastructure dynamiques, tels que l'infrastructure en tant que service (IaaS) et la plate-forme en tant que service (PaaS), et une grande variété de logiciels SaaS et d'offres de tiers, distribués et exploités dans le nuage, il semble n'y avoir aucune limite à ce que les entreprises peuvent faire et à la vitesse à laquelle elles peuvent le faire. Si la rapidité et l'agilité technique sont très bénéfiques pour les fonctions commerciales qui doivent fonctionner rapidement, elles peuvent poser de sérieux problèmes aux gestionnaires de problèmes chargés de découvrir "ce qui s'est passé" et "pourquoi cela s'est passé" lorsqu'un problème perturbe les opérations commerciales.
Les outils et les techniques du passé sont inadaptés à la vitesse de l'informatique dématérialisée.
Les gestionnaires de problèmes s'appuient depuis longtemps sur deux ensembles fondamentaux de données opérationnelles pour les aider à diagnostiquer la cause profonde des problèmes : les données de dépendance et les données de changement. Avec les services en nuage, les gestionnaires de problèmes ont toujours besoin de données de dépendance et de changement, mais ils ont désormais besoin que ces données opérationnelles soient actuelles, complètes et précises, en permanence. Ils ont également besoin que les données opérationnelles évoluent et restent synchronisées avec chaque modification apportée à votre environnement informatique. Par conséquent, si un service en nuage crée une nouvelle instance ou reconfigure les dépendances des composants, vous devez le savoir au moment où cela se produit.
Dans un monde passé d'infrastructure sur site et de progiciels installés, les changements étaient relativement peu fréquents (quotidiens, hebdomadaires, mensuels), de sorte que les données de dépendance et de changement ne changeaient pas très souvent. Avec les services en nuage, les changements sont effectués en permanence et les dépendances peuvent n'exister que quelques secondes avant d'être reconfigurées dans le cadre de l'optimisation normale du nuage. Si un incident survient et provoque une panne, l'"instantané" de l'environnement au moment de l'incident peut n'exister que pendant une fraction de seconde. Les approches traditionnelles de maintien des enregistrements des changements et des dépendances ne peuvent pas évoluer de manière réaliste pour capturer un environnement changeant aussi rapidement.
Les outils d'administration en nuage en tant qu'outils de gestion des problèmes
Les seuls systèmes capables de saisir les changements dans les services en nuage au fur et à mesure qu'ils se produisent sont les outils d'administration intégrés aux services en nuage eux-mêmes et à l'origine des changements. Les bases de données traditionnelles de gestion des configurations (CMDB) et les référentiels d'enregistrement des changements dans les systèmes de gestion des services informatiques (ITSM) peuvent contribuer à l'intégration et aux problèmes généraux, mais les outils d'administration du cloud computing possèdent les détails nécessaires à la gestion moderne des problèmes. Les gestionnaires de problèmes doivent comprendre que les services en nuage fonctionnent à un rythme totalement différent de celui des environnements informatiques traditionnels et que le diagnostic de la cause profonde des problèmes dans ces environnements nécessite d'interagir avec un nouvel ensemble d'outils et de données.
Une analogie utile est la différence entre une photographie fixe et une séquence d'images animées. Les gestionnaires de problèmes ont l'habitude de fixer l'image fixe, à la recherche de détails cachés, mais ils ne sont pas habitués aux complexités des images en mouvement. La CMDB et les enregistrements de changement fournissent au gestionnaire de problèmes des pointeurs vers la zone générale de la séquence, mais un ensemble différent d'outils est nécessaire pour isoler les images et les objets individuels afin de développer une véritable compréhension de ce qui se passe. Les outils d'administration du cloud font essentiellement la même chose. Une fois que le gestionnaire de problèmes est capable d'identifier le moment où l'incident s'est produit, il peut se concentrer sur ce qui s'est passé pendant ce temps et sur les actions/activités qui ont déclenché certains événements.
Les capacités modernes rendent certaines activités de gestion des problèmes inutiles
Une évolution prometteuse dans le domaine des services en nuage est la maturation des capacités d'autoréparation. Lorsque les outils d'administration du cloud identifient un problème, ils sont de plus en plus capables de collecter des données et de reconfigurer les services pour maintenir la continuité et éviter une interruption pour les utilisateurs. Cette résilience accrue des services a amené de nombreux praticiens ITSM à se demander s'il est toujours nécessaire de comprendre la cause profonde d'un problème qui s'est résolu de lui-même.
Avec l'ajout de capacités d'apprentissage automatique et d'intelligence artificielle à l'ensemble des capacités ITSM de l'entreprise, bon nombre des processus analytiques traditionnels, tels que la gestion des problèmes, sont susceptibles de changer de manière significative au cours des prochaines années. Il est peu probable que ces technologies éliminent la gestion des problèmes en tant que processus humain, mais plutôt que l'apprentissage automatique (ML) et l'intelligence artificielle (AI) fournissent un ensemble d'outils et de nouvelles informations améliorés et plus robustes pour permettre aux gestionnaires de problèmes d'être plus efficaces et efficients, en supposant qu'ils aient la capacité d'interpréter les données et de convertir les données brutes en informations utilisables pour alimenter leurs RCA et leurs enquêtes. Les services de cloud computing peuvent rendre la gestion des problèmes plus difficile, mais d'autres technologies compenseront cet impact et la rendront un peu plus facile.
À propos de Kepner-Tregoe
Depuis plus de 60 ans, Kepner-Tregoe est le leader du secteur en matière de processus de résolution de problèmes et d'excellence du service. Les experts de KT ont aidé les entreprises à améliorer leur niveau de performance en matière de gestion des incidents et des problèmes grâce à des outils, des formations et des conseils, ce qui a permis de mettre en place des équipes de gestion des services très efficaces, prêtes à répondre aux problèmes les plus critiques de votre entreprise.