ITIL環境における問題管理の質の測定

プロブレムマネジメントのあり方に迫る

アナリストやエンジニアがどのように問題に取り組み、根本的な原因を見つけ、適切な行動でフォローアップするかを理解することは、簡単なことのように聞こえます。ITIL Problem Managementを文書化するためのアプリケーションにアクセスすれば、ケースの内容を読むことができます。ケース管理ツールへのアクセスと、そのツールを使用するためのスキルがあればよいようです。

しかし、問題管理者に問題の処理方法を尋ねると、問題を発見して対処する際にどのようなステップを踏むかを記述した真の手順が明らかになるのが一般的です。これらの文書化されたプロセスと手順は非常に有用で、注意が必要な問題を進行させるために取るべき手順について、期待値が非常に明確に設定されます。

問題チケットを読んだり、プロブレムマネジャーに手順のステップをどのように記入しているかを尋ねたりすることは、情報が実際に収集され、データが分析され、結論が導き出される場所であるため、プロブレムマネジメントでどのように価値が生み出されているかを知るための論理的な次のステップのように思われます。では、プロブレムマネジメントのパフォーマンスはどのように測定されるのだろうか。多くの組織では、問題にまつわるタイミング関連のパラメータを測定したり、特定の状態にある問題チケットの数を数えたりしているようです。例としては以下のようなものがあります。

  • アプリケーションのグループごとの未解決の問題チケット(バックログ)の数、時系列で検討
  • 未解決の問題チケットの平均年齢、時間経過とともに考慮されることが多い
  • 問題チケットの根本原因を見つけるための平均時間
  • 繰り返し発生する問題の数

問題管理の目標:問題の原因を発見し、将来の事件や問題を回避するために積極的に行動することを考えると、上記の例は、チームがこれらの目標に対してどれだけ成功しているかを示しているのだろうか?私たちはあることを求めていますが、測定は全く異なるものですか?

実際の体験談

世界的企業のグローバルIT部門で問題管理がどのように処理されているかを評価し始めて約2日後、評価の参加者間で結果を比較するために休憩を取ることにしました。調査の対象となったフィールドは、チケットサマリと問題の説明、および個人の進捗状況の更新と解決策の説明です。

ほとんどの問題チケットでは、要約では影響を受けるアプリケーションまたはハードウェアとその問題点が明確に示され、続いて問題の詳細説明ではいくつかの基礎データが示されているというパターンが見られました。さらに更新すると、通常、時間の経過とともに問題が問題管理の手順ステップをどのように通過し、解決策の説明で結論に達したかが示されます。

これは個別のケースのように見えますが、評価を行ったチームの中で見られたパターンを表しています。他の経験を話しているうちに、見られた観察事項を表す次のような絵ができました。

問題発生時のチケットの例

これは、どのようにして結論が導き出され、行動が取られ、計画されたのかという一連の疑問を提起するものである。

  • 原因究明を効率的に行うためには、どのようなデータを集めればよいのでしょうか。
  • 適切な時期に適切なデータを収集したことを確認するにはどうすればよいのでしょうか。
  • そのマジックはどのようなものか?どんな文書化されていない手順を踏んだか?どのような文書化されていない思考が行われたのか?
  • 他にどのような原因が考えられますか?
  • 解決チームは、発見された原因が本当に「真の原因」であることをどの程度確信していたか?
  • 問題を解決するために行った行動が、どのような副作用を引き起こす可能性がありますか?

これらの質問への回答は,任意のチケットについて問題管理でどのように価値が創造されたかについて,良い洞察を与えるかもしれない.これらの質問に対する答えは,通常,タイミングや問題管理手順に関する数値的なパラメータとは関係ありません.それは,データ収集の質と関係者の思考プロセスの質に関するものです.

繰り返される問題をコントロールする - 安定性を手に入れる

魔法」がうまくいくと、前述の「問題管理」のパフォーマンス指標として示された、再発する問題の数が少なくなる、と言う人もいるかもしれません。これは事実です。

残念ながら。

問題の再発によって企業が得るものは、問題が初めて発生したときに、問題管理プロセスが根本原因を見つけるのに十分な仕事をしていなかったというメッセージである。再発には数週間から数ヶ月かかることがあるため、これは問題管理パフォーマンスの遅れた不正確な指標となります。本当に必要とされているのは、企業が再発する問題の数が減少することを予見できるような、問題管理のパフォーマンス(したがって価値)を測定する方法である。言い換えれば,問題管理の主要なパフォーマンス指標とは何かということである.

問題がどの程度解決されたかを示す指標を見つけることは、再発しても困らないが壊滅的でもないような単純な(影響度の低い)問題に対しては、穏やかな効果しかないかもしれません。時折、1つ以上のIT関連イベントに関連して、壊滅的なビジネスイベントの端にバランスを取るような重大な事件や問題が発生し、二度とそのような経験をしないように決意する企業もあります。繰り返される問題や傾向を測定しても、十分な指標にはならないでしょう。

魔法をかけるためのベスト・プラクティス?

エンジニアやアナリストに、問題のチケットを処理する際の内部的な思考プロセスを尋ねると、さまざまな答えが返ってきます。これは、同じ人に特定のアプリケーションやハードウェアの設定方法を尋ねた場合とは全く異なります。最近では、アプリケーションやハードウェアを設定するための共通のアプローチには多くの利点があることが明らかになっています。

  • 使用する資産に応じた「最適な構成」でバラツキを抑える
  • アセットがインフラ全体にどのような付加価値をもたらすのかを共通認識とすることで、キャパシティマネジメントに役立つ
  • アセットの設定や変更に関するコミュニケーションが容易になります。
  • シームレスで高品質な引き継ぎとメンテナンスを可能にします。

このような状況下では、問題解決のための共通のアプローチが存在しないことが多いのです。結果として、これは魔法のようなものです。

問題の根本原因を見つけるためのベスト・プラクティスが確立されると、資産の設定に関するベスト・プラクティスと非常によく似た利点が得られます。さらに、「魔法」がどのようなものであるかを文書化し、どのようにして結論に到達するかを可能にする用語を用いて、トラブルシューティングのための新しい言語を可能にします。

マジック

魔法」とはどのようなものか?

問題の根本的な原因を見つけるには、さまざまな方法があります。あるものは他のものより成功し、(標準的なフレームワークを持たない)異なる人は当然異なるアプローチをとる。トラブルシューターのグループの有効性は、ベルカーブに沿ってどこかに落ちます。トラブルシューティングのエキスパートは、良い評判を得ており、自信を持ってどんな仕事でも任せることができます。堅実な実行者は、ほとんどのタスクに適しており、改善の余地があり、トラブルシューティングの評判が悪い人は、おそらく助けが必要です。

問題分析のためのKepner-Tregoe(KT)法は、1950年代に研究され、定義され、それ以来、改良とテストが続けられてきました。これは、ITILという頭字語が発明される何年も前のことであることは容易に想像がつきます。

KT法が研究された当時は、ITもITILも存在していなかったため、歴史のある手法がIT業界に適しているとは言えないという意見がありました。そこで、KT法による問題分析を詳しく見ていくことで、より適切な判断ができるようになります。問題分析の主なステップは以下の通りである。

  • 問題点の説明
  • 想定される原因のリストアップ
  • 考えられる原因の評価
  • 真の原因を証明する
  • 修正の先にあるものを考える

これらの各ステップには、明確な意図といくつかのサブステップがあり、問題分析の思考プロセスに適切なデータを供給するために、質問の言い回しや回答の文書化を通して作業を行います。これはすべて、特定の製品や問題を念頭に置くことなく行われ、あらゆるIT組織で活用されているITILと非常によく似ています。問題分析は、業界や技術に関係なく、さまざまな問題の根本原因を見つけるためのアプローチです。

何か問題がありましたか?

そうですね。しかし、「問題」という言葉に対するKTの非常に特殊な定義があり、それは異なるものですが、ITILにはうまくマッチしています。KTによると、問題分析のプロセスを開始する前に、3つの基準が当てはまる必要があります。

  1. 実際のパフォーマンスと望ましいパフォーマンスの間にはギャップがあるはずです。これを偏差と呼びます(例:機械が動いていないのに、動いているはずの機械が動いている)。
  2. 逸脱の原因が不明(例:Known Errorではない)。
  3. 偏差値を知る必要性があること(例:行動を起こすことができる)。

根本的な原因を見つけるために明確に定義された一連のステップを踏むことで、トラブルシューターは、プロセスの中で何が既に行われ、何が行われるべきかをコミュニケーションし、文書化することができます。下図は、収集したデータをテキストモデル化して問題の症状を表現した例です。

問題分析_Doc_10

既知のマジック

問題分析に対する一貫した再現可能なアプローチのためのステップがよく理解されていれば、発見された根本原因の品質を測定することは非常に簡単になります。根本原因を見つける魔法が理解されていれば、それを文書化し、再現し、スムーズに引き渡し、効率的に時間を計ることができ、これらはすべてベストプラクティスの特徴である。

ITサポート組織が問題分析への統一されたアプローチの使用を開始すると、個人やチームの直接的な品質や価値を測定することができる。これは、KTのコンサルタントが、ITサポート環境で行われている既存のトラブルシューティングプロセスの品質を評価する際に行っていることと同じです。既存のインシデントチケットや問題チケットに目を通し、既知の標準に照らし合わせてアプローチをどの程度構造化するかを見積もることで、トラブルシューティングの品質のベースラインとなる先行指標を生成することができます。

一例を挙げるとシノプシス(またはケース管理ツールの同等のフィールド)をObject with a Deviation(「何がどう悪いのか」という質問に答える)という言葉で一貫して文書化しているITスタッフは、根本的な原因が見つかるまでの時間が平均して10%強短くなるようです。

専門家が根本原因を探ろうとしている対象物や欠陥を文書化するだけで、クローズまでの時間を10%強短縮できる。確かに、簡単そうに聞こえるかもしれませんが、そうではありません。この思考プロセスを刷り込み、反射的に実行するには、行動を変える必要があります。時間的な制約やビジネス上のプレッシャーがある中で、このシンプルなステップを実践し、プレッシャーの高い問題から離れてサポートしなければ、このステップは脇に追いやられてしまいます。トラブルシューティングのベストプラクティスを実施するための手順はよく理解されていますが、変化を起こすには、注意、集中、優れた計画と思考が必要です。幸いなことに、考えることは簡単ですが、実施チームは気が散ってしまうかもしれません。問題分析のようなKT思考プロセスは、根本原因の発見を保証する特効薬ではありません。KT思考プロセスは、問題分析のように、根本原因の発見を保証する特効薬ではなく、すでに知識のある専門家をゴールに導くための手法であり、根本原因を発見するためのマイルストーンは、プロセスに投入されるデータの質(および観察可能性)によって異なる。

後者は成功のための重要な要素です。問題分析は、積極的に使用する必要のあるハードロジックの強固な基礎の上に構築されているため、フォーム、テンプレート、またはスプレッドシートに記入するだけでは、良い根本原因を得ることはできません。問題分析には、集中的なデータ収集、思考、チェックが必要であり、これは構造化されていないトラブルシューティング環境でのトラブルシューティングと変わりません。大きな変化は、思考のステップが目に見えるようになり、名前がついたことです。これらはすべて、問題分析のための明確な基本計画に基づいています。その結果、根本的な原因を見つけるためのプロセスにおいて、現在の状況とその結果について測定し、コミュニケーションをとることができます。

この場合、測定は、どれだけの時間やどれだけのチケットが与えられた一連の基準を満たしているかを示すデータベースクエリではありません。それは,問題分析の特徴的なステップで収集されたデータの品質を判断する内部(トラブルシューティング)の専門家が与えることのできる評価になる.このような評価は,問題分析の品質に関する主要なパフォーマンス指標となる.

Where Do We Go From Here?

バイオリンを弾くための本を読んだからといって、その人が素晴らしいバイオリン奏者になるわけではありません。同様に、トラブルシューティングにおけるより良い思考方法について組織をトレーニングしただけでは、その組織を世界レベルのトラブルシューター集団に変えることはできないでしょう。個人が取る思考アプローチにアプローチを組み込むためには、注意、運動、および献身が必要であり、その結果、成果が得られます。問題管理における根本原因の見つけ方への投資は、技術的なスキルと経験への投資をサポートし、複雑な問題に対して質の高い解決策を見つけるために必要なことを認識し、十分に備えた従業員へとつながります。プロブレムマネジメントのケースでは、マネージャーは根本原因が見つかるまでにどれだけの時間がかかるかを知ることはできませんが、明確で計画された方向性があり、到着時間がより予測可能になるため、プロブレムマネジメントの品質を測定することができます。

 

Kepner-Tregoeについて

Kepner-Tregoe社は、問題解決のリーダーです。60年以上にわたり、Kepner-Tregoe社は、より効果的な根本原因の分析と意思決定のスキルを通じて、世界中の何千もの組織が何百万もの問題を解決するお手伝いをしてきました。Kepner-Tregoe社は、以下のような方法で、コストを大幅に削減し、業務パフォーマンスを向上させるために企業と提携しています。
問題解決のためのトレーニング、技術、コンサルティングサービスを提供します。

関連

重大インシデント管理におけるサービス・エクセレンスの実現

金融機関が抱える技術的負債の解消に向けて

私たちは以下の専門家です:

お問い合わせ

お問い合わせ、詳細、ご提案はこちらから