問題分析の省略形

アポロXIIIのトラブル

Reprinted from 新しい合理的なマネージャー, by Charles H. Kepner and Benjamin B. Tregoe

Princeton Research Press, Princeton, NJ, 1991,  1997.

問題分析の最良の使い方は、最もうまくいく使い方です。アイデアを簡単に、非公式に使用することで問題の原因が明らかになるのであれば、プロセス全体のすべてのステップを忠実に守ることに、特別な美徳はありません。実際、問題分析を長く使えば使うほど、自分が日々直面している種類の問題に適用できるプロセスの断片を選び出すのが上手になります。最近、この作業のタイミングで何か変わったことはありませんか」「トラブルに気づく直前、このプロセスはどの段階にありましたか」といった質問をするようになると、問題分析のテクニックを学術的に理解することから、日常の問題解決における実践的な役割を内在化することへと移行していきます。

プロブレムアナリシスの大半は、ペンや紙を使うことはありません。

This is especially true of the abbreviated application of the process. The seriousness of a problem does not necessarily determine the length or complexity of the analysis required to resolve it. Some extremely serious problems have been solved through abbreviated  uses of the process. They were so data-poor that full use could not be undertaken. Fragments of the process had to be relied on and combined with educated speculation to arrive at a most likely cause.

アポロ13号は月に向かっていた。

Fifty-four hours and fifty-two minutes into the mission—205,000 miles from earth—and  all was well. Then John L. Swigert,  Jr., duty commander at the time, reported: “Houston, we’ve got a problem here…. We’ve had a Main Buss B undervolt.”  This was an insider’s way of saying that electrical voltage on the second of two power generating systems had fallen off and a warning light had appeared. A moment later the power came up again. Swigert reported: “The voltage is looking good. And we had a pretty large bang associated with the caution and warning  there.” Three minutes later, as the dimensions of the problem became clearer, he reported: “Yeah, we got a Main Buss A undervolt too….It’s reading about 25½. Main B is reading zip right now.”

驚異的なスピードで3人の人間を月へと運んでいたアポロ13号は、急速にパワーを失い、まもなく死体となってしまう。何が起こったのか誰にも分からない宇宙の大惨事。

NASAのエンジニアは、問題分析を仕事にしています。

ヒューストンの現場では、NASAのエンジニアが問題分析の質問をすぐに実行に移した。質問に答える形で得られた情報と、監視装置に表示されるデータから、偏差の仕様を構築し始めたのです。

不測の事態に備えた措置がとられます。

同時に、アポロXIIIに搭載されている電力の使用を減らすために、いくつかのコンティンジェンシーアクションを開始した。最初の報告から13分後、スウィガートはこう報告した。「ハッチの外を見ていると、何かを宇宙空間に放出しているように見えます。

最初は電気的な問題(電圧の低下)だったが、2つあるタンクのうち2つ目のタンクで突然酸素が失われ、1つ目のタンクではさらに徐々に酸素が失われていった。酸素は発電にも使われるし、生命維持装置にも直接使われるものだから、これほど深刻な事態はない。

エンジニアは、原因を見つけて行動を起こす。

当時、タンクが破裂した原因は誰にも思いつかなかったが、「Rupture of the Number Two Cryogenic Oxygen Tank」を見れば、突然の電圧低下とそれに伴う圧力の低下が説明できる。

Further actions were taken to conserve both oxygen and electricity. A number of “IS…COULD  BE but IS NOT” questions were asked to get further data, and a series of system checks was undertaken to verify cause. In the end it was determined that the Number Two Tank had burst and vented all its oxygen, plus a large portion of the gas from the Number One Tank, through a damaged valve and out into space.

3人は無事に地球に戻ってきたが、それはほんのわずかな差だった。原因不明の状態が長引けば、彼らは生き延びるための十分な酸素を得ることができなかっただろう。

では、根本的な原因は何だったのか。

It was weeks before the root cause of this problem  was established through on-the-ground testing and experimentation. Two weeks before the launch, a ground crew had piped liquid oxygen into the tanks in a countdown  demonstration. After the test they had had difficulty getting the oxygen out of the Number Two Tank. They had activated a heater inside the tank to vaporize some of the liquid oxygen,  thus providing  pressure to force it out. They had kept the heater on for eight hours, longer than it had ever been used before. Although a protective switch was provided to turn off the heater before it became too hot, the switch was fused in the ON position because the ground crew had connected it to a 65-volt power supply instead of the 28-volt supply used in Apollo XIII. Later, in flight, the crew turned the heater on briefly to get an accurate quantity reading. The fused switch created an arc that overheated  the oxygen in the tank, raised the internal pressure tremendously, and blew the dome and much of the connecting piping off into space.

NASAヒューストンでは、観測されるであろうすべての違いや変化をリストアップする時間はなかった。その代わりに、"どのような外傷的な変化が、突然の完全な発電停止を引き起こすのか?燃料電池への酸素の供給を止めれば、その効果が得られる。スワイガートが「2番タンクの数値がゼロになった」と報告したことで、どの燃料電池が機能していないかがわかった。

原因究明のために知られていたことを利用する。

2号タンクが破裂したという原因を検証したところ、仕様書に記載されているような突発性と全体性を説明できることがわかった。また、最初の電圧低下表示の際に報告された「バン」という音、乗組員が感じたアポロXIIIの揺れ、そして「何かが...宇宙に向かって」放出されたことも説明がつく。それは、彼らが蓄積したISデータと、彼らの監視活動から得られたIS NOT情報の両方を説明するものだった。そして、何よりも重要なのは、システムが突然、完全に故障したということだ。

NASAヒューストンのエンジニアたちにとって、この原因は受け入れがたいものだった。

They had unbounded faith in Apollo equipment, knowing that it was the best that could be devised. The idea of an oxygen tank bursting open in the depths of space was not credible. All this was justified from their experience. Without the bungling that had occurred on the ground two weeks before the launch, the tank would have gone to the moon and back just as it was designed and built to do. However, the Houston engineers stuck to the Problem Analysis process despite their incredulity, believing  that the test for cause they had carried out had provided  the correct answer. In fact, they proved  this cause in record time. What saved the day was their knowledge of Apollo XIII’s systems and of what could produce the exact kind of sudden failure that had occurred.

エンタープライズ・クリティカルな問題に対する分析的アプローチ。

In a case such as this, Problem Analysis is rendered difficult by two factors: secondary effects and panic. Sudden failure in a complex  system usually causes other deviations  that may obscure the original deviation. The shock of a sudden failure often precipitates panic, making a careful review and use of the facts even more difficult. A disciplined and systematic investigation is difficult in any case, but discipline becomes essential when a top-speed search for cause is undertaken and there is no possibility of amassing all the data that would be optimal in the investigation.

NASAの事件では、システム化されたアプローチの存在により、偏差値が25万マイル近く離れていても、チームが一丸となって働くことができました。NASAヒューストンのエンジニアたちにとって、この原因は受け入れがたいものだった。

Download Case Study