Eine verkürzte Anwendung der Problemanalyse

Probleme an Bord von Apollo XIII

Reprinted from The New Rational Manager, by Charles H. Kepner and Benjamin B. Tregoe

Princeton Research Press, Princeton, NJ, 1991,  1997.

Die beste Anwendung der Problemanalyse ist die Anwendung, die am besten funktioniert. Es ist keine besondere Tugend, sich sklavisch an jeden Schritt des gesamten Prozesses zu halten, wenn eine kurze, informelle Anwendung der Ideen die Ursache des Problems aufdecken kann. Je länger man die Problemanalyse anwendet, desto geschickter wird man darin, die Teile des Prozesses herauszufiltern, die auf die Probleme zutreffen, mit denen man täglich konfrontiert ist. Wenn man anfängt, Fragen zu stellen wie "Hat sich in letzter Zeit irgendetwas an der Zeitplanung dieses Vorgangs geändert?" oder "In welchem Stadium befand sich dieser Prozess, kurz bevor Sie das Problem bemerkten?", hat man den Übergang von einer akademischen Wertschätzung der Techniken der Problemanalyse zur Verinnerlichung ihrer praktischen Rolle bei der täglichen Problemlösung vollzogen.

Die überwiegende Mehrheit der Problemanalysen wird nie zu Papier gebracht.

This is especially true of the abbreviated application of the process. The seriousness of a problem does not necessarily determine the length or complexity of the analysis required to resolve it. Some extremely serious problems have been solved through abbreviated  uses of the process. They were so data-poor that full use could not be undertaken. Fragments of the process had to be relied on and combined with educated speculation to arrive at a most likely cause.

Apollo XIII war auf dem Weg zum Mond.

Fifty-four hours and fifty-two minutes into the mission—205,000 miles from earth—and  all was well. Then John L. Swigert,  Jr., duty commander at the time, reported: “Houston, we’ve got a problem here…. We’ve had a Main Buss B undervolt.”  This was an insider’s way of saying that electrical voltage on the second of two power generating systems had fallen off and a warning light had appeared. A moment later the power came up again. Swigert reported: “The voltage is looking good. And we had a pretty large bang associated with the caution and warning  there.” Three minutes later, as the dimensions of the problem became clearer, he reported: “Yeah, we got a Main Buss A undervolt too….It’s reading about 25½. Main B is reading zip right now.”

Apollo XIII, die drei Menschen mit unglaublicher Geschwindigkeit zum Mond beförderte, verlor rapide an Energie und könnte schon bald zu einem toten Körper werden. Im Weltraum hatte sich eine Katastrophe ereignet, und niemand war sich sicher, was geschehen war.

NASA-Ingenieure setzen die Problemanalyse in die Praxis um.

Vor Ort in Houston setzten die NASA-Ingenieure die Problemanalyse sofort in die Tat um. Sie begannen, die Abweichung anhand der Informationen, die sie als Antwort auf ihre Fragen erhielten, und anhand der Daten, die ihre Überwachungsgeräte anzeigten, zu beschreiben.

Es werden Notfallmaßnahmen ergriffen.

Gleichzeitig leiteten sie eine Reihe von Notfallmaßnahmen ein, um den Stromverbrauch an Bord von Apollo XIII zu reduzieren. Dreizehn Minuten nach der ersten Meldung meldete Swigert: "Unser O2 Cryo Number Two Tank zeigt Null an... und es sieht für mich so aus, als ob wir etwas... in den Weltraum ablassen... es ist eine Art Gas."

Was als elektrisches Problem - Spannungsverlust - begonnen hatte, wurde zu einem plötzlichen Sauerstoffverlust im zweiten von zwei Tanks und einem allmählichen Sauerstoffverlust im ersten. Da Sauerstoff sowohl bei der Stromerzeugung als auch direkt in lebenserhaltenden Systemen verwendet wurde, konnte die Situation kaum ernster sein.

Ingenieure finden Ursachen und ergreifen Maßnahmen.

Obwohl sich damals niemand vorstellen konnte, was die Ursache für das Bersten des Tanks gewesen sein könnte, würde "Rupture of the Number Two Cryogenic Oxygen Tank" den plötzlichen Spannungsverlust und den anschließenden Druckabfall erklären.

Further actions were taken to conserve both oxygen and electricity. A number of “IS…COULD  BE but IS NOT” questions were asked to get further data, and a series of system checks was undertaken to verify cause. In the end it was determined that the Number Two Tank had burst and vented all its oxygen, plus a large portion of the gas from the Number One Tank, through a damaged valve and out into space.

Die drei Männer kehrten erfolgreich zur Erde zurück, aber nur mit knapper Not. Wäre die Ursache noch viel länger unbekannt geblieben, hätten sie nicht mehr genug Sauerstoff zum Überleben gehabt.

Was war also die Ursache dafür?

It was weeks before the root cause of this problem  was established through on-the-ground testing and experimentation. Two weeks before the launch, a ground crew had piped liquid oxygen into the tanks in a countdown  demonstration. After the test they had had difficulty getting the oxygen out of the Number Two Tank. They had activated a heater inside the tank to vaporize some of the liquid oxygen,  thus providing  pressure to force it out. They had kept the heater on for eight hours, longer than it had ever been used before. Although a protective switch was provided to turn off the heater before it became too hot, the switch was fused in the ON position because the ground crew had connected it to a 65-volt power supply instead of the 28-volt supply used in Apollo XIII. Later, in flight, the crew turned the heater on briefly to get an accurate quantity reading. The fused switch created an arc that overheated  the oxygen in the tank, raised the internal pressure tremendously, and blew the dome and much of the connecting piping off into space.

Die NASA Houston hatte keine Zeit, eine vollständige Liste aller Unterschiede und Veränderungen zu erstellen, die sie beobachten konnten. Stattdessen fragten sie: "Welche traumatische Veränderung könnte den plötzlichen Totalausfall der Stromerzeugung verursachen?" Die Unterbrechung der Sauerstoffzufuhr zu den Brennstoffzellen würde diesen Effekt haben. Sie wussten, welche Brennstoffzellen ausgefallen waren, als Swigert meldete, dass der Tank Nummer zwei Null anzeigte.

Mit dem, was bekannt war, um die Ursache zu testen.

Sie überprüften die Ursache - dass der Tank Nummer zwei gerissen war - und stellten fest, dass dies die in der Spezifikation beschriebene Plötzlichkeit und Totalität erklären würde. Es würde auch den Knall erklären, der zum Zeitpunkt der ersten Unterspannungsanzeige gemeldet wurde, ein Zittern von Apollo XIII, das von Mitgliedern der Flugbesatzung gespürt wurde, und das Entweichen von "etwas... in den Weltraum". Dies erklärte sowohl die IS-Daten, die sie gesammelt hatten, als auch die IS-NICHT-Informationen, die aus ihren Überwachungsaktivitäten hervorgegangen waren. Noch wichtiger ist, dass sie einen plötzlichen, totalen Ausfall des Systems erklärte.

Für die Ingenieure der NASA Houston war dieser Grund nur schwer zu akzeptieren.

They had unbounded faith in Apollo equipment, knowing that it was the best that could be devised. The idea of an oxygen tank bursting open in the depths of space was not credible. All this was justified from their experience. Without the bungling that had occurred on the ground two weeks before the launch, the tank would have gone to the moon and back just as it was designed and built to do. However, the Houston engineers stuck to the Problem Analysis process despite their incredulity, believing  that the test for cause they had carried out had provided  the correct answer. In fact, they proved  this cause in record time. What saved the day was their knowledge of Apollo XIII’s systems and of what could produce the exact kind of sudden failure that had occurred.

Ein analytischer Ansatz für unternehmenskritische Probleme.

In a case such as this, Problem Analysis is rendered difficult by two factors: secondary effects and panic. Sudden failure in a complex  system usually causes other deviations  that may obscure the original deviation. The shock of a sudden failure often precipitates panic, making a careful review and use of the facts even more difficult. A disciplined and systematic investigation is difficult in any case, but discipline becomes essential when a top-speed search for cause is undertaken and there is no possibility of amassing all the data that would be optimal in the investigation.

Bei dem NASA-Zwischenfall ermöglichte das Vorhandensein eines systematischen Ansatzes es einem Team von Menschen, als eine Einheit zusammenzuarbeiten, obwohl sie durch fast eine Viertelmillion Meilen von der Abweichung getrennt waren. Für die Ingenieure der NASA Houston war diese Ursache nur schwer zu akzeptieren.

Download Case Study