Een verkort gebruik van probleemanalyse

Problemen aan boord van Apollo XIII

Reprinted from De nieuwe rationele manager, by Charles H. Kepner and Benjamin B. Tregoe

Princeton Research Press, Princeton, NJ, 1991,  1997.

Het beste gebruik van Probleemanalyse is het gebruik dat het beste werkt. Er is geen bijzondere verdienste verbonden aan het slaafs volgen van elke stap in het hele proces als een kort, informeel gebruik van de ideeën de oorzaak van het probleem aan het licht kan brengen. In feite is het zo dat hoe langer mensen Probleemanalyse gebruiken, hoe bedrevener zij worden in het selecteren van fragmenten van het proces die van toepassing zijn op het soort problemen waarmee zij dagelijks te maken hebben. Wanneer mensen vragen beginnen te stellen als "Is er de laatste tijd iets veranderd in de timing van deze operatie?" of "In welke fase bevond dit proces zich vlak voordat u het probleem opmerkte?" hebben ze de overgang gemaakt tussen een academische waardering van Probleemanalyse-technieken en de internalisering van hun praktische rol bij het dagelijks oplossen van problemen.

De overgrote meerderheid van Probleemanalyses ziet nooit pen en papier.

This is especially true of the abbreviated application of the process. The seriousness of a problem does not necessarily determine the length or complexity of the analysis required to resolve it. Some extremely serious problems have been solved through abbreviated  uses of the process. They were so data-poor that full use could not be undertaken. Fragments of the process had to be relied on and combined with educated speculation to arrive at a most likely cause.

Apollo XIII was op weg naar de maan.

Fifty-four hours and fifty-two minutes into the mission—205,000 miles from earth—and  all was well. Then John L. Swigert,  Jr., duty commander at the time, reported: “Houston, we’ve got a problem here…. We’ve had a Main Buss B undervolt.”  This was an insider’s way of saying that electrical voltage on the second of two power generating systems had fallen off and a warning light had appeared. A moment later the power came up again. Swigert reported: “The voltage is looking good. And we had a pretty large bang associated with the caution and warning  there.” Three minutes later, as the dimensions of the problem became clearer, he reported: “Yeah, we got a Main Buss A undervolt too….It’s reading about 25½. Main B is reading zip right now.”

De Apollo XIII, die met ongelooflijke snelheid drie mensen naar de maan bracht, verloor snel aan kracht en zou spoedig een lijk kunnen worden. Er had zich een ramp voorgedaan in de ruimte en niemand wist zeker wat er gebeurd was.

NASA ingenieurs zetten Probleem Analyse aan het werk.

Op de grond in Houston gingen de NASA-ingenieurs onmiddellijk aan de slag met het stellen van vragen over de probleemanalyse. Zij begonnen een specificatie van de afwijking op te bouwen aan de hand van de informatie die zij kregen als antwoord op hun vragen en van de gegevens die werden weergegeven op hun controleapparatuur.

Er worden noodmaatregelen genomen.

Tegelijkertijd begonnen ze met een aantal noodmaatregelen om het gebruik van elektrische energie aan boord van de Apollo XIII te verminderen. Dertien minuten na het eerste rapport, rapporteerde Swigert: "Onze O2 Cryo Nummer Twee Tank geeft nul aan...en het lijkt me, als ik uit het luik kijk, dat we iets...de ruimte in blazen...het is een of ander gas."

Wat begon als een elektrisch probleem - verlies van spanning - werd een plotseling verlies van zuurstof in de tweede van twee tanks, met een meer geleidelijk verlies van zuurstof uit de eerste. Aangezien zuurstof werd gebruikt bij de opwekking van elektriciteit en rechtstreeks in levensinstandhoudingssystemen, kon de situatie nauwelijks ernstiger zijn.

Ingenieurs vinden de oorzaak en ondernemen actie.

Hoewel niemand in die tijd kon bedenken wat de oorzaak van het barsten van de tank kon zijn, zou "Rupture of the Number Two Cryogenic Oxygen Tank" het plotselinge verlies van spanning en het daaropvolgende verlies van druk verklaren.

Further actions were taken to conserve both oxygen and electricity. A number of “IS…COULD  BE but IS NOT” questions were asked to get further data, and a series of system checks was undertaken to verify cause. In the end it was determined that the Number Two Tank had burst and vented all its oxygen, plus a large portion of the gas from the Number One Tank, through a damaged valve and out into space.

De drie mannen keerden met succes terug naar de aarde, maar slechts met een kleine marge. Als de oorzaak veel langer onbekend was gebleven, hadden ze niet genoeg zuurstof meer gehad om te overleven.

Dus, wat was de hoofdoorzaak?

It was weeks before the root cause of this problem  was established through on-the-ground testing and experimentation. Two weeks before the launch, a ground crew had piped liquid oxygen into the tanks in a countdown  demonstration. After the test they had had difficulty getting the oxygen out of the Number Two Tank. They had activated a heater inside the tank to vaporize some of the liquid oxygen,  thus providing  pressure to force it out. They had kept the heater on for eight hours, longer than it had ever been used before. Although a protective switch was provided to turn off the heater before it became too hot, the switch was fused in the ON position because the ground crew had connected it to a 65-volt power supply instead of the 28-volt supply used in Apollo XIII. Later, in flight, the crew turned the heater on briefly to get an accurate quantity reading. The fused switch created an arc that overheated  the oxygen in the tank, raised the internal pressure tremendously, and blew the dome and much of the connecting piping off into space.

Er was geen tijd voor NASA Houston om een volledige lijst door te nemen van alle verschillen en veranderingen die ze zouden kunnen waarnemen. In plaats daarvan vroegen ze: "Welke traumatische verandering kan de plotselinge, totale uitval in de elektriciteitsopwekking veroorzaken?" Het afsluiten van de toevoer van zuurstof naar de brandstofcellen zou dat effect hebben. Ze wisten welke brandstofcellen buiten werking waren toen Swigert meldde dat de tank nummer twee nul aangaf.

Gebruik makend van wat bekend was om de oorzaak te testen.

Zij testten de oorzaak - dat de Nummer Twee Tank was gescheurd - en stelden vast dat dit de plotselingheid en de totaliteit zou verklaren zoals beschreven in de specificatie. Het zou ook de knal verklaren die werd gemeld op het moment van de eerste onderspanning indicatie, een beving van de Apollo XIII gevoeld door de bemanningsleden, en de ontluchting van "iets...de ruimte in." Het verklaarde zowel de IS gegevens die zij hadden verzameld als de IS NOT informatie die was gekomen van hun monitoring activiteiten. Belangrijker nog, het verklaarde een plotselinge, totale storing in het systeem.

Voor de ingenieurs van NASA Houston was deze zaak moeilijk te aanvaarden.

They had unbounded faith in Apollo equipment, knowing that it was the best that could be devised. The idea of an oxygen tank bursting open in the depths of space was not credible. All this was justified from their experience. Without the bungling that had occurred on the ground two weeks before the launch, the tank would have gone to the moon and back just as it was designed and built to do. However, the Houston engineers stuck to the Problem Analysis process despite their incredulity, believing  that the test for cause they had carried out had provided  the correct answer. In fact, they proved  this cause in record time. What saved the day was their knowledge of Apollo XIII’s systems and of what could produce the exact kind of sudden failure that had occurred.

Een analytische benadering van bedrijfskritische problemen.

In a case such as this, Problem Analysis is rendered difficult by two factors: secondary effects and panic. Sudden failure in a complex  system usually causes other deviations  that may obscure the original deviation. The shock of a sudden failure often precipitates panic, making a careful review and use of the facts even more difficult. A disciplined and systematic investigation is difficult in any case, but discipline becomes essential when a top-speed search for cause is undertaken and there is no possibility of amassing all the data that would be optimal in the investigation.

In het NASA-incident stelde de aanwezigheid van een systematische aanpak een team van mensen in staat als één eenheid samen te werken, ook al waren zij van de afwijking gescheiden door bijna een kwart miljoen mijl. Voor de ingenieurs van NASA Houston was deze oorzaak moeilijk te aanvaarden.

Download Case Study