Was hat den sogenannten „40-Jahres-Fehler“ von New Horizon verursacht?

Der Artikel des Discover Magazine , wie New Horizons den 40-Jahres-Glitch überlebte und es bis Pluto schaffte, ist etwas verwirrend. Es wickelt die NASA-Geschichte mit mehreren verschiedenen Weltraummissionen zusammen, um den Wert „40 Jahre“ zu erhalten, da New Horizons erst vor etwa elf Jahren gestartet wurde.

Die Ingenieure sind so gut darin geworden, Probleme zu beheben, dass die Öffentlichkeit meistens keine Ahnung hat, womit sie es zu tun haben – bis etwas schief geht, wie letztes Wochenende bei New Horizons, als ein Softwarefehler dazu führte, dass die Sonde heruntergefahren wurde. Sicherheitsmodus. Für einen Moment war dies eine Nachrichtenmeldung. Dann traten die Ingenieure noch einmal auf und lösten das Problem (verursacht durch einen obskuren Zeitfehler in einer Befehlssequenz, die zur Vorbereitung des Vorbeiflugs an die Sonde gesendet wurde). Innerhalb von drei Tagen war alles wieder normal.

In der verlinkten NASA-Nachricht NASA's New Horizons Plans July 7 Return to Normal Science Operations wird das Problem ebenfalls erwähnt:

Die Untersuchung der Anomalie, die dazu führte, dass New Horizons am 4. Juli in den „abgesicherten Modus“ wechselte, hat ergeben, dass am Raumschiff kein Hardware- oder Softwarefehler aufgetreten ist. Die zugrunde liegende Ursache des Vorfalls war ein schwer zu erkennender Zeitfehler in der Befehlssequenz des Raumfahrzeugs, der während einer Operation zur Vorbereitung des nahen Vorbeiflugs auftrat. Für den Rest der Pluto-Begegnung sind keine ähnlichen Operationen geplant.

F: Wird der Fehler irgendwo näher beschrieben? War es ein reines Software-/Computer-Timing-Problem oder beinhaltete das Timing auch Kommunikation oder etwas Mechanisches?

Antworten (1)

Ich habe etwas mehr Details gefunden, indem ich nach "New Horizons Anomaly Review Board Report" gegoogelt habe. Die beste Beschreibung stammt von hier .

Um 16:00 Uhr war das Anomaly Review Board der Mission einberufen worden, um sich über die Geschehnisse zu informieren und das beste weitere Vorgehen zu erörtern. In der Mitte der Bergung des Raumfahrzeugs stellten sie fest, dass weder Hardware noch Software fehlerhaft waren. Aber es hatte einen Konflikt gegeben, als das Raumschiff versuchte, die komplette Befehlssequenz für die neun Tage des Vorbeiflugs, die es gerade von der Erde erhalten hatte, in den Flash-Speicher zu schreiben und gleichzeitig wissenschaftliche Daten zu komprimieren, die von seinen Instrumenten gesammelt worden waren . All diese gleichzeitigen Aktivitäten hatten eine Überlastung des Hauptcomputers ausgelöst, was die Autonomiesoftware dazu veranlasste, auf den Backup-Prozessor umzuschalten, New Horizons auf die Erde zu richten und das Schiff in den sicheren Modus zu versetzen.

Es hört sich so an, als ob der Boden eine langwierige Befehlsfolge gesendet hat, während das System bereits eine hohe Arbeitslast hatte, um wissenschaftliche Daten zu komprimieren, und der Hauptcomputer aufgrund einer Überlastung abgestürzt ist.

Der sogenannte "Timing-Fehler" klingt also so, als wäre es im Grunde nur eine schlechte Wahl des Zeitpunkts, zu dem diese Befehlssequenz gesendet werden soll.

OK, großartig - das ist eine sehr klare und prägnante Beschreibung dessen, was passiert ist. Ich denke, "kein Fehler der Hardware oder Software" bedeutet, dass es kein unerwartetes oder fehlerhaftes Verhalten gezeigt hat, aber vielleicht könnte man es als unerwartetes oder ungetestetes oder nicht modelliertes Szenario bezeichnen? Vielen Dank, dass Sie dies gefunden haben!
Ja, es hört sich so an, als hätte das Betriebssystem besser darauf ausgelegt sein können, Überlastungen zu bewältigen – so wie es der Apollo LEM-Computer während der berühmten „1202“-Alarme während der Landung von Apollo 11 war.