Wie ging der Apollo-Leitcomputer mit Paritätsbitfehlern um?

Die folgenden Antworten erwähnen die Verwendung von Paritätsbits im Apollo-Leitcomputer:

  • diese Antwort auf Bits pro Kern für die verschiedenen Versionen des Apollo-Leitcomputer-Kernseilspeichers?
  • diese Antwort auf Wie haben die Apollo-Computer transzendente Funktionen wie Sinus, Arkustangens, Logarithmus ausgewertet?

Das führt mich zu der Frage:

  1. Wie ging der Apollo-Leitcomputer mit Paritätsbitfehlern um?
  2. Wurden diese jemals während tatsächlicher Missionen angetroffen?
Wahrscheinlich nicht so: youtube.com/watch?v=G6o881n35GU
Ha! du hast mich wieder buchstäblich LOL gemacht. Meine Nachbarn halten mich deswegen für zertifizierbar (ganz zu schweigen von „fehlerhaft und unvollkommen“).

Antworten (2)

1. Wie ging der Apollo-Führungscomputer mit Paritätsbitfehlern um?

Laut Apollo 15 Hardware von Delco Electronics,

Paritätsalarm

Tritt auf, wenn auf ein beliebiges Wort im festen oder löschbaren Speicher zugegriffen wird, dessen Adresse lautet 10 8 oder größer enthält eine gerade Anzahl von „Einsen“. Alle Standorte von 10 8 oder mehr werden im festen oder löschbaren Speicher mit ungerader Parität gespeichert.

10 8 ist Oktal 10 oder Dezimal 8.

Diese Bedingung löst einen automatischen Hardware-Neustart aus:

Für die folgenden Alarme wird ein NEUSTART (Hardware) und eine nachfolgende AGC/LGC-Warnung generiert:

  • Oszillatorfehler
  • Transfer Control (TC)-Falle
  • Paritätsalarm
  • Nachtwächter scheitern
  • Unterbrechungssperre (RUPT).
  • Spannungsausfall

Der NEUSTART verhindert vorübergehend den Zugriff auf den Speicher, friert den Computer ein, speichert Prozessinformationen und überträgt dann die Steuerung an Adresse 4000. Diese Adresse hat die Informationsadresse für die nächste Anweisung nach einem NEUSTART, die der Softwareprogrammierer bereitgestellt hat.


2. Wurden diese jemals während tatsächlicher Missionen angetroffen?

Gemäß dem zusammenfassenden Bericht des Apollo-Programms war die schwerwiegendste Anomalie im gesamten GN&C-System eine transiente Spannung, die dem Computer fälschlicherweise anzeigte, dass die Referenz der Trägheitslage verloren gegangen war. Darin heißt es auch, dass ein offener Rückkopplungskreis für die kardanische Rate eine unerwartete Oszillation der redundanten kardanischen Aktuatorbaugruppe des Motors verursachte. Über den Computer selbst heißt es jedoch eindeutig:

Die Leistung des Computers war einwandfrei.

Ich würde das als keine Paritätsfehler interpretieren.


Laut Wiederherstellung nach vorübergehenden Ausfällen des Apollo Guidance Computer :

In insgesamt über 25 Stunden Weltraumflug hatte der Computer noch keinen vorübergehenden Ausfall, bei dem die Neustartfunktion aufgerufen werden könnte, um ihren Wert zu demonstrieren.

(Dank an @aCVn) Dieser Bericht wurde im August 1968 veröffentlicht, vor irgendeiner der Mondlandungen.

ibiblio.org/apollo/hrst/archive/1033.pdf (Abschnitt XVI, PDF-Seite 10) sagt, dass 1968 in mehr als 25 Flugstunden (Abschnitt XIX, PDF-Seite 11) „kein Neustart im Flug stattgefunden hat.“ . Das ist ziemlich eindeutig, deckt aber natürlich nicht die Mondlandemissionen ab.
Der obige Kommentar sieht ziemlich eindeutig aus. Da Kommentare temporär sind und jederzeit gelöscht werden können, würden Sie das in Ihre Antwort aufnehmen?
"Die Leistung des Computers war einwandfrei" - abgesehen von diesem kleinen Radar-bezogenen CPU-Überlastungsproblem, richtig?
@ user253751: Technisch gesehen wurde dies durch Störimpulse von der Signalverarbeitungsausrüstung verursacht, nicht vom Computer selbst. Nichtsdestotrotz ist es wünschenswert, dass der Computer Fehlfunktionen in anderen Geräten sicher handhabt.

Was für eine faszinierend obskure Frage :-) Es hat einiges gegraben, also weiß vielleicht jemand, der tatsächlich eine AGC gesehen hat , es besser:

Das Paritätsbit wurde verwendet, um zu verifizieren, dass Daten korrekt vom Speicher zu den Registern übertragen wurden. Das heißt, es wurde angenommen, dass die Daten im Speicher korrekt sind , und es wurde angenommen, dass der Fehler zwischen der Elektronik auftritt, die vom Kernspeicher zu den Registern überträgt.

Wenn ein Paritätsbitfehler erkannt würde, würde ein Paritätsalarm auftreten. Dies wurde tatsächlich auf dem DSKY angezeigt und führte zu einem Neustart der aktuell laufenden Programme. Es war so wichtig, dass in der AGC eine Paritätsschaltung existierte. Es war eines von vielen Hardware-Ausfallerkennungssystemen, die die AGC bei solchen Ausfällen schützten. Sie können hier viel mehr über das Neustartsystem lesen , das die Paritätssachen beschreibt.

Ich kann keinen Hinweis auf einen Paritätsalarm finden, der jemals aufgetreten ist, aber ich habe im Moment nicht zu genau gesucht. Ich gehe davon aus, dass es in den Kommunikationsprotokollen der Mission stehen würde, wenn dies der Fall wäre.

Sehr wichtig. Heutzutage bekommt man einen netten Bildschirm vom OS/BIOS und so etwas wie "Paritätsfehler - System angehalten" bei richtig implementierter Hardware (Einzelfehlerkorrektur, Doppelfehlererkennung ... )
Rechts! obskure frage des monats :)
Ich liebe die alte Terminologie für das, was wir heute als Watchdog-Schaltung kennen ... den "Nachtwächter" :)
Als jemand, der eine AGC gesehen hat (und restauriert), kann ich dazu etwas sagen. Der Speicher hatte Parität (15 Bit Daten + 1 Bit Parität). Es wurde nicht angenommen, dass die Daten im Speicher korrekt waren.
@DavidTonhofer Ein modernes System erstellt mit größerer Wahrscheinlichkeit einen Systemprotokolleintrag, wenn ein korrigierbarer RAM-ECC-Fehler auftritt. (Sicherlich macht Linux das so.) Die Annahme hier ist wahrscheinlich, dass, wenn Sie sich genug interessieren, um überhaupt zu wissen, dass ein solcher Fehler aufgetreten ist, Sie sich genug interessieren, um eine Art Protokollüberwachung zu haben, und da es korrigierbar ist, gibt es keinen Grund dazu das System anhalten oder neu starten.