Warum schirmen wir vorhandene CPUs nicht vor Strahlung ab, anstatt neue zu entwerfen?

Ich habe gerade diesen Artikel über Space-Graded-CPUs [1] gelesen .

Ich bin überhaupt kein Weltraumexperte, aber eine Frage wurde natürlich geboren:
Warum schirmen wir nicht lieber erdentwickelte CPUs (weit weniger teuer) ab, als brandneue strahlungssichere CPUs zu entwerfen?

PS: Ich habe hier einige Fragen gelesen, aber niemand spricht über diese Seite des Problems.


[1] https://arstechnica.com/science/2019/11/space-grade-cpus-how-do-you-send-more-computing-power-into-space/

Das ist übrigens ein cooler Artikel, da wird viel Geschichte behandelt.
Die überwiegende Mehrheit der kosmischen Strahlung, die auf einen Computer trifft, geht einfach hindurch. Ein winziger Bruchteil fügt Schaden zu. Es gibt ein ähnliches Problem mit der Abschirmung. Die meisten kosmischen Strahlen, die auf eine mehrere Meter dicke Bleischicht treffen, gehen einfach hindurch. (Das ist Betrug meinerseits; Blei ist ein lausiger Schutzschild gegen kosmische Strahlung.) Aluminium, Wasser und flüssiger Wasserstoff sind viel besser. Alles, was benötigt wird, ist eine Megatonne dieser Materialien, um einen winzigen Computer angemessen abzuschirmen. Diese Menge an Abschirmung bedeutet, dass ein Start unmöglich ist.
Kein Beweis für Forschung. Verschiedene qns unter dem Tag kosmische Strahlung werfen Licht auf diesen Bereich, z. B. space.stackexchange.com/questions/388/…
@andy256: Gibt das tatsächlich Aufschluss darüber, wie strahlungsempfindlich eine moderne CPU, die in einem 10-nm-Siliziumprozess hergestellt wurde, tatsächlich ist? Bei so kleinen Features braucht es nicht viel Streuladung, um irgendwo ein bisschen umzukehren (z. B. im Cache, wo alle Daten "wertvoll" sind). Oder sogar in der Registerzuordnungstabelle für eine CPU mit Ausführung außerhalb der Reihenfolge, die zu Anweisungen führt Die falschen Eingaben werden an sie weitergeleitet.Oder wahrscheinlich könnten andere Bitfehler die CPU vollständig blockieren (ROB denkt, dass es nicht ausgeführt wird und nicht zurückgezogen werden kann, aber es hat den Scheduler bereits verlassen und wird daher niemals ausgeführt. Der Ruhestand hält für immer an).
(Sie brauchen also offensichtlich eine Art robustes Watchdog-System, das den Computer zurücksetzt, wenn er nicht regelmäßig Hardware anstößt. Lockup-Fehler sind möglicherweise weniger schlimm als unentdeckte Fehler durch beschädigte Daten.)
@PeterCordes Diese Art von passiv-aggressiver Reaktion ist der Grund, warum ich keine Zeit mehr mit Stack verbringe.
@andy256: Ich wollte nicht, dass es passiv aggressiv ist. Nach einem kurzen Überfliegen dieses Links (und der Suche nach dem Wort „CPU“) habe ich nichts gesehen, was Aufschluss darüber geben könnte, wie viel Abschirmung ein Computer benötigen würde. Ich habe gefragt, ob ich etwas verpasst habe, das für die Abschirmung von CPUs relevant ist. Selbst nach dem Lesen des (sehr guten) Artikels von Ars Technica ist es überhaupt nicht offensichtlich, welchen Grad an Abschirmung ein handelsüblicher ARM Cortex A53 (die Basis für das HPSC) benötigen würde. Dann habe ich mich hinreißen lassen, über CPU-Architektur zu sprechen, was der Hauptgrund ist, warum ich Zeit mit SO verbringe. Dieses Q sieht für mich gut aus.
@RonJohn: Natürlich haben sie daran gedacht. Da sie es nicht tun, muss es einen Grund geben. Ich nehme an, dass die Frage nach einer Erklärung dieses Grundes (z. B. dass ein hochenergetischer kosmischer Strahl eine erhebliche Abschirmung durchdringen und dabei einen Schauer von Teilchen mit niedrigerer Energie erzeugen kann) der Punkt dieser Frage ist, detaillierter als "es würde geht nicht".
@PeterCordes Wenn OP wissen wollte, warum wir Rad-gehärtete Chips in den Weltraum schicken müssen, hat er das gefragt. Aber mit der Frage „Warum schirmen wir vorhandene CPUs nicht ab?“ impliziert er ziemlich offensichtlich, dass die Abschirmung die offensichtliche Antwort ist.
@RonJohn: Ich denke immer noch "warum genau kann die Abschirmung nicht funktionieren?" ist eine berechtigte Frage. Die Antwort lautet "weil es viel zu dick / schwer sein müsste, um ausreichend zu sein", ist die Antwort, in welcher Detailebene Sie darauf eingehen möchten. Und/oder dass das Einsparen dieser Abschirmmasse mit einer strahlungsfesten CPU die Kosten wert ist, weil Masse = $.
@PeterCordes das Q sollte zumindest anerkennen, dass Experten auf dem Gebiet über das Problem nachgedacht und die scheinbar unlogische Lösung gewählt haben.
Vage ähnlich zu Physik : physical.stackexchange.com/questions/386297/… Die Laien scheinen eine sehr optimistische Vorstellung davon zu haben, was die Strahlenabschirmung erreichen kann.
@DavidHammen "Die meisten kosmischen Strahlen, die auf eine ein paar Meter dicke Bleischicht treffen, gehen einfach hindurch." Aus dieser Antwort : "Wenn Sie die Strahlung um den Faktor 1000 auf einen 10-cm-Würfel senken, würde etwa ein halber mm Blei benötigt, was sich auf etwa 250 g summiert." EDIT: Die Kommentare scheinen dem zu widersprechen. Hat jemand konkrete Zahlen?
@andy256 Die Kommentare, auf die Sie geantwortet haben, scheinen nicht einmal einen Hinweis darauf zu enthalten, dass Sie mir gegenüber passiv aggressiv sind. Im Gegenteil, sie scheinen ein wohlüberlegter Gegensatz zu Ihrem früheren Kommentar zu sein. Lediglich die Behauptung von jemandem zu etwas in Frage zu stellen, bedeutet nicht, dass es passiv aggressiv ist.
@JollyJoker Diese Kommentare scheinen auf einem ernsthaften Missverständnis dessen zu beruhen, wogegen Sie sich abzuschirmen versuchen. Es gibt Situationen, in denen eine recht bescheidene Abschirmung sehr effektiv ist (Ihre Epidermus ist zum Beispiel eine ausreichende Abschirmung gegen externe Verfallsquellen, Alphahs), aber die Bedrohungen hier sind viel durchdringender als das.
@RonJohn schrieb "Q sollte zumindest anerkennen, dass Experten auf diesem Gebiet ..." - aber OP schrieb "Ich bin überhaupt kein Experte." OP hat angedeutet, dass Menschen mit mehr Wissen wahrscheinlich die Entscheidung getroffen haben. Trotzdem ist diese Bestätigung für die gestellte Frage größtenteils irrelevant.
@andy256 Ich finde deinen Kommentarstil viel kämpferischer und aggressiver als den, auf den du geantwortet hast. In der Tat enthalten zwei Ihrer Kommentare Tiraden darüber, wie Sie Ihre Zeit verschwenden, und diese Seite ist es nicht wert, besucht zu werden, usw. Ich fand den anderen Kommentar viel überlegter und sachlicher. Sie können den dort angesprochenen Punkten völlig widersprechen, aber wenn wir alle zum Schweigen bringen, mit denen wir nicht einverstanden sind, wäre diese Seite nutzlos. Ich finde Ihre Analogie "Schlag deine Frau" überhaupt nicht als einen nützlichen Vergleich.
Diese Frage wurde speziell zur Abschirmung bei den Apollo-Missionen gestellt, aber die Antworten bieten viele nützliche Hintergrundinformationen, die bei dieser Mission hilfreich sind, einschließlich einiger kontraintuitiver Argumente, dass es manchmal besser ist, nicht abzuschirmen als zu wenig abzuschirmen. (zumindest für Menschen)

Antworten (3)

Denn die Abschirmung gegen Strahlung ist schwer, und Gewicht ist der Feind, wenn es darum geht, Dinge in den Weltraum zu bringen.

CPUs sind ziemlich strahlungsempfindlich, und einige Arten von Strahlung (kosmische Strahlung) können nicht nur die meisten Dinge ziemlich gut durchdringen, sondern verursachen auch eine Kaskade von Sekundärstrahlung. Ein Gerät vor dem Durchdringen dieser Strahlung zu schützen, ist keine leichte (leichte) Aufgabe. An einem bestimmten Punkt ist es wirtschaftlicher, die CPU so umzugestalten, dass sie gegenüber einigen Stößen toleranter ist, da Sie kein Bit-Flip-Ereignis ausschließen müssen, wenn Sie 1 pro Zyklus tolerieren.

Ein paar ergänzende Gedanken:

  • Ein Teil der Kosten hat mit der Einmaligkeit von Weltraumhardware und der Notwendigkeit von Tests usw. zu tun. Selbst wenn die CPU frei hergestellt werden könnte, wäre sie zu dem Zeitpunkt, zu dem sie fluggetestet und von BAE gebracht worden wäre, groß Dollar.

  • Neue CPU-Architektur ist nicht die einzige Möglichkeit, Chips weniger empfindlich zu machen. Zum Beispiel: „Eine Möglichkeit, schnellere Consumer-CPUs im Weltraum zu nutzen, besteht darin, einfach dreimal so viele CPUs zu haben, wie man benötigt: Die drei CPUs führen die gleiche Berechnung durch und stimmen über das Ergebnis ab Fehler, die anderen beiden stimmen trotzdem zu, gewinnen also die Abstimmung und geben das richtige Ergebnis.". Dies ist der Ansatz, der von einem NASA-Programm Environmentally Adaptive Fault-Tolerant Computing oder "EAFTC" verwendet wird. Die EAFTC-Computer dienen dem gleichen Zweck. Sie gelten jedoch immer noch nicht als so zuverlässig wie dedizierte strahlungsgeschützte CPUs. Es wird erwartet, dass diese oder ähnliche Systeme verwendet werden, um einen Teil der Arbeit von strahlungsfesten CPUs zu entlasten. Ich weiß aber nicht, wie der Stand hier ist.

Können Sie mir ein paar Zahlen nennen? zB das "Gewicht" zum Abschirmgerät; Zweitens: Sind Astronauten aus dem gleichen Grund (Gewicht) weniger/mehr geschützt als Haushaltsgeräte?
@mattia.b89 Astronauten sind bis zu einem gewissen Grad strahlungsgehärtet. Unsere DNA verfügt über einige Kopierkorrekturmechanismen, und wenn eine Zelle irreparabel beschädigt ist, wird sie die meiste Zeit einfach Selbstmord begehen. Das ist gut genug für schwache Strahlung, natürlich mit dem Risiko gelegentlicher Krebserkrankungen. Eine Erd-CPU hat keinen dieser Mechanismen, daher ist jede kosmische Strahlung anfällig dafür, die Berechnung auf unvorhersehbare Weise durcheinander zu bringen. Eine Dosierung, die für Menschen in Ordnung ist, ist also nicht für typische Elektronik geeignet. Die Abschirmung ist typischerweise dieselbe: die Polyethylenschichten.
@Davidmh: Die meisten Mainstream-CPUs verwenden ECC (Fehlerkorrekturcodes) in ihren Caches, normalerweise mit 32- oder 64-Bit-Granularität. (Unterhaltsame Tatsache: Intel L1-Daten-Cache (zumindest in einigen Uarchen) verwendet nur Parität, nicht ECC wie L1i/L2/L3, sodass sie effiziente Single-Byte- und nicht ausgerichtete Speicher ohne RMW-Zyklus unterstützen können). ECC für den Hauptspeicher ist ebenfalls möglich (und wird häufig auf Servern verwendet). Das ist natürlich keine vollständige Lösung, und es ist nur SECDED (Einzelfehlerkorrektur, Doppelerkennung). SRAM-Zellen verwenden auch mehr als das Minimum an Transistoren, damit sie bei sehr minimaler Spannung stabiler laufen können.
@mattia.b89 (Bezüglich des Gewichts): Es ist schwer mit Sicherheit zu sagen, weil es keinen Endpunkt gibt, um "sicher" zu sein, selbst auf der Erde passieren Bit-Flip-Ereignisse, sie sind nur sehr selten, und die Reduzierung der Strahlung auf das Niveau der Erdoberfläche wäre unerschwinglich : Tonnen oder vielleicht Dutzende von Tönen. ECC-Speicher, geschweige denn ein Abstimmungssystem, könnten jedoch viel weniger bedeuten, als erforderlich ist, um strahlungsgehärtete Zuverlässigkeit zu erreichen.
@mattia.b89 (zu den Menschen): Es gibt welche, die können dir zu diesen Teilen viel mehr sagen als ich, aber: im Moment sind sie zum Beispiel sehr ähnlich geschützt (auf Bestellung von 2,5 mm Alu für die ISS ). Der Unterschied besteht darin, wie anfällig und für welche Arten von Strahlung. Für Menschen ist die Langzeitbelastung das eigentliche Risiko, für CPUs die Chance, dass eine schlechte Berechnung für etwas Kritisches verwendet wird.
Ich habe kürzlich an einem Seminar teilgenommen, bei dem einem Ingenieur, der Experte auf diesem Gebiet ist, genau diese Frage gestellt wurde, und er hat genau diese Frage beantwortet. Wir kennen einfach keine Möglichkeit, eine CPU abzuschirmen, die vom Gewicht her auch nur annähernd plausibel ist.
@mattia.b89 : Wenn bei einem handelsüblichen Computer ein einzelner Transistor zerstört oder ein einzelnes Bit umgedreht wird, stürzt die Software normalerweise ab oder liefert falsche Ergebnisse. Im Falle eines Menschen hat der Tod einer einzelnen Zelle keine signifikanten Auswirkungen, Zellen sterben und vermehren sich ständig. Menschen haben viel mehr Redundanz als Computer.
@mattia.b89 Die Antwort darauf, wie Astronauten die Strahlung tolerieren, die sie auf einer Weltraummission erhalten, lautet: „Wir haben es nie versucht“ nasa.gov/feature/goddard/…
@mattia.b89, ich kann Ihnen das Gewicht der Abschirmung nicht nennen, aber ich kann den Preis nennen: 3000 $/kg an Bord der Falcon 9, und Sie benötigen mehrere Kilogramm Abschirmung pro Chip.
@Mark Das scheint wirklich billig zu sein. Bist du sicher, dass nicht irgendwo ein paar Nullen fehlen?
@Voo Es sieht so aus, als hätte er Recht. In diesem Artikel heißt es, dass ein Falcon 9 Nutzlast für 2.700 $ /kg heben kann, im Gegensatz zum Shuttle für 54.500 $ /kg
@Cort Das ist ziemlich beeindruckend, wie billig wir heutzutage Dinge in den Weltraum schicken können. Der Preis von 50.000 entsprach eher meinen Erwartungen. Toll.

Du stellst wirklich eine sehr gute Frage. Und die Antwort lautet: Wir machen beides, je nach Bedarf.

Die NASA tendiert dazu, sich für das Ultra-Zuverlässige zu entscheiden, und strahlungstolerante Komponenten sind zuverlässiger, daher ist dies ihr bevorzugter Weg. Viele kommerzielle Satelliten verwenden jedoch nicht weltraumtaugliche Komponenten, die leicht abgeschirmt sind, und mit Software und Hardware, die so aufgebaut sind, dass 2 CPUs dieselbe Berechnung durchführen können, wenn sie unterschiedliche Ergebnisse erhalten, berechnen sie sie neu. Für den Speicher ist eine dreifache Redundanz üblich, bei der der Speicher dreimal in verschiedenen Chips gespeichert wird und die Antworten verglichen werden. Die empfindlichsten und wichtigsten Komponenten sind in der Regel immer noch strahlungstolerant, aber dies ist eine relativ kleine Teilmenge von Komponenten in einem Satelliten, das schwere Heben kann sich auf eine strahlungsempfindlichere und viel kostengünstigere Komponente verlassen.

Wirf etwas grobe Mathematik auf die Frage und lasse mich gerne von jemandem mit tatsächlichen Zahlen korrigieren.

Das Härten erhöht den Strahlungspegel zum Auslösen von Fehlern um mehrere Größenordnungen, nennen Sie es 1000 dafür.

Um die Strahlung um den Faktor 1000 auf einen 10-cm-Würfel zu senken, würde etwa ein halber Millimeter Blei benötigt, was sich auf etwa 250 g summiert. Die meisten Computermodule sind größer und ungeschickter geformt als die paar Kilo Abschirmung.

Eine Abschirmung wäre also erreichbar, würde aber ein Instrument oder ein Sicherungselement aus dem endgültigen Design kosten.

Was möglicherweise fehlt, ist, wer tatsächlich für die radikal gehärtete CPU bezahlt hat und was eine abgeschirmte, aber herkömmliche CPU zum Testen gekostet hätte. Die gehärteten CPUs werden größtenteils aus Militärausgaben und nicht aus der Weltraumforschung geboren (damit die NASA das eingesparte Geld nicht erhalten würde) und kommen mit viel Papierkram an, der nicht nur die Strahlungshärtung, sondern die „kostenlose“ Härtung gegen extreme Temperaturen und Vibrationen spezifiziert.

Eine handelsübliche CPU müsste in das strahlungsgehärtete Gehäuse verpackt und dann vor dem Start den entsprechenden Tests unterzogen werden. Es würde wahrscheinlich versagen und müsste mehrmals überarbeitet und erneut getestet werden, um es richtig zu machen. Die endgültigen Kosten wären also wahrscheinlich günstiger, könnten sich aber als viel höher herausstellen oder die Dinge sogar so weit verzögern, dass das Startfenster verpasst wird, und das wäre zum Planungszeitpunkt unbekannt. Wobei die strahlengehärtete Einheit in Bezug auf Preis, Gewicht und Leistung von Anfang an im Designprozess eine bekannte Größe wäre.

Wenn Sie also eine Familie von LEO-Sats herstellen, bei der es sich leisten kann, dass das erste Paar fehlschlägt, und die Testkosten auf den Rest der Familie verteilen, kann dies funktionieren, und tatsächlich können viele Satelliten der aktuellen Generation (insbesondere Cube / Smallsats) funktionieren. geh diesen Weg.

Wenn Sie eine Raumsonde mit einem Budget von einer halben Milliarde Dollar entwerfen und jahrzehntelang fliegen, dann sieht es besser aus, ein paar Millionen gegen genug Gewicht einzutauschen, um einen weiteren Sensor hinzuzufügen. Vor allem, wenn Sie die Computer für weniger als den Ticketpreis bekommen und es als Forschungs- / Öffentlichkeitsarbeitsprojekt für die Agentur bezeichnen können, die sie entwickelt hat.

Das ist also Mathematik, die in beide Richtungen gehen kann, was stark von den Details abhängt.

Ich denke nicht, dass die Mathematik (en) dafür ganz richtig ist. 0,5 mm Blei sind nicht annähernd ausreichend, um Bitfehler in einer typischen CPU im Weltraum zu verhindern. Aus Neugier, woher hast du den Faktor 1000? Ich habe dies nur im Zusammenhang mit der Gesamtstrahlendosis gesehen, um langfristige Schäden zu verursachen, nicht Einzelereigniseffekte.
Stimmen Sie zu, dass die Mathematik in verschiedene Richtungen falsch ist, und freuen Sie sich, den Beitrag entweder zu löschen oder zu aktualisieren, wenn jemand bessere Zahlen hat als die erste Seite der Suchergebnisse. Es gibt Zehnerpotenzen-Unterschiede, die sich daraus ergeben, woraus Ihre Strahlung besteht (Partikel oder reine EM), der Entfernung (inverses Quadratgesetz) und der genauen Art Ihrer Elektronik, aber die beobachtbaren Ergebnisse (Cubesats und Marssonden) legen nahe, dass beide Optionen gemacht werden können zu arbeiten, solange Sie die Kosten/Einschränkungen akzeptieren.
Es gibt durchaus Verwendungen von nicht ganz so stark strahlungsfesten Geräten im Weltraum. Wie Sie zu Recht betonen, ist nicht jeder Raum gleich (der Hauptunterschied liegt innerhalb oder außerhalb der Magnetosphäre der Erde). Dies ist jedoch nicht der Hauptfaktor für die Notwendigkeit einer Strahlenhärtung. Ein einfacher zustandsloser ASIC, der Daten produziert, muss nur die Strahlendosis überstehen . Bereits beim Empfang der Daten können Anomalien auf der Erde herausgefiltert werden. Allerdings darf die CPU, die etwas Kritisches steuert, keine Fehler machen. Das bedeutet nicht, dass Sie niemals nicht strahlungsgehärtete Geräte verwenden können, nur dass Sie dies auch nicht immer können.
Um die Strahlung um den Faktor 1000 auf einen 10-cm-Würfel zu senken , würde etwa ein halber Millimeter Blei benötigt bestehend aus Protonen, Deuteronen und Alpha-Partikeln, enthalten auch Spuren sehr schädlicher schwerer Ionen). Die Wirkung von einem halben Millimeter Blei ist tatsächlich schlimmer als gar keine Abschirmung durch Sekundärstrahlung. Aber mindestens ein halber Millimeter Blei ist nicht annähernd so schlimm wie fünf Millimeter Blei, was etwa doppelt so schlimm ist wie gar keine Abschirmung.
Blei ist gut darin, Röntgen- und Gammastrahlen zu blockieren, aber diese sind keine signifikante Bedrohung durch einen gelben Zwergstern. Die Hauptbedrohungen sind der Sonnenwind, der am Sonnenmaximum seinen Höhepunkt erreicht, und die galaktische kosmische Strahlung, die am Sonnenminimum ihren Höhepunkt erreicht. Blei ist eine so unglaublich schlechte Wahl gegen Protonen und schwerere Kerne, dass es nur zu Vergleichszwecken in Studien aufgenommen wird.