Was sind die Fehlermechanismen in einem integrierten Schaltkreis?

Kontext

Ich habe immer versucht, meine Schaltungen für Chips so zu gestalten, dass sie innerhalb ihrer absoluten Höchstwerte liegen. Das Verständnis der Fehlermechanismen ist jedoch unerlässlich, um einen Chip debuggen zu können, wenn etwas schief geht (normalerweise versuche ich es am Ende mit einem anderen Chip, was Zeit kostet).

Frage

Daher meine Frage: Was sind die häufigsten Fehlermechanismen aufgrund falscher Verwendung (dh Eingangs- / Ausgangsspannungen und -ströme) von integrierten Schaltkreisen? Details und Diagramme sind ein großes Plus für diese komplexe Frage. Die ideale Antwort würde die häufigsten Familien von Ein- / Ausgängen (CMOS usw.) und schlechte Verwendungen (Sperrspannung, Überstrom ...) mit Fehlereffekten verknüpfen.

Beispiel

Dies ist eine allgemeine Frage, aber was sie ausgelöst hat, ist, dass zum Schutz vor negativen Eingangsspannungen eines asymmetrisch versorgten Geräts Strombegrenzungswiderstände anscheinend ausreichen (ich hatte zuvor parallele Schottkies). Heißt das, es gibt keinen Spannungsausfall, jeder Ausfall ist (zu einem gewissen Grad) strombedingt? Wie genau?

Es gibt so viele interessante Fehlermodi für elektrische Geräte: en.wikipedia.org/wiki/Electromigration ist nur einer davon.

Antworten (3)

Zwei unmittelbare Ausfallarten sind Überspannung und Überstrom.

  1. Wenn Sie einen hochohmigen Eingang wie ein Gate zu einem Mosfet haben, führt eine hohe Spannung (selbst bei sehr niedrigem Strom) zu einem Durchschlag im kapazitiven Gate des Mosfet, da die Elektronen genug Energie haben, um das Dielektrikum zum Durchbruch zu bringen. Sobald dies eintritt, fällt der Widerstand des Eingangs auf nahezu Null und ein späterer Niederspannungs-Hochstrom wird sich weiter aufheizen und den Mosfet zerstören. Aufgrund dieser Ausfallart gibt es auf vielen Chips einen ESD-Schutz.
  2. Überstrom verursacht eine Überhitzung des Geräts. Sobald die Temperaturen hoch genug werden, um die Struktur zu verändern und/oder die internen Halbleiter zu brennen, fängt es an, sich komisch zu verhalten, weniger effizient zu arbeiten oder als Unterbrechung oder Kurzschluss vollständig zu versagen.

Es ist möglich, dass Sie sich die Sperrspannung als einen anderen Ausfallmechanismus vorstellen, aber im Allgemeinen fällt dies immer noch unter eine der beiden anderen Kategorien, es ist nur anders darüber nachzudenken. Wenn beispielsweise jemand eine Stromversorgung in einem Schaltkreis mit einer darin enthaltenen Diode umkehrt, erwartet er möglicherweise keinen Strom durch die Diode und erhält stattdessen einen Überstromzustand, da die Diode jetzt in Vorwärtsrichtung vorgespannt wäre.

Beachten Sie, dass Kondensatoren, Widerstände und Spulen (und jedes andere Schaltungselement) wahrscheinlich auf ähnliche Weise wie Transistor-ICs beschädigt werden, dh durch Überstrom und/oder Überspannung.

Andere Ausfallarten der Elektronik im Allgemeinen finden Sie hier: http://en.wikipedia.org/wiki/Failure_modes_of_electronics

Zusätzlich (und oft übersehen) führt der Betrieb außerhalb der angegebenen Temperaturbereiche zu einer undefinierten Leistung, möglicherweise zu einem Ausfall.
Danke, dass du das erklärt hast. Ich dachte immer an Überströme als Ursache für Übertemperaturausfälle (Schmelzen der Verbindung) und nicht umgekehrt. Reicht also zum Schutz vor Sperrspannung ein einfacher Vorwiderstand aus, um den Chip zu schützen (auch wenn es so nicht funktionieren würde)?
@MisterMystère Sie haben im Allgemeinen mehr Recht, Überstrom verursacht Überhitzung. Ich werde meine Antwort bearbeiten, um das klarer zu machen. Sie können einen Chip extern aufheizen, um ihn zum Versagen zu bringen, aber das ist normalerweise nicht der Fehlermodus. Um eine Sperrspannung zu verhindern, kann eine Diode mit niedrigem Durchlassspannungsabfall verwendet werden. Ein Widerstand würde wahrscheinlich dazu führen, dass sich die Schaltung anders als erwartet verhält.

Kurze Antwort: Die Temperatur ist das größte Problem in einer ansonsten richtig konstruierten Schaltung.

Dies ist eine ziemlich weit gefasste Frage mit einem ganzen Bereich des Ingenieurwesens. Einige nützliche Referenzen finden Sie beim Durchsuchen der JEDEC-Spezifikationen (kostenlos). JEDEC ist eine Normungsorganisation, die zur Verbesserung der Qualität in der gesamten Halbleiterindustrie beiträgt. Nahezu jedes Unternehmen befolgt die JEDEC-Qualifizierungskriterien, um zu verhindern, dass latente, werkseitige oder systematische Mängel das Feld erreichen.

Zurück zu Ihrer Frage, einige primäre Ausfallmechanismen von ICs, die ich beobachtet oder mit der Fabrik zusammengearbeitet habe, um sie zu verbessern:

  1. Integrität des MOS-Gate-Oxids: Kontaminiertes Oxid kann den VT verändern, Temperatur oder Spannung können einen Leitungspfad durch das Oxid verursachen (Durchschlag). Hierauf wird in der Regel bei der Gerätequalifizierung größtes Augenmerk gelegt.
    • Temperatur: Dies ist der Beschleunigungsfaktor Nr. 1 im Arrhenius-Modell, das die Halbleiterzuverlässigkeit beschreibt. Wenn ein IC, der für den Betrieb bei 60 °C Umgebungstemperatur ausgelegt ist, tatsächlich bei 100 °C Umgebungstemperatur betrieben wird, wird die Lebensdauer des Geräts dramatisch verkürzt (mehrere Jahre).
    • Spannung: ESD, Spannungstransienten usw. können das Oxid schwächen. ESD wird normalerweise im Werk spezifiziert und gut kontrolliert. VGS-Transienten müssen manchmal beim Design berücksichtigt werden.
  2. Latchup: Parasitärer Thyristor, der entweder durch Überspannung oder Strominjektion ausgelöst wird. Die meisten Geräte sind mit einem gewissen Grad an Latchup-Immunität spezifiziert. Isolationswiderstände und Klemmdioden können helfen, dies je nach Art des Latchups zu mildern.
    • Überspannung: Das Ziehen eines Spannungsknotens über seine positive Versorgungsschiene oder unter seine negative Versorgungsschiene könnte einen Parasiten auslösen, der das Gerät beschädigt.
      • Ihr Beispiel des Isolationswiderstands klingt wie ein Latchup-Ereignis, das darauf wartet, passiert zu werden. Die Klemmdioden sind möglicherweise vorsichtiger, insbesondere wenn Sie das Design in Massenproduktion herstellen möchten.
    • Strominjektion: Transiente Stromspitzen, insbesondere an IO-Pins, können ebenfalls Latchup auslösen.
    • Temperatur: Verringert normalerweise die Latchup-Immunität.
  3. Temperaturwechsel: Ausdehnung und Kontraktion aufgrund schneller Ein-/Ausschaltzyklen, Hochstrom- oder Hochspannungsgeräte usw. können zum Verschleiß der internen und externen Geräteschichten/Verbindungen führen.
    • Hohlräume/Füllung: Interne Metallschichten von ICs können „knicken“, was zu Hohlräumen (Öffnungen) oder Füllungen (Kurzschlüssen), Delamination usw. zwischen den Schichten führen kann. Offensichtlich gilt dies auch für PCBs.
  4. Temperatur/Druck/Feuchtigkeit: Kann galvanische Korrosion und sogar Speicherausfälle verursachen, wenn Feuchtigkeit in die Kunststoffverpackung der gängigsten ICs eindringt. Dies wird normalerweise durch die Materialauswahl und das „Ausbacken“ der Feuchtigkeit aus dem Gerät gemildert.
Danke für deine umfangreiche Antwort. Ich verstehe das Latchup jedoch nicht vollständig. Könnten Sie die Anwendung meines Beispiels näher erläutern (einfache annotierte Schaltpläne wären sehr willkommen)?

Das ist irgendwie eine dumme Frage. Eine vollständige Antwort würde ein Buch füllen. Im Zusammenhang mit einem Board-Design ist die Antwort irrelevant (erkläre ich später). Aber es ist immer noch eine nützliche Frage.

Folgen Sie dem Datenblatt. Besonders bemerkenswerte Bereiche, wenn der Designer entschieden hat, Ihnen zu sagen, dass Sie die Spannung beim ersten Einschalten NICHT zu schnell hochfahren sollen, werden Sie nicht kreativ und entscheiden Sie sich dafür, dass Sie es besser wissen. Auch wenn es mühsam ist, ein Netzteil zu entwerfen, das langsam ansteigt. Die meisten Angaben werden subtil sein, wenn das Datenblatt schrill ist, dann achten Sie wirklich darauf.

Es gibt viele Fehlermechanismen in ICs, aber die Auswirkungen auf den Chip erfordern anschließend eine genaue Kenntnis der internen Funktionsweise. Sie können einen ausgefallenen Transistor haben und es kann sein, dass es nie bemerkt wird, oder es kann den ganzen Chip zerstören. Selbst der Konstrukteur mag es nicht wissen, FMEA wird durchgeführt, aber normalerweise nur in Schlüsselbereichen (FMEA = Failure Mode Effects Analysis).

Viele der Beschränkungen für den Chip werden durch den Prozess auferlegt. Die Gießerei schreibt Designpraktiken, Platzierung usw. vor und sie haben eine Software, die auf Verstöße prüft. Andere Einschränkungen sind betriebsbedingt und werden direkt in Maximalspannungen, Kühlkörperanforderungen, dV/dt an Signalen usw. umgesetzt.

Aufgrund der erhöhten Kosten, der Komplexität des Designs und der Folgewirkungen von Fehlern (Zeitplanverzögerungen usw.) werden die meisten Chipdesigns die meisten Grundlagen abdecken. Aber es gibt bemerkenswerte Ausnahmen, wenn der Prozess fehlgeschlagen ist.

Die Frage nach Fehlermodi des Chipdesigns in Bezug auf das Platinendesign ist also so, als würde man die Motorhaube öffnen, eine zufällige Schraube entfernen und fragen: "Wird das das Auto daran hindern zu funktionieren?" wenn du den ölwannenstopfen abbaust - ja. wenn es eine von mehreren überflüssigen Schrauben an den Ventildeckeln ist - nein. Wo die eigentliche Antwort lautet: "Entfernen Sie keine Schrauben!".

Bei einigen Designs fügt der Chip-Designer manchmal "Fallstricke" in das Design ein, die ihn dazu bringen, aufmerksam zu sein, wenn der Board-Designer klug ist. Die beste Interaktion ist, wenn der Board-Typ sagt: "Warum hast du dieses Signal auf diesen Pin da drüben gelegt, es bringt das Blabla durcheinander usw." Dies sind fast immer der Beginn wunderbarer Gespräche und normalerweise eine lange Zeit Interaktion und Freundschaft. Die Antwort zurück ist meistens "sehr gut, aber das ist der Signalfluss im Chip, und wenn du das so gemacht hast ...." die Antwort ist immer ein "Heureka".

Ein IC wird nicht überladen, es sei denn, Sie haben es beschädigt oder es wird außerhalb seiner Spezifikationen betrieben. Überstrom = Es passieren bereits schlimme Dinge, was nur Sinn macht. Ein Chip stellt einer Spannungsquelle nur eine bestimmte Last dar, dh einen festen Strom. Zu sagen, dass Überstrom Chips tötet, ist wie zu sagen, dass eine Festspannungsquelle, die einen Festwiderstand antreibt, einen Fehler haben könnte , weil der Widerstand über Strom gehen könnte. Der Überstrom ist ein Fehler/Effekt, er ist KEINE Ursache.

Interessant, danke. Ich weiß jedoch, dass wir die Datenblattrichtlinien befolgen müssen (wenn ich es nicht getan hätte, wüsste ich es heute mit Sicherheit), ich frage eher, was im Allgemeinen passiert, wenn die von uns getroffenen Vorsichtsmaßnahmen schief gehen (oder wenn wir eine übersehen haben). Es ist für bestimmte Chip-spezifisch, aber da ich höre, dass viele Ein- / Ausgänge der Chips ähnlich sind, kann vielleicht erklärt werden, was passiert, wenn falsche Spannungen / Ströme angelegt werden (z. B. CMOS-Eingang usw.)? Ich habe meinen Beitrag aktualisiert, um das zu zeigen.