Wie passen Tensorprodukte und direkte Summen in die Quantenmechanik?

Ich verstehe, dass in der Quantenmechanik manchmal Tensorprodukte oder direkte Summen zwischen Hilbert-Räumen gebildet werden. Ich weiß jedoch nicht, wann dies getan werden kann oder wann es getan werden sollte. Ich möchte das genau erklärt haben. Wo passt das insbesondere in Bezug auf die Axiome der Quantenmechanik? Ich verstehe, dass es möglicherweise mehr als einen Satz von Axiomen für die Quantenmechanik gibt, also halten wir uns an diese (die möglicherweise fehlerhaft sind):

I. Der Zustand eines Systems wird durch einen Strahl eines Hilbert-Raums dargestellt H , deren Vektoren Kets genannt werden.

II. Entsprechend jedem Observable A ist ein hermitescher Operator A ^ An H .

III. Beim Messen eines Observablen A eines Systems in einem Zustand, dargestellt durch einen Strahl mit normalisiertem Repräsentanten Ψ , ist das Ergebnis der Messung einer der Eigenwerte A von A mit Wahrscheinlichkeit A , Ψ , Wo A ist der normalisierte Eigenvektor, der dem Eigenwert entspricht A . Außerdem wird der Zustand des Systems durch dargestellt A .

IV. Ein Ket Ψ die Darstellung eines Systems wird sich gemäß der Schrödinger-Gleichung entwickeln.

Zugehöriges/mögliches Duplikat: physical.stackexchange.com/q/54896/50583
Können Sie erklären, was Sie mit einem „Freiheitsgrad“ meinen?
@knzhou Ich weiß eigentlich nicht, was ich meine, aber ich habe die Vorstellung, dass man, um sehr allgemein zu sein, von Freiheitsgraden sprechen muss.
Um ehrlich zu sein, beide Kopfgelder, die Sie ausgesetzt haben, sind extrem schwer zu beantworten, weil Sie darauf bestehen, grundlegendere Dinge in Bezug auf weniger grundlegende Dinge zu erklären.
Zum Beispiel fragen Sie in Ihrem anderen Kopfgeld nach einer allgemeinen Beschreibung der Lagrange-Funktion in Bezug auf kinetische und potentielle Energie. Aber die Lagrange-Funktion ist die allgemeinere Idee. Viele von der Lagrange-Mechanik beschriebene Systeme haben überhaupt keine sinnvollen Vorstellungen von kinetischer und potentieller Energie – stattdessen werden diese Größen in einfachen Fällen aus der Lagrange-Mechanik abgeleitet .
Und hier bestehen Sie auf einer Erklärung von Quantenaxiomen im Sinne der intuitiven klassischen Vorstellung von Freiheitsgraden. Aber in Wirklichkeit kommt der Begriff der klassischen Freiheitsgrade aus der Quantenmechanik. Ihre Vorstellung, allgemeiner zu sein, ist eigentlich eine Bitte, weniger allgemein zu sein.
Stellen Sie sich vor, Sie lernen in der Grundschule mit Lineal und Buntstiften etwas über Geometrie und in der High School lernen Sie die Axiome der euklidischen Geometrie. Die Dinge, die Sie in der Grundschule gelernt haben, folgen aus diesen Axiomen, nicht umgekehrt. Was Sie fordern, ist wie die Forderung, dass die Axiome in Buntstiften umformuliert werden, um "sehr allgemein" zu sein.
@knzhou Nun, ich weiß sehr wenig und meine Fragen spiegeln meine naive Sichtweise wider.

Antworten (4)

Tensorprodukt

Schreiben des Hilbertraums als Tensorprodukt

H = H A H B
kann nützlich sein, wenn wir daran denken wollen H A Und H B als zwei komplementäre Teilsysteme des Gesamtsystems. Observables, die dem Subsystem zugeordnet sind A handeln wie die Identität auf dem anderen Faktor H B , und umgekehrt. Zum Beispiel ein Observable, das einem Subsystem zugeordnet ist A hat die Form Ö A 1 . Eine allgemeine Beobachtungsgröße wirkt sich auf beide aus H A Und H B . Das heißt, eine allgemeine Observable ist eine Summe von Termen der Form Ö A Ö B wo die Betreiber Ö A / B nur handeln A / B bzw.

Insbesondere wenn H = H A H B , ist der Hamiltonoperator in der Schrödinger-Gleichung eine Summe von Termen der Form Ö A Ö B . Insbesondere die Bedingungen des Formulars Ö A 1 Und 1 Ö B Beschreiben Sie die Dynamik der A Und B Subsysteme selbst, und alle anderen Begriffe beschreiben Interaktionen zwischen diesen Subsystemen.

Ein weiteres Beispiel ist ein nicht-relativistisches Teilchen mit Spin: Wir können den Hilbert-Raum als Tensorprodukt ausdrücken H X H S , wobei mit dem Ort des Teilchens verbundene Observable die Form haben Ö X 1 und Observablen, die mit seinem Spin verbunden sind, haben die Form 1 Ö S . In diesem Fall werden die verschiedenen Teile normalerweise als verschiedene "Freiheitsgrade" statt als verschiedene "Subsysteme" bezeichnet. Im Falle eines nicht-relativistischen Teilchens können wir weiter faktorisieren H X in drei Faktoren, die mit den drei Dimensionen des Raums verbunden sind. Wiederum würden wir diese normalerweise "Freiheitsgrade" anstelle von "Subsystemen" nennen.

Ganz allgemein können wir ein „Subsystem“ oder einen „Freiheitsgrad“ als eine spezielle Sammlung von Observablen definieren. Die Tensorproduktkonstruktion wird dafür nicht benötigt, ist aber oft nützlich. Wenn Observablen, die verschiedenen Subsystemen (oder Freiheitsgraden) zugeordnet sind, miteinander pendeln, ist das Tensorprodukt oft nützlich, um die verschiedenen Sätze von Observablen mathematisch mathematisch abzugrenzen: Jeder Satz wirkt nicht trivial auf nur einen der Tensorfaktoren.

Die Konzepte "Subsysteme" und "Freiheitsgrade" sind nur vage umrissene Spezialfälle einer viel allgemeineren Idee: gegenseitig tauschende Teilmengen der Menge von Observablen. Derselbe Hilbert-Raum lässt viele verschiedene Tensorprodukt-Faktorisierungen zu. Welches am nützlichsten ist (wenn überhaupt), hängt davon ab, welche Operatoren wir welche physikalischen Observablen darstellen wollen – die Entscheidungen, die wir treffen, wenn wir ein Modell definieren. Ein ähnlicher Kommentar gilt für die gebräuchlichsten Definitionen / Maße von "Verschränkung", da sie sich auf eine gegebene Tensorproduktfaktorisierung beziehen.

Das Lernen über die "Split-Eigenschaft" in der Quantenfeldtheorie zeigt einige Einschränkungen der Tensorproduktformulierung. Die Split-Eigenschaft wird in diesem verwandten Beitrag erwähnt:

Sollte es offensichtlich sein, dass unabhängige Quantenzustände zusammengesetzt werden, indem man das Tensorprodukt bildet?

Das Tensorprodukt hat auch andere Verwendungen. Zum Beispiel können wir für ein einzelnes Teilchen, das im dreidimensionalen Raum ruht, systematisch die Spin- J Vertretung für alle J indem man das Tensorprodukt von nimmt 2 J Kopien der Spin-1/2-Darstellung und Symmetrierung. Wir können uns dies als eine spezielle Anwendung der Subsystem-Idee vorstellen, da eine symmetrisierte Sammlung von 2 J Spin-1/2-Partikel haben einen Gesamtspin J .

Die im OP aufgeführten Axiome I-IV sind gleich, ob oder nicht H wird als Tensorprodukt geschrieben, da diese Axiome unabhängig davon sind, welche Darstellung wir für den Hilbert-Raum verwenden.

Direkte Summe

Schreiben des Hilbert-Raums als direkte Summe

H = H 1 H 2
ist nützlich, wenn wir uns auf einen bestimmten Teilraum von Zuständen konzentrieren möchten. Am Beispiel eines nicht-relativistischen Einteilchenmodells H 1 könnte aus Zuständen bestehen, in denen die Wellenfunktion eines Teilchens nur innerhalb einer bestimmten Region Unterstützung hat R , Und H 2 könnte aus Staaten mit Unterstützung in der Ergänzung von bestehen R .

Allgemeiner gesagt, bei jeder diskreten Observablen (wie der Observable, die fragt: „Ist das Teilchen, das sich in der Region befindet R oder nicht?"), können wir schreiben H als direkte Summe der Eigenräume dieser Observablen. Eine Direktsummenzerlegung des Hilbertraums entspricht einer Blockmatrixdarstellung von Operatoren auf dem Hilbertraum.

Etwas esoterisch ist die direkte Summe auch nützlich, um gemischte Zustände als Vektorzustände darzustellen: Jeder Zustand, ob rein oder gemischt, kann als Vektorzustand in einem ausreichend großen Hilbert-Raum ausgedrückt werden, mit dem Verständnis, dass alle Observablen eine Blockdiagonale haben Form, die die verschiedenen Direkt-Summanden nicht miteinander mischt. Diese Tatsache ist manchmal nützlich, um Theoreme zu beweisen, und diese Tatsache kann wiederum mit der GNS-Konstruktion bewiesen werden.

Auch hier sind die im OP aufgeführten Axiome I-IV gleich, ob oder nicht H wird als direkte Summe geschrieben, da diese Axiome unabhängig davon sind, welche Darstellung wir für den Hilbert-Raum verwenden.

Ich denke, mit "Subsystem" spielen Sie auf eine Teilmenge von Freiheitsgraden an. Könnten Sie bitte klarstellen, was Sie mit "Subsystem" meinen?
@PiKindOfGuy Ich habe im Abschnitt über Tensorprodukte ein paar weitere Absätze hinzugefügt, darunter ein weiteres Beispiel und eine allgemeine Perspektive. Kurze Antwort: Die konzeptionelle Trennung eines Systems in verschiedene "Teilsysteme" oder "Freiheitsgrade" entspricht einer mathematischen Auswahl von miteinander vertauschten Teilmengen der Menge der Observablen. Observables können auf viele verschiedene Arten in solche Teilmengen organisiert werden, weshalb es so schwierig ist, eine einzelne spezifische Definition von „Subsystem“ oder „Freiheitsgrad“ festzulegen.

Eine sehr kurze und sehr hilfreiche Antwort, nur in Bezug auf die physikalischen Aspekte des Tensorprodukts und der direkten Summe:

Die direkte Summe fügt Hilbert-Räume so hinzu, dass sie voneinander trennbar sind. In Ihrem Hamilton-Operator werden Sie dies als auf den Diagonalen hinzugefügte Blockmatrizen bemerken, die alle auf separate Teile des Vektors von Wellenfunktionen wirken, der Ihr System beschreibt.

Das Tensorprodukt bringt die Dinge durcheinander. Wenn Sie zwei Matrizen tensorieren, schreiben Sie die zweite Matrix vollständig in jeden Matrixeintrag der vorherigen, multipliziert mit der Zahl, die zuvor in diesem Eintrag stand. Jede Matrix hat einen Satz von Eigenzuständen. Sie können nun eine Basis für diese neue Matrix durch "Kombination" der früheren zwei Basen von Eigenzuständen zu einer neuen aufbauen. Mit kombinieren meine ich, dass die Vektoren ähnlich der Matrix aufgebaut sind, in jedem Eintrag der Eigenvektor der ersten Matrix, die Eigenvektoren der zweiten Matrix, multipliziert mit der Zahl, die vorher in diesem Eintrag stand. Diese neue Basis ist keine Basis von Eigenvektoren mehr.

Letzteres ist jetzt auf Ersteres reduzierbar, dh Sie können Letzteres in blockdiagonale Form bringen, um Ihr System in mehrere Subsysteme zu trennen.

Anwendung: Sie wollen zwei Spin-1/2-Teilchen in einem System beschreiben. Jedes Teilchen hat die Zustände |oben>, |unten>.

Der Hilbert-Raum, den Sie aus dem TENSORPRODUKT abrufen, hat die Zustände, die man typischerweise als |up>|up>,|up>|down>,|down>|up>,|down>|down> bezeichnet. Dies sind wirklich die Tensorprodukte der ursprünglichen Zustände. Angenommen, ich wähle eine Basis |oben>=(1,0), |unten>=(0,1), dann ist |oben>|unten> |oben> x |unten> = (1*(0,1), 0*(0,1)) = (0,1,0,0). Ich habe das Tensorprodukt mit "x" bezeichnet, weil ich nicht weiß, wie ich hier weiterschreiben soll.

Aber wie wir wissen, können wir das Problem in ein System von Spin 1 und Spin 0 zerlegen, wobei das Spin 1-System 3-dimensional ist (Sz-Eigenwerte: 1,0,-1) und das Spin 0-System 1-dimensional ist (Sz -Eigenwerte: 0). Warum unterscheiden wir „Spin 1“- und „Spin 0“-Systeme? Weil dies die Systeme (oder die Sammlung von Vektoren) sind, die entweder den Eigenwert S = 1 (weil S ^ 2 * Spin-1-Eigenvektor = 2 = S * (S + 1) -> S = 1) und S ergeben =0 (weil S^2 * Spin-0-Eigenvektor = 1 = S*(S+1) -> S=0).

Wenn jemand diese Antwort besser formatieren möchte, machen Sie weiter.

Sie können aus den vier Postulaten, die Sie aufgelistet haben, nicht wirklich ableiten, wann die direkte Summe und wann das Tensorprodukt verwendet werden soll, da diese Postulate ein einzelnes System beschreiben und die Existenz eines Hilbert-Raums voraussetzen H das beschreibt dieses System. Die Natur des Hilbert-Raums wird im Allgemeinen nur postuliert und kann selten ohne zusätzliche Annahmen abgeleitet werden. Zum Beispiel gibt es keine Möglichkeit abzuleiten, dass ein gegebenes Vielteilchensystem bosonisch oder fermionisch (oder keines von beidem) ist, was grundsätzlich eine Eigenschaft des Hilbert-Raums ist, ohne weitere Annahmen wie die Lorentz-Invarianz zu treffen.

Wie in den Antworten auf diese doppelte Frage besprochen , spielt die Born-Regel jedoch besser mit Tensorprodukten als mit direkten Summen. Wenn Sie einen Zustand eines Systems als Tensorprodukt zweier anderer Zustände ausdrücken können, dann zählt jeder dieser Faktorzustände gemäß den Postulaten auch als „System“, was unserer intuitiven Vorstellung davon entspricht, wie „Systeme“ funktionieren sollten. Ich denke, je nach Ihrer philosophischen Sichtweise auf das, was als "System" gilt, ist dies entweder ein Beweis oder eine starke Motivation für das Tensorprodukt als das richtige Mittel zum Kombinieren von "Teilsystemen".

Aber um knzhous Kommentare abzuschütteln, sei darauf hingewiesen, dass diese „Warum“-Fragen in der Quantenmechanik immer sehr schwer zu beantworten sind. Das liegt daran, dass viele Ergebnisse in der Quantenmechanik auf sehr zufriedenstellende Weise zusammenpassen, aber es ist nicht unbedingt offensichtlich, welche die grundlegendsten sind:

  • Die Born-Regel
  • Subsysteme von Systemen selbst gehorchen denselben Regeln
  • Die Tatsache, dass das Tensorprodukt der geeignete Weg ist, um Teilsysteme miteinander zu kombinieren
  • Die Tatsache, dass physikalische Zustände im Hilbert-Raum natürlich eher Strahlen als Vektoren entsprechen
  • [Bedeutend tiefer in das Unkraut] die Tatsache, dass das Feld der Skalare eher die komplexen als die reellen Zahlen sind

Das Modifizieren einer dieser Tatsachen neigt dazu, alle anderen sofort zu brechen, während es immer noch zu einer logisch konsistenten Theorie führt. (Der letzte Fall ist ein Sonderfall; er kann modifiziert werden, während die anderen intakt bleiben, obwohl die daraus resultierende Theorie wohl weniger natürlich ist.) Daher ist es sehr schwierig, „Warum“-Fragen im Allgemeinen zu beantworten.

Es hat viel Mühe gekostet, eine Vorstellung davon zu bekommen, was "Hilbert-Raum" und Tensorprodukte in der Quantenmechanik wirklich bedeuten.

Persönlich denke ich, dass Erklärungen, die auf dem "Tensorproduktformalismus" beruhen, am schlechtesten für das Verständnis sind. Es gibt keine Intuition und verwandelt den Lernenden in einen Plug-and-Chug-Affen.

Das Konzept, das die Dinge für mich zum Klicken brachte, ist ein sorgfältiges Schreiben dessen, was die Wellenfunktion darstellt:

Die Wellenfunktion stellt einen (komplexen) Wert dar, der (quadriert) die Wahrscheinlichkeit eines MÖGLICHEN AUSGANGSZUSTANDS beschreibt .

Es klingt offensichtlich, aber das ist die Schlüsselidee: Möglichen Ausgangszuständen werden Wahrscheinlichkeiten zugeordnet.

Nun ist es sehr natürlich zu sehen, was in vielen Teilchenzuständen passiert:

Wenn ich eine vom Staat beschriebene "Quantenmünze" habe Ψ = ( P H | H + P T | T ) .

Und ich werfe zwei dieser Münzen, was ist der Ausgangszustand?

Nun ist mit normaler Wahrscheinlichkeit klar, dass die Ausgabemöglichkeiten für das Werfen von zwei Münzen sind:

HH, HT, TH und TT (4 Ausgangszustände)

Und das verdoppelt sich für jede Münze, die wir hinzufügen! Noch eins hinzufügen:

HHH, HHT, HTH, HTT, TTT, THT, THH, TTH (8 Ausgangszustände)

Nun muss im Quantenfall jeder dieser Möglichkeiten eine eigene Wahrscheinlichkeitsamplitude zugeordnet werden (und hat das Potenzial, Interferenzen zu verursachen!)

Wenn wir nun zwei Quantenmünzen völlig unabhängig voneinander werfen, stellen wir fest, dass zwischen den Münzen keine Korrelation bestehen sollte und dass es genauso aussehen sollte wie im klassischen Fall.

P ( H H ) = P H P H P ( H T ) = P H P T P ( T H ) = P T P H P ( T T ) = P T P T

Nun gibt es einen linearen Operator, der zwei Zustände annehmen wird Ψ 1 = ( P H | H 1 + P T | T 1 ) Und Ψ 2 = ( P H | H 2 + P T | T 2 ) und sie in den richtigen kombinierten Möglichkeitsraum umwandeln, der unabhängige Wahrscheinlichkeiten ergibt? Das ist das Tensorprodukt!!

Ein Tensorprodukt wird verwendet, um Zustände zu beschreiben, die unabhängig sind. Und genau deshalb ist Verschränkung genau dann, wenn ein gegebener Zustand NICHT durch ein solches Tensorprodukt beschrieben werden kann.

Geben Sie also ein Beispiel, wenn Sie einige Ausgabemöglichkeiten haben, wie: C 1 | H 1 | H 2 + C 2 | H 1 | T 2 + C 3 | T 1 | H 2 + C 4 | T 1 | T 2

Wenn Sie es nicht so vereinfachen können, dass es die Form hat ( A | H 1 + B | T 2 ) ( C | H 3 + D | T 4 )

Dann wissen Sie, dass Ihr Staat nicht „unabhängig“ ist (und per Definition verstrickt ist).

Ich denke, dass dieses Verschränkungsbeispiel oft als getrennt von dem angesehen wird, was diese Tensorprodukte darstellen, und ich denke, dass dies ein Fehler ist - ich konnte diesem Zeug keinen Sinn geben, bis ich schließlich diese Denkweise gefunden habe.

Eine letzte Anmerkung: Oft sagen Leute so etwas wie:

Für einen Zustand 1 (vorhanden in H 1 ) und einen Zustand 2 (vorhanden in H 2 ) Verschränkung existiert im Raum H 1 H 2 . Diese Sprache ist sehr verwirrend, aber leider weit verbreitet und wird selten erklärt. Der "Hilbertraum" H 1 H 2 stellt einfach den Satz von Wahrscheinlichkeitsamplituden dar, die dem Kombinationsausgabezustand zugeordnet werden könnten. In unserem Beispiel mit 2 Quantenmünzen hätten wir einen Raum von H 1 H 2 ( | H 1 + | T 1 ) ( | H 2 + | T 2 ) ( | H 1 | H 2 + | H 1 | T 2 + | T 1 | H 2 + | T 1 | T 2 ) In diesem Fall verwenden wir diese Notation eher als "Trick", um unsere Kets zusammenzumischen, damit wir den Raum erhalten, der den größeren Möglichkeitsraum beschreibt!