Was bedeuten die Pauli-Matrizen?

Alle Einführungen, die ich bisher zu Pauli-Matrizen gefunden habe, geben sie einfach an und beginnen dann, sie zu verwenden. Begleitende Beschreibungen ihrer Bedeutung scheinen frustrierend unvollständig; Ich zumindest kann Pauli-Matrizen nach dem Lesen überhaupt nicht verstehen.

Mein aktuelles Verständnis und meine Verwirrung werden unten gezeigt. Ich wäre sehr dankbar, wenn jemand alle Löcher füllen könnte, oder gegebenenfalls neue stechen könnte.

Spinoren sehen aus wie Spaltenvektoren, dh

s = ( 1 0 1 )
und werden verwendet, damit die Drehung in drei Dimensionen (unter Verwendung komplexer Zahlen) linear transformiert werden kann. Was bedeutet der obige Beispiel-Spinor? Ein Spinwert von 1 in x- und z-Richtung? Wie kann Spinn- 1 2 dann mit nur 1s dargestellt werden?

Ein dreidimensionaler Vektor wird verwendet, um die Pauli-Matrix für jede Dimension zu konstruieren. Zum Beispiel für Spin- 1 2 , die für x, y und z verwendeten Vektoren sind v x = ( 1 , 0 , 0 ) , v j = ( 0 , 1 , 0 ) und v z = ( 0 , 0 , 1 ) . Sie wandeln sie jeweils durch die folgende Gleichung in die relevante Pauli-Matrix um, wobei Sie zur Demonstration die Dimension x verwenden.

P x = ( v 3 x v 1 x ich v 2 x v 1 x + ich v 2 x v 3 x )
wobei der hochgestellte Wert für Dimension steht, nicht für Kraft.

Sobald Sie diese Matrizen haben, operieren Sie mit ihnen an den Spinoren. Was bewirkt das?

Sie können auch die Eigenwerte und Eigenvektoren für die Matrix finden, die verwendet werden können, um die Wahrscheinlichkeit zu finden, dass ein Teilchen, wenn es mit einem bestimmten Spin in einer Dimension gemessen wird, bei der nächsten Messung einen Spin in einer anderen von Ihnen gewählten Dimension hat. Ich verstehe nicht, wie das funktioniert. Was stellen Eigenwert und Eigenvektor in diesem Sinne physikalisch dar und wie passen Spin up und down dazu? Wenn Sie z. B. ein Spin-1-Teilchen hätten, von dem Sie wüssten, dass es in der x-Richtung einen Spin nach oben hat, was würden Sie tun, um die Wahrscheinlichkeit zu ermitteln, dass es bei der nächsten Messung in der z- oder y-Dimension einen Spin nach oben oder unten hat?

Konkrete Beispiele würden meinem Verständnis wahrscheinlich sehr helfen.

Ist das das richtige Verständnis? Pauli[x]=Kippe den Spin auf der x-Achse in der z-Basis (eine Rotationsmatrix - Werte tauschen) Pauli[y]=drehe den Spin auf der y-Achse in der z-Basis Pauli[z]=drehe den Spin auf der z-Achse in der z-Basis (Flip-Matrix – Spin + ist positiv, Spin – ist negativ)

Antworten (4)

Lassen Sie mich zunächst an einige Aspekte der Quantenmechanik im Allgemeinen als Modell für physikalische Systeme erinnern (oder Ihnen vielleicht eine Einführung geben). Mir scheint, dass viele Ihrer Fragen mit einem besseren Verständnis dieser allgemeinen Aspekte beantwortet werden können, gefolgt von einem Hinweis darauf, wie Spinsysteme als Spezialfall entstehen.

Allgemeine Bemerkungen zu Quantenzuständen und Messung.

Der Zustand eines Quantensystems wird als Einheitslängenelement modelliert | ψ eines komplexen Hilbertraums H , eine spezielle Art von Vektorraum mit einem Skalarprodukt. Jede beobachtbare Größe (wie Impuls oder Spin), die mit einem solchen System verbunden ist, dessen Wert man messen möchte, wird durch einen selbstadjungierten Operator dargestellt Ö auf diesem Raum. Wenn man ein Gerät baut, um eine solche Observable zu messen, und wenn man dieses Gerät verwendet, um eine Messung dieser Observablen auf dem System durchzuführen, dann gibt die Maschine einen Eigenwert aus λ davon beobachtbar. Darüber hinaus, wenn das System in einem Zustand ist | ψ , dann ist die Wahrscheinlichkeit, dass das Ergebnis der Messung dieser Größe der Eigenwert der Observablen ist

p ( λ ) = | λ | ψ | 2
wo | λ ist der normalisierte Eigenvektor, der dem Eigenwert entspricht λ .

Spezialisierung auf Spinsysteme.

Nehmen wir nun an, dass das System, das wir betrachten, aus dem Spin eines Teilchens besteht. Der Hilbert-Raum, der den Spinzustand eines Systems mit Spin modelliert s ist ein 2 s + 1 dimensionaler Hilbertraum. Elemente dieses Vektorraums werden oft als "Spinoren" bezeichnet, aber lassen Sie sich davon nicht ablenken, sie sind genau wie jeder andere Vektor in einem Hilbert-Raum, dessen Aufgabe es ist, den Quantenzustand des Systems zu modellieren.

Die primären Observablen, deren Messung man üblicherweise für Spinsysteme diskutiert, sind die kartesischen Komponenten des Spins des Systems. Mit anderen Worten, es gibt drei herkömmlich genannte selbstadjungierte Operatoren S x , S j , S z deren Eigenwerte die möglichen Werte sind, die man erhalten könnte, wenn man eine dieser Komponenten des Spins des Systems misst. Das Spektrum (Satz von Eigenwerten) jedes dieser Operatoren ist gleich. Für ein Spin-System s , besteht jedes ihrer Spektren aus den folgenden Werten:

σ ( S ich ) = { m ich | m ich = s , s + 1 , , s 1 , s }
wo in meiner Notation ich = x , j , z . Also zum Beispiel wenn man eine Maschine baut um das zu messen z Bestandteil des Spins eines Spin- 1 System, dann liefert die Maschine einen der Werte im Satz { , 0 , } jedes Mal. Zu jedem dieser Eigenwerte hat jeder Spinkomponentenoperator einen normierten Eigenvektor | S ich , m ich . Wie durch die obigen allgemeinen Bemerkungen angegeben, wenn der Zustand des Systems ist | ψ , und man möchte die Wahrscheinlichkeit wissen, dass die Messung der Spinkomponente S ich ergibt einen bestimmten Wert m ich , dann rechnet man einfach
| S ich , m ich | ψ | 2 .
Wenn das System zum Beispiel Spin- 1 , und wenn man die Wahrscheinlichkeit wissen will, dass eine Messung von S j ergibt den Eigenwert , dann rechnet man
| S j , 1 | ψ | 2

Spinoren.

Im obigen Zusammenhang sind Spinoren einfach die Matrixdarstellungen von Zuständen eines bestimmten Spinsystems in einer bestimmten geordneten Basis, und die Pauli-Spinmatrizen sind bis auf eine Normalisierung die Matrixdarstellungen der Spinkomponentenoperatoren in dieser Basis speziell für a System mit Spin- 1 / 2 . Matrixdarstellungen erleichtern oft die Berechnung und das konzeptionelle Verständnis, weshalb wir sie verwenden.

Nehmen wir expliziter an, man betrachte einen Spin- 1 / 2 System, und man entscheidet sich dafür, Zustände und Observablen in der Basis darzustellen B = ( | S z , 1 / 2 , | S z , 1 / 2 ) bestehend aus den normalisierten Eigenvektoren der z Komponente des Spins, dann würde man in dieser Basis die folgenden Matrixdarstellungen finden

[ S x ] B = 2 ( 0 1 1 0 ) = 2 σ x [ S j ] B = 2 ( 0 ich ich 0 ) = 2 σ j [ S z ] B = 2 ( 1 0 0 1 ) = 2 σ z
Beachten Sie, dass diese Darstellungen genau die Pauli-Matrizen bis auf das Extra sind / 2 Faktor. Außerdem würde jeder Zustand des Systems durch a dargestellt 2 × 1 Matrix oder "Spinor"
[ | ψ ] B = ( a b ) .
Und man könnte diese Darstellungen verwenden, um die oben erwähnten Berechnungen auszuführen.

Vielen Dank; das hat mir sehr beim Verständnis geholfen. Ist es nur eine Konvention, dass die Eigenzustände, die negative Eigenwerte zurückgeben, Spin 'down' und positiven Spin 'up' sind? Um mein Verständnis zu überprüfen, habe ich versucht, das oben verwendete Beispiel zu berechnen: Stimmt es, dass ein Spin-1-Teilchen, das oben in der x-Dimension (Eigenwert hbar) gemessen wird, im normalisierten Zustand <1/2, sqrt ist? (2)/2, 1/2>, und die Wahrscheinlichkeit, dass eine z-Dimensionsmessung nach oben zurückkehrt, ist dann 1/4, die Rückkehr zu Spin Null 1/2 und nach unten 1/4?
+1 Ich mag besonders Ihre "Maschinen" im ersten Absatz - sehr feynmanisch im Geschmack. Ich habe viele Jahre damit gekämpft, QM zu „verstehen“: Die Mathematik und die Lügentheorie waren mir vertraut, aber es hat lange gedauert, bis ich verstanden habe, dass „Operatoren“ nicht nur Operatoren sind, sondern auch ein spezielles Rezept für ihre Interpretation mit sich bringen Modelle von "Messmaschinen". Leider kann ich mich nicht erinnern, ob es die Feynman-Vorlesungen oder Sakurai waren, die die Botschaft durchbrachten, oder ob es tatsächlich eine Mischung aus beidem in meinen Gedanken unter der Dusche oder beim Gehen war, aber das sind, was ich den Leuten jetzt empfehle .

Gruppen sind abstrakte mathematische Strukturen, die durch ihre Topologie (im Fall von kontinuierlichen (Lie-)Gruppen) und die Multiplikationsoperation definiert sind.

Aber es ist fast unmöglich, von abstrakten Gruppen zu sprechen. Deshalb werden normalerweise Elemente von Gruppen auf lineare Operatoren abgebildet, die auf einen Vektorraum wirken v :

g G ρ ( g ) Ende ( v ) ,

wobei G die Gruppe ist, Ende ( v ) steht für Endomorphismen (lineare Operatoren) auf v , und ρ ( g ) ist die Zuordnung. Damit diese Abbildung sinnvoll ist, müssen wir die Gruppenmultiplikation richtig abbilden:

ρ ( g 1 g 2 ) = ρ ( g 1 ) ρ ( g 2 ) .

Auch die Umkehrung wird abgebildet

ρ ( g 1 ) = ρ ( g ) 1

und die Gruppenidentität ist gerecht

ρ ( e ) = Ausweis v .

Dies wird als Repräsentation der Gruppe bezeichnet G . v transformiert sich unter der Darstellung ρ der Gruppe G .

In Ihrem Fall ist die Interessengruppe die Rotationsgruppe in 3 Dimensionen, die normalerweise als SO (3) bezeichnet wird. Unser Ziel ist es, verschiedene Objekte zu finden, die gedreht werden können, dh Darstellungen (und Darstellungsräume) von SO(3).

Eine solche Darstellung ist die definierende Darstellung (die zum Definieren von SO(3) verwendet wird) oder die Vektordarstellung. In diesem Fall v ist nur R 3 und Matrizen aus ρ ( SO(3) ) sind orthogonal 3 × 3 Matrizen mit Einheitsdeterminante:

EIN T EIN = 1 ; det EIN = 1

So können Vektoren in 3 Dimensionen gedreht werden. Das Ergebnis einer solchen Drehung durch g SO(3) wird bestimmt, indem mit dem Operator auf den Anfangsvektor eingewirkt wird ρ ( g ) .

Eine andere Darstellung ist die Spinor-Darstellung. Der Vektorraum ist jetzt zweidimensional und komplex . Das Bild dieser Darstellung besteht aus einheitlichen 2 × 2 mit Einheitsdeterminante:

EIN EIN = 1 ; det EIN = 1.

Diese Darstellung ist nicht so offensichtlich wie die vorherige, da Spinoren etwas sind, was wir im Alltag normalerweise nicht sehen. Aber es kann mathematisch bewiesen werden, dass diese Darstellungen isomorph sind und daher zwei verschiedene Darstellungen derselben Gruppe sind (tatsächlich sind sie homomorph und die Spinor-Darstellung ist die doppelte Abdeckung der Vektordarstellung).

Nun zu den Pauli-Matrizen. Es gibt ein allgemeines Prinzip: für jede Lie-Gruppe G Es gibt einen entsprechenden linearen Raum (Lie-Algebra) mit einer Lie-Klammer (eine antikommutative Operation, die die Jacobi-Identität erfüllt), die eindeutig auf eine Nachbarschaft der Gruppeneinheit von abgebildet wird G . Diese Abbildung wird Exponential genannt.

Sie können also eine beliebige schreiben (nahe genug an der Einheit, um globale topologische Probleme zu vermeiden) 2 × 2 komplexe Matrix aus der Spinordarstellung in Form

EIN = exp [ ich 2 a a σ a ] ,

wo a a sind drei Zahlen, die das Gruppenelement parametrisieren, dessen Darstellung ist EIN , und ich 2 σ a sind die Lie-Algebra-Basis, mit σ a - 3 2 × 2 Pauli-Matrizen. Diese Gleichung gibt ziemlich genau an, wie ein Spinor bei einer beliebigen Drehung transformiert wird.

In der Vektordarstellung gibt es auch eine Lie-Algebra-Basis, die aus 3 besteht 3 × 3 Matrizen.

Es gibt zwei weitere Interpretationen der Pauli-Matrizen, die Sie möglicherweise hilfreich finden, allerdings erst, nachdem Sie die ausgezeichnete physikalische Beschreibung von JoshPhysics verstanden haben . Das Folgende kann eher als "funkige Trivia" (zumindest finde ich sie interessant) über die Pauli-Matrizen verstanden werden als als eine physikalische Interpretation.

1. Als Grundlage für s u ( 2 )

Die erste Interpretation wird unterschiedlich als (i) sie sind Einheitsquaternionen , modulo ein Vorzeichenwechsel und Neuordnung der Definition des Mathematikers dieser Bestien , (ii) als Grundlage für die Lie-Algebra s u ( 2 ) von S U ( 2 ) wenn wir die Exponentialmatrix verwenden, um die Gruppe wiederherzustellen S U ( 2 ) = exp ( s u ( 2 ) ) bis (iii) eine dreidimensionale Verallgemeinerung des Satzes von De Moivre .

Ein allgemeiner, spurloser, 2 × 2 schiefe Hermitesche Matrix H kann eindeutig zerlegt werden als:

(1) H = a x σ x + a j σ j + a z σ z

mit a x , a j , a z R . Diese Matrix erfüllt die charakteristische Gleichung H 2 = θ 2 4 ich d , wo ich d ist der 2 × 2 Identität u θ 2 = a x 2 + a j 2 + a z 2 . Wenn wir also die universell konvergente Matrix-Exponential-Taylor-Reihe einsetzen und dann alle Potenzen von reduzieren H höher als der lineare Term mit der charakteristischen Gleichung, erhalten wir:

(2) exp ( H ) = cos ( θ 2 ) ich d + H ^ Sünde ( θ 2 )

was als Verallgemeinerung von De Moivres Formel für die "reine imaginäre" Einheit angesehen wird

(3) H ^ = a x σ x + a j σ j + a z σ z a x 2 + a j 2 + a z 2

und alle Mitglieder von S U ( 2 ) kann durch eine Exponentialfunktion wie in (2) realisiert werden (aber seien Sie sich bewusst, dass die Exponentialfunktion einer Lie-Algebra, obwohl das Ganze von S U ( 2 ) in diesem Fall ist nicht immer die ganze Lie-Gruppe, es sei denn, letztere ist (i) zusammenhängend und (ii) kompakt). Somit ist jedes Mitglied von S U ( 2 ) kann als "Einheitslängenüberlagerung der Pauli-Matrizen und der Identitätsmatrix zerlegt werden.

Der Grund für den Faktor 2 in der Definition θ / 2 ist bisher mysteriös: Bezeugen Sie, dass wir für die oben genannten Zwecke genauso gut hätten ersetzen können θ / 2 durch θ . Der Grund hängt mit der Beziehung zwischen den Pauli-Matrizen und der himmlischen Sphäre zusammen, auf die ich später noch eingehen werde. Quaternionen stellen Rotationen durch eine Spinor-Karte dar ( ABER , wie Joshphysics rät, lassen Sie sich nicht zu sehr von diesem Wort ablenken); wenn ein Vektor im 3-Raum durch eine rein imaginäre Quaternion der Form dargestellt wird x σ x + j σ j + z σ z , dann sein Bild unter einer Drehung des Winkels θ um eine Achse mit Richtungskosinus γ x , γ j , γ z wird gegeben von:

(4) x σ x + j σ j + z σ z U ( x σ x + j σ j + z σ z ) U ; U = exp ( θ 2 ( γ x σ x + γ j σ j + γ z σ z ) )

Diese Spinorkarte ist ein Beispiel für die Gruppe S U ( 2 ) durch die adjungierte Darstellung aus eigener Kraft wirkende Lie-Algebra. Es kann intuitiv im Sinne einer Dreiecksregel verstanden werden, die Zusammensetzungen zweier Drehungen zu erarbeiten, wie in meinem Diagramm unten skizziert. Die Bögen auf der Einheitskugel stellen eine Drehung um einen Winkel dar, der doppelt so groß ist wie der Winkel, den der Bogen am Ursprung bildet.

Rotationskomposition

Ich erkläre dies ausführlich in Beispiel 1.4 " 2 × 2 Einheitliche Gruppe S U ( 2 ) " auf meiner Webseite "Einige Beispiele für verbundene Lügengruppen" hier .

Es gibt auch meine interaktive Mathematica-Demonstration "The S U ( 2 ) Spinor Map: Rotation Composition by Graphical Quaternion Triangles" auf der Wolfram Demonstrations-Website .

2. Die himmlische Sphäre

Durch Erweitern des dreidimensionalen linearen Raums der Überlagerungen von Pauli-Matrizen (was derselbe ist wie der lineare Raum von spurlos 2 × 2 Schief-Hermitesche Matrizen) in den 4-dimensionalen Raum, der von den Pauli-Matrizen und den Identitätsmatrizen aufgespannt wird, dann jede Transformation aus der Gruppe S L ( 2 , C ) wirkt auf Vektoren der Form t ich d + x σ x + j σ j + z σ z durch dieselbe Spinorabbildung wie in (4). Beschränken wir uns in diesem Raum auf projektive Strahlen, die Gruppe S L ( 2 , C ) , isomorph zur Möbius-Gruppe der Möbius-Transformationen, wirkt auf diesen Strahlenraum genauso wie Möbius-Transformationen (fraktional linear) auf die Riemann-Kugel wirken. S L ( 2 , C ) ist eine doppelte Abdeckung der Lorentz-Gruppe, und Sie können berechnen, wie sich die Sicht eines Raumfahrers ändert, wenn er Lorentz-Transformationen durchläuft. Siehe den Abschnitt "Lorentz-Transformationen" auf der Wikipedia-Seite "Möbius-Transformation" für weitere Details.

Eine allgemeine mechanische Erklärung. Felder und Wellen folgen hyperbolischen Gleichungen (Wellengleichungen). Diese stellen den Fortschritt in Raum und Zeit dar und können als solche keine Masse darstellen, die stationär sein muss, sondern sich auch drehen könnte. Eine solche Bewegung benötigt eine elliptische Gleichung. Beispielsweise ist die Kline-Gordon-Gleichung hyperbolisch, während die Dirac-Gleichung elliptisch ist. In einem strömenden Fluid gibt es ein paralleles Beispiel. Wirbel und Turbulenzen können sich nicht ohne die Hilfe einer Begrenzung bilden, um die Strömung davon abzuhalten, in den zirkulierenden Zustand überzugehen. Der erste Bereich ist hyperbolisch und der zweite elliptisch.

Um nun ein Teilchen (Spinnenergie) aus einem Feld (in Position bewegen) zu erzeugen, müssen wir die Richtung des Feldes ablenken / drehen. Hier helfen die Pauli-Matrizen und sorgen für die erforderliche Elliptizität. Aus diesem Grund werden imaginäre Zahlen/Rotation verwendet. Die Multiplikation einer Größe mit i dreht sie um 90 Grad, für einen allgemeinen Winkel verwenden wir die Exponentialfunktion einer imaginären Größe.

Später, wenn wir die Lagrangians von Wellen und Teilchen in einem allgemeineren Modell mischen, kehren wir zur Verwendung von Higgs zurück, um die gleiche Aufgabe zu erledigen, nämlich von einer Energieart in die andere umzuwandeln – das heißt von Feldern zu Teilchen und umgekehrt.