Matrixdiagonalisierung in SU(2) und SO(3)

Ich verwende derzeit Nadri Jeevanjees Buch über Gruppentheorie für Physiker, um die Quantenmechanik zu verstehen. Ich bin auf diese beiden Seiten gestoßen , die mich stecken ließen:

Beispiel 4.19 S U ( 2 ) und S Ö ( 3 )

In den meisten Physiklehrbüchern wird der Zusammenhang zwischen S Ö ( 3 ) und S U ( 2 ) wird mit Begriffen der „Infinitesimal-Generatoren“ dieser Gruppen beschrieben. Wir werden im nächsten Abschnitt infinitesimale Transformationen diskutieren und dann mit der Standardpräsentation der Physik in Kontakt treten; hier stellen wir die Beziehung in Form eines Gruppenhomomorphismus dar ρ : S U ( 2 ) S Ö ( 3 ) , definiert wie folgt: betrachte den Vektorraum (Überprüfung!) von all 2 × 2 spurlose antihermitische Matrizen, bezeichnet als s u ( 2 ) (aus Gründen, die wir später erläutern werden). Sie können das ein beliebiges Element überprüfen X s u ( 2 ) kann geschrieben werden als

(4.39) X = 1 2 ( ich z j ich x j ich x ich z ) , x , j , z R
Wenn wir als Basis Vektoren nehmen
S x = ich 2 σ x = 1 2 ( 0 ich ich 0 ) S j = ich 2 σ j = 1 2 ( 0 1 1 0 ) S z = ich 2 σ z = 1 2 ( ich 0 0 ich )
dann haben wir
X = x S x + j S j + z S z
also der entsprechende Spaltenvektor X in der Grundlage B = { S x , S j , S z } ist
[ X ] = ( x j z ) .

Beachten Sie, dass

det X = 1 4 ( x 2 + j 2 + z 2 ) = 1 4 X 2
also die Determinante von X s u ( 2 ) ist proportional zum Quadrat der Norm [ X ] R 3 mit der üblichen euklidischen Metrik. Jetzt werden Sie das unten überprüfen EIN S U ( 2 ) wirkt auf X s u ( 2 ) durch die Karte X EIN X EIN , und dass diese Abbildung linear ist. Somit ist diese Abbildung ein linearer Operator auf s u ( 2 ) , und kann in der Basis dargestellt werden B durch eine 3 × 3 Matrix, die wir nennen werden ρ ( EIN ) , damit [ EIN X EIN ] = ρ ( EIN ) [ X ] wo ρ ( EIN ) wirkt auf [ X ] durch die übliche Matrixmultiplikation. Außerdem,
(4.40) ρ ( EIN ) [ X ] = [ EIN X EIN ] 2 = 4 det ( EIN X EIN ) = 4 det X = [ X ] 2
damit ρ ( EIN ) bewahrt die Norm von X . Dies impliziert (siehe Übung 4.19 unten), dass ρ ( EIN ) Ö ( 3 ) , und das kann man tatsächlich zeigen det ρ ( EIN ) = 1 , damit ρ ( EIN ) S Ö ( 3 ) . So können wir eine Karte konstruieren
ρ : S U ( 2 ) S Ö ( 3 ) EIN ρ ( EIN )

Außerdem, ρ ist ein Homomorphismus, da

ρ ( EIN B ) [ X ] = [ ( EIN B ) X ( EIN B ) ] = [ EIN B X B EIN ] = ρ ( EIN ) [ B X B ] (4.41) = ρ ( EIN ) ρ ( B ) [ X ]
und daher ρ ( EIN B ) = ρ ( EIN ) ρ ( B ) . Ist ρ ein Isomorphismus? Das kann man zeigen ρ ist on, aber nicht eins zu eins, und hat tatsächlich einen Kernel K = { ich , ich } . Aus der Diskussion vor diesem Beispiel wissen wir das dann ρ ( EIN ) = ρ ( EIN )   EIN S U ( 2 ) (Diese Tatsache geht auch aus der Definition von hervor ρ ), also für jede Umdrehung R S Ö ( 3 ) dort entsprechen genau zwei Matrizen in S U ( 2 ) zu welcher Karte R unter ρ . Also beim Versuch, eine Rotation umzusetzen R auf einer Drehung 1 / 2 Partikel haben wir zwei Möglichkeiten für die S U ( 2 ) Matrix verwenden wir, und es wird manchmal gesagt, dass die Karte ρ 1 ist zweitrangig . Mathematisch gesprochen spricht man aber normalerweise nicht von Funktionen mit mehreren Werten, also sagen wir das S U ( 2 ) ist die doppelte Abdeckung von S Ö ( 3 ) , da die Karte ρ ist on ('cover') und two-to-one ('double').

Ich habe folgende Fragen:

  1. Ich wurde zuvor in den Prozess der Diagonalisierung von Matrizen eingeführt. Was ich nicht verstehe, ist in diesem Fall, was diagonalisiert wird, X oder EIN ?

  2. Ist die endgültige Matrix in S Ö ( 3 ) oder S U ( 2 ) ?

  3. Entspricht dieser Diagonalisierungsprozess einem Basiswechsel und wenn ja, welchen Sinn hat ein Basiswechsel?

  4. Welche Zuordnung entspricht X als Vektor in der Basis dargestellt wird { S x , S j , S z } ?

  5. Außerdem verstehe ich einfach nicht, was die 2-zu-1-Zuordnung bedeutet?

  6. Das verstehe ich auch X ist eine Lie-Algebra und um ihre Lie-Gruppe zu finden, müssen Sie sie potenzieren: e X Ich habe in einem Mathematikbuch gelesen, dass dieser Prozess auch eine Diagonalisierung beinhaltet. Aber ich verstehe einfach nicht den ganzen Prozess und die Beziehung zwischen Lie-Algebren und Lie-Gruppen. Warum muss zwischen den beiden gewechselt werden?

Erste, X ist keine Lie-Algebra; es ist ein Element der Lie-Algebra su(2). Als nächstes ist die Struktur der Lie-Algebra hier völlig irrelevant; wichtig ist nur, dass su(2) ein dreidimensionaler reeller Vektorraum ist. Dritter, EIN ist ein Element von S U ( 2 ) , sondern wirkt (orthogonal) auf s u ( 2 ) . Dies definiert eine Karte ρ : S U ( 2 ) S Ö ( 3 ) . Ich verstehe nicht, was "die endgültige Matrix" bedeutet oder was "dem Mapping entspricht X dargestellt als..." bedeutet. Die 2-zu-1-Abbildung ist die Abbildung ρ .
Wo liegt die Matrix, die Sie nach dem Diagonalisierungsprozess erhalten?
Welcher Diagonalisierungsprozess?
EIN X EIN 1
und was wird hier diagonalisiert? ich verstehe das
EIN = EIN 1
in unitären Matrizen
X und EIN X EIN 1 ausschlafen s u ( 2 ) , der ein reeller 3-D-Vektorraum ist. Was "was diagonalisiert wird" betrifft, sind Sie der einzige, der daran interessiert zu sein scheint, etwas zu diagonalisieren, also sind Sie der einzige, der wissen kann, wovon Sie sprechen.
Übrigens kann man das umgehen s u ( 2 ) komplett durch Vermietung S U ( 2 ) wirken auf den (3-d reellen) Vektorraum v von rein imaginären Quaternionen. Identifizieren Sie dazu S U ( 2 ) mit allen Einheitsquaternionen, indem man die Matrix mit der obersten Reihe nimmt ( P , Q ) zum Quaternion P + Q j . Jetzt S U ( 2 ) wirkt auf v durch Konjugation. Ob Sie es vorziehen v oder s u ( 2 ) liegt an Ihnen; Alles, was Sie brauchen, ist ein 3-D-Vektorraum S U ( 2 ) Zu handeln.
Als Antwort auf Ihre Bearbeitung: 1) Weder noch. 2) Welche endgültige Matrix? 3) Welcher Diagonalisierungsprozess? 4) Die Zuordnung aus s u ( 2 ) zu R 3 das macht X zu seiner Darstellung in der Basis S x , S j , S z . 5) Eine Abbildung ist 2-zu-1, wenn das inverse Bild jedes Punktes die Kardinalität 2 hat. 6) X ist keine Lie-Algebra.
Dies ist möglicherweise keine gute Idee, da sich die Matrix als gefährlich erwiesen hat.

Antworten (4)

Hier wird nichts diagonalisiert. Die Passage, die Sie zitieren, verwendet die Notation

EIN X EIN = EIN X EIN 1
(seit EIN ist unitär), was oft bei Diagonalisierungsproblemen vorkommt, aber die Transformation ist viel umfassender. Diese Art der Verwandlung,
EIN B EIN B 1 ,
wird als Matrixähnlichkeitstransformation bezeichnet , und zwei Matrizen EIN und C sind genau dann ähnlich , wenn es eine invertierbare Matrix gibt B so dass C = B EIN B 1 .

Diagonalisierung ist der Prozess, eine Matrix zu nehmen EIN und Finden einer Matrix C was ähnlich ist EIN und auch diagonal.

Die Verwendung von Ähnlichkeit als Beziehung und Transformation geht jedoch weit über eine bloße Diagonalisierung hinaus - im Wesentlichen sind zwei Matrizen genau dann ähnlich, wenn sie dieselbe lineare Karte auf zwei verschiedenen Basen darstellen. Daher wird eine breite Palette von Matrixeigenschaften durch Ähnlichkeit bewahrt (gut zusammengefasst im obigen Wikipedia-Link), was einen Teil dessen ausmacht, was die Beziehung so nützlich macht.

Die Lie-Algebra-Struktur von s u ( 2 ) ist hier völlig irrelevant; alles was zählt ist das s u ( 2 ) ist ein dreidimensionaler reeller Vektorraum, vergiss also zunächst die Lie-Algebren.

Ein Element EIN S U ( 2 ) wirkt auf diesen 3-D-Vektorraum durch Abbildung X zu EIN X EIN 1 .

Also ein Element EIN ( P Q Q ¯ P ¯ ) in S L ( 2 ) kann als reelle 3-mal-3-Matrix dargestellt werden ρ ( EIN ) . Es wäre eine sehr sehr gute Übung für Sie, eine explizite Formel dafür aufzuschreiben ρ ( EIN ) bezüglich P und Q --- nicht, dass das Endergebnis wichtig wäre, aber dies wird in Ihrem Kopf genau festlegen, was hier vor sich geht. Beginnen Sie natürlich mit der Berechnung des Wie EIN wirkt auf jeden der drei bekannten Basisvektoren z s u ( 2 ) ; das sind die Spalten von ρ ( EIN ) .

Überprüfen Sie das abschließend ρ ( EIN ) ist in S Ö ( 3 ) , Sie haben also abgebildet S U ( 2 ) zu S Ö ( 3 ) . Das wird offensichtlich sein EIN und EIN Gehen Sie an denselben Ort, sodass die Zuordnung (mindestens) zwei zu eins ist. Sie können weiter überprüfen, ob es genau zwei zu eins ist.

Optionaler nächster Schritt: In Ihrem Kopf die Idee zu fixieren, dass nichts darüber ist s u ( 2 ) abgesehen von seiner 3-Dimensionalität, identifizieren EIN mit Quaternion P + Q j und lassen Sie es über Konjugation auf den realen 3-D-Vektorraum von rein imaginären Quaternionen wirken. Dies ist ein anderer Weg zum gleichen Ergebnis und hat eindeutig nichts mit Lie-Algebren zu tun.

Schließlich verstehe ich keine Ihrer Fragen zur Diagonalisierung oder warum Sie so eifrig darauf bedacht sind, etwas zu diagonalisieren. Da Sie derjenige sind, der die Diagonalisierung auf den Tisch bringt, können nur Sie wissen, was Sie diagonalisieren möchten oder warum.

Ich verstehe nicht wirklich, wie dies die in den Kommentaren geklärte Frage beantwortet - ehrlich gesagt scheint dies das OP eher zu verwirren als zu helfen.
@EmilioPisanty: Das OP ist über so viele Dinge verwirrt, dass es wahrscheinlich hoffnungslos ist, sie alle auf einmal anzusprechen. Aber ich denke, das grundlegende Problem ist, dass er keine Ahnung hat, was der Autor hier zu erreichen versucht – dh das zu zeigen S U ( 2 ) wirkt orthogonal auf einen 3-D-Realvektorraum und wird so abgebildet S Ö ( 3 ) . Ich denke, dass die Übung, die Aktion explizit aufzuschreiben, einen großen Beitrag zur Klärung (für das OP) leisten würde, was der Sinn von all dem ist
Das Quaternion-Analogon, das WillO erwähnt, ist im letzten Absatz meiner Phys.SE-Antwort hier skizziert .
  1. Kurz gesagt, der erste Hauptpunkt ist, dass es (bis auf einige konventionelle Konstanten) einen isometrischen Lie-Algebra-Isomorphismus gibt X [ X ] zwischen

    • die dreidimensionale Lie-Algebra ( s u ( 2 ) , [ , ] , det ( ) ) des spurlosen Anti-Hermitianers 2 × 2 Matrizen, die mit der Determinante als Normquadrat ausgestattet sind, und

    • der 3D-Raum ( R 3 , × , | | 2 ) ausgestattet mit dem Standardvektorkreuzprodukt und dem Standardnormquadrat.

    (Die Struktur der Lie-Algebra spielt im Folgenden keine Rolle, es genügt also, an die Abbildung zu denken X [ X ] als isometrischer Vektorraum-Isomorphismus.)

  2. Der zweite entscheidende Punkt ist nun der für jedes Gruppenelement EIN S U ( 2 ) , die Karte ρ ( EIN ) : R 3 R 3 (die Nadri Jeevanjee oben definiert) ist eine lineare Isometrie . Daher ist es eine orthogonale Transformation im 3D-Raum R 3 , die durch a dargestellt werden kann 3 × 3 orthogonale Matrix (wobei wir die standardmäßige orthonormale Basis in verwenden R 3 ). Mit anderen Worten, die Karte ρ ist eine Karte von S U ( 2 ) zu Ö ( 3 ) .

  3. Das Obige kann nun verschärft werden, um dies zu zeigen S U ( 2 ) ist eine doppelte Abdeckung von S Ö ( 3 ) . Es wird nirgends eine Diagonalisierung verwendet, vgl. OPs Fragen.

Gegeben sei eine Wellenfunktion ψ = ψ ( r ) als Funktion eines Positionsvektors r = ( x , j , z ) im Raum hängen Drehungen des Ortsvektors letztlich nur von zwei Parametern ab ϕ und θ , wie man sieht, indem man ausdrückt

r = x ich ^ + j j ^ + z k ^
in sphärischen Polarkoordinaten
r = r Sünde ( θ ) cos ( ϕ ) ich ^ + r Sünde ( θ ) Sünde ( ϕ ) j ^ + r cos ( θ ) k ^ .
Wie können wir Drehungen eines dreidimensionalen Vektors in einem zweidimensionalen Raum darstellen? Nun, mit
R 3 = R × C
wir könnten Vektoren der Form betrachten
( x , j , z ) ( z , x + ich j ) .
Können wir in diesem neuen Raum Rotations- und Reflexionsmatrizen erstellen? Unter Verwendung der hier ausgedrückten Form dieser Matrizen und unter Verwendung von orthonormalen Vektoren, um die Spalten einer Rotationsmatrix zu bilden, nehmen wir die Spezifizierung des Einheitsvektors r :
n r = ( n x , n j , n z ) ( n z , n x + ich n j )
und verwenden Sie solche Vektoren, um unsere Rotation aufzubauen
[ n z ( n x + ich n j ) n x + ich n j n z ]
und Reflexion
[ n z n x ich n j n x + ich n j n z ]
Matrizen in diesem neuen Raum. Wie es üblich ist, wenn wir von einem Lie-Gruppenelement ausgehen e T zur Lie-Algebra e T = ich + T wir wollen es in die Form bringen e ich T ' = ich + ich T ' damit e T = e ich ( ich T ) = e ich T ' = ich ich T ' , also bei gegebenen obigen Matrizen addieren wir 1 = ich ich dazu, so dass unsere Reflexionsmatrix wird
ich [ ich n z n j ich n x n j ich n x ich n z ]
geben die
[ ich n z n j ich n x n j ich n x ich n z ]
in deinem Beitrag. Jetzt, ( n x , n j , n z ) ein Einheitsvektor ist, wenn wir wollen
( n x , n j , n z ) = ich ^ = ( 1 , 0 , 0 )
wir bekommen, bevor wir hinzufügen 1 = ich ich :
( n x , n j , n z ) = ich ^ = ( 1 , 0 , 0 ) σ x = [ 0 1 1 0 ]
ähnlich
( 0 , 1 , 0 ) = j ^ σ j = [ 0 ich ich 0 ]
und ähnlich für σ z , daraus kommst du leicht ich σ x , ich σ j , ich σ z . Die 1 2 Normalisierung kommt von der Ausarbeitung der Kommutierungsbeziehungen (glaube ich), überprüfen Sie das selbst. Beachten Sie, dass ich orthonormale Spaltenvektoren verwendet habe, dies aber nicht erforderlich war.

Also wenn r = ( x , j , z ) wird vertreten durch X = [ ich z j ich x j ich x ich z ] , können wir eine Rotation darstellen r durch eine andere Matrix EIN in diesem Raum wirkt auf X von

X ' = EIN X EIN +
und wir wissen, dass dies eine Rotation darstellt, weil
det ( X ' ) = det ( EIN X EIN + ) = det ( X )
behält die Länge des Vektors bei r , die die Determinante dieser Matrix ist.

Also haben wir jetzt 4. in Ihrer Liste beantwortet und die Idee von 6. veranschaulicht, über die Sie hier vollständig lesen können , los geht's mit 5.:

Die 2-1-Abbildung der doppelten Abdeckung ergibt sich aus dem Folgenden: Beachten Sie die sphärische Koordinatendarstellung

r = r Sünde ( θ ) cos ( ϕ ) ich ^ + r Sünde ( θ ) Sünde ( ϕ ) j ^ + r cos ( θ ) k ^
nimmt eine Orientierung an, wenn wir uns drehen. Mit anderen Worten, eine Rotationsmatrix wird durch zwei orthonormale Basisvektoren angegeben, und diese sind auf eine bestimmte Weise orientiert (denken Sie an die Rechte-Hand-Regel), aber es gibt keinen Grund, warum wir nicht von der entgegengesetzten Orientierung hätten ausgehen können. Dieser Vektor ist der Effekt eines Elements von S Ö ( 3 ) auf einem Positionsvektor, aber meine Konstruktion eines 2-D-Raums zur Darstellung von 3-D-Rotationen ermöglicht es, dass beide Orientierungen in diesem Raum leben, also wenn
X ' = EIN X EIN +
ist der Effekt einer Drehung mit der obigen Ausrichtung, können wir sagen
X ' = ( EIN ) X ( EIN ) +
ist die Wirkung einer Drehung mit entgegengesetzter Orientierung, aber
X ' = ( EIN ) X ( EIN ) + = EIN X EIN +
Sie haben also zwei Rotationen, die demselben Element zugeordnet sind, doppelte Abdeckung!

Vieles davon ist hier und in diesem Buch zusammengefasst .