Ist die Unterscheidung zwischen kovarianten und kontravarianten Objekten nur der Bequemlichkeit der mathematischen Manipulation geschuldet?

Zwei Arten von Indizes, kovariant und kontravariant, werden in der speziellen Relativitätstheorie eingeführt. Dies dient meines Wissens ausschließlich dem mathematischen Luxus, dh Ausdrücke in einer prägnanten, selbsterklärenden Notation zu schreiben. Anstatt die Metrik beispielsweise als zu schreiben ( Δ S ) 2 = C 2 ( Δ T ) 2 ( Δ R ) 2 man kann schreiben X μ X μ was nicht nur eine kompakte Notation ist, sondern uns auch sagt, dass dieser Ausdruck Lorentz-invariant ist. Aber beide X μ Und X μ , stellen dieselben Objekte dar: ein Satz von vier Koordinaten ( C T , X , j , z ) .

Bei Darstellungen von S U ( N ) , es erscheinen auch Objekte wie ψ ich Und ψ ich die sich unterschiedlich umwandeln, aber behalten ψ ich ψ ich unveränderlich. Aber wir sehen, dass es in der Natur zwei verschiedene Arten von Objekten gibt: Quarks und Antiquarks, die zu den Repräsentationen gehören ψ ich Und ψ ich bzw.

Bedeutet im letzteren Fall die Unterscheidung zwischen kovariant ψ ich und kontravariante ψ ich ist grundlegender als im ersten Fall?

nur für mathematischen Luxus Nur rhetorische Frage: Gibt es nicht einen Zusammenhang von kovarianten Indizes zu Formen, wenn auch nur aus historischen Gründen, physicalpages.com/2011/04/25/tensors-one-forms

Antworten (1)

Sie müssen viel vorsichtiger sein, was die "oberen" und "unteren" Indizes bezeichnen und woher sie stammen. Ich werde die zwei verschiedenen "Typen" von oberen / unteren Indizes besprechen, von denen Sie sprechen:

Tensor-Indizes

Die erste Quelle für "Objekte mit Indizes" ist die Differentialgeometrie . Auf jedem Koordinatenpatch U M eines Verteilers M mit Koordinaten Q : U R N , die Koordinaten selbst werden traditionell mit "oberen" Indizes geschrieben Q ich . Auf der Mannigfaltigkeit gibt es nun zwei eng verwandte, aber unterschiedliche Objekte, die wir natürlich betrachten wollen: Vektorfelder und Differentialformen . Eine Möglichkeit, den Tangentialraum an einem Punkt zu definieren Q 0 Q ( U ) (entspricht einem Punkt P U als Q ( P ) = Q 0 ist der von den Ableitungen aufgespannte Vektorraum ich := Q ich | Q = Q 0 , deren Indizes traditionell unten platziert sind. Der Kotangensraum ist der duale Vektorraum, der von der dualen Basis aufgespannt wird D Q ich definiert von D Q ich ( J ) = δ J ich .

Nun sei ein beliebiges Vektorfeld gegeben v , wir können es in der Basis erweitern als v = v ich ( Q ) ich für Funktionen v ich , wobei die Summationskonvention gilt, dh wir summieren über alle möglichen Werte von ich . Es ist der v ich ( Q ) was ein Physiker als "Vektor" bezeichnet. Bei einer Koordinatenänderung transformieren sich diese Komponenten durch die Jacobi-Matrix der Koordinatentransformation. Umgekehrt können wir eine Differentialform erweitern als ω = ω ich ( Q ) D Q ich , und es ist die ω ich die der Physiker gewöhnlich "die Form" nennt. Diese Transformationen durch die inverse Jacobi-Matrix. Vektoren und Kovektoren, ebenso wie Differentialformen und Vektorfelder, sind a priori völlig verschiedene Dinge und sollten als unterschiedliche geometrische Konzepte aufgefasst werden.

Allerdings gerät die Sache ins Wanken, weil wir uns in der Physik oft auf einer (Pseudo-)Riemannschen Mannigfaltigkeit mit metrischem Tensor befinden G die die sogenannten musikalischen Isomorphismen zwischen Vektoren und Covektoren definiert, indem sie die 1-Form assoziiert G ( v , ) zu einem Vektorfeld v . Sobald wir uns in dieser Umgebung befinden, können wir die Art der Tensoren frei ändern, und die ursprünglich unterschiedlichen Konzepte werden in praktischen Berechnungen vollständig äquivalent und austauschbar.

An dieser Stelle möchte ich einen bestimmten Teil der Frage ansprechen:

Zwei Arten von Indizes, kovariant und kontravariant, werden in der speziellen Relativitätstheorie eingeführt. Soweit ich weiß, dient dies ausschließlich dem mathematischen Luxus, dh Ausdrücke in einer prägnanten, selbsterklärenden Notation zu schreiben. Anstatt die Metrik beispielsweise als zu schreiben ( Δ S ) 2 = C 2 ( Δ T ) 2 ( Δ R ) 2 man kann schreiben X μ X μ was nicht nur eine kompakte Notation ist, sondern uns auch sagt, dass dieser Ausdruck Lorentz-invariant ist. Aber beide X μ Und X μ , stellen dieselben Objekte dar: ein Satz von vier Koordinaten ( C T , X , j , z ) .

Obwohl sehr praxisnah, ist dies formal nur unsinnig, gerade weil die geometrischen Objekte nicht richtig berücksichtigt werden. Wenn X μ ein Satz von Koordinaten ist, dann gibt es so etwas wie nicht X μ - Sie können den Index einer Koordinate nicht verringern, da es sich nicht um ein Vektor- oder Tensorfeld handelt und daher der musikalische Isomorphismus darauf nicht definiert ist. Der metrische Tensor ist kodiert in D S 2 (oder Δ S , wie die Frage schreibt) wirkt nicht auf Koordinaten , sondern auf Tangentenvektoren. Der „Abstand“ zwischen zwei Punkten ist durch das Extremum der Funktion gegeben

L [ γ ] = γ G ( γ ˙ , γ ˙ ) D τ
für Wege γ zwischen den beiden Punkten. Da die kürzesten Linien, also Geodäten, im Minkowski-Raum Geraden sind, ergibt sich in diesem Spezialfall der Ausdruck für den Abstand zwischen den Koordinatenpunkten X μ Und 0 wird gegeben, indem man so tut, als ob X μ ist ein Vektor und berechnet seine Norm mit dem metrischen Tensor, der durch gegeben ist D S 2 Ausdruck. Dies direkt zu tun ist jedoch formal falsch, da Sie eine Pseudo-Riemannsche Metrik auf diese Weise nicht direkt auf Punkte anwenden können. In diesem Fall ist die Frage also doppelt falsch: Es spielt im Prinzip keine Rolle, wo die Indizes platziert werden, und Sie können nicht einmal so etwas schreiben X μ für eine Reihe von Koordinaten.


Gruppenindizes

Die Verwendung von Indizes in der Gruppentheorie ist völlig anders, und a priori gibt es keine Vorstellung von "oberen" oder "unteren" Indizes. Gegeben eine Gruppe G und eine Vertretung ρ : G G L ( v ) eines Vektorraums v , man kann natürlich eine Basis wählen v ich von v und schreibe ein beliebiges Gruppenelement als Matrix ρ ( G ) ich J .

Für Gruppen, bei denen alle oder die meisten irreduziblen Darstellungen aus Tensorprodukten der Fundamentaldarstellung konstruiert werden können, kommt hier der Begriff der oberen und unteren Indizes ins Spiel: Man erklärt, dass Vektoren in der Fundamentaldarstellung Komponenten mit Indizes haben v ich und die in der konjugierten Fundamentaldarstellung Komponenten mit haben v ich (oder umgekehrt) und dann kann man schreiben T v 1 v N μ 1 μ M um ein Element von zu bezeichnen v ¯ M v N . Diese Abkürzung ist nützlich, um dann abzuleiten, welche Kombination von Indizes und ihre (Anti-)Symmetrisierung irreduziblen Darstellungen entsprechen, siehe zB diese Antwort .

Auch hier sind die oberen und unteren Indizes verwandt, bezeichnen aber nicht dieselben Objekte und signalisieren ein unterschiedliches Transformationsverhalten unter der Gruppe (Fundamentalvektoren transformieren durch ρ ( G ) während sich antifundamentale Vektoren durch transformieren ρ ( G ) ¯ ), ebenso wie Indizes im geometrischen Fall unterschiedliches Transformationsverhalten bei Koordinatenänderungen signalisieren.