Einstein-Summenkonvention: Einer als oberer, einer als unterer?

Meine Frage bezieht sich auf die oft spezifizierte Regel, die die Einstein-Summennotation definiert, in der Summation impliziert wird, wenn ein Index zweimal in einem einzelnen Begriff wiederholt wird, einmal als oberer Index und einmal als unterer Index.

So erscheint ein Begriff wie:

A ich B ich = ich A ich B ich = A 1 B 1 + A 2 B 2 + A 3 B 3

Nach dieser Regel würde der folgende wiederholte Indexterm überhaupt nicht summiert.

A ich B ich
Weil der wiederholte Index im Begriff nicht als eins oben und eins unten erscheint. Dennoch sehe ich manchmal verschiedene Texte und andere Referenzen, die sich auf die Einstein-Summenkonvention berufen, wenn solche Begriffe (beide Indizes oben oder beide Indizes unten) existieren.

Nun, diese abweichende Verwendung der Einstein-Summennotation erscheint oft eher in mathematischen Texten als in Physik. Zum Beispiel trägt Kapitel 1 der Schaum's Outline Series on Tensor Calculus den Titel "The Einstein Summation Convention" und führt die Notation ein und erwähnt niemals die obere und untere Regel für wiederholte Indizes, gibt aber ausdrücklich ein Beispiel für die Verwendung wiederholter unterer Indizes:

A 1 X 1 + A 2 X 2 + A 3 X 3 + + A N X N = ich = 1 N A ich X ich

Normalerweise arbeite ich in meinem Selbststudium der Feldtheorie und der Allgemeinen Relativitätstheorie mit Indexnotation in Physikfächern, und ich kann mich nicht erinnern, jemals auf Beispiele für die Summationskonvention gestoßen zu sein, die die Wiederholungsindexregel nicht als einen oberen und einen unteren aufrufen. Aber ich bin verwirrt, weil ich trotz dieser Verwendung in der Physik keinen Grund sehe, warum ein Index oben und der andere Index niedriger sein muss. Mit anderen Worten, ein wiederholter Index sowohl als unterer als auch als oberer Index scheint nichts zu verletzen (zum Beispiel wird dieser lockerere Ansatz im gesamten oben zitierten Buch von Schaum verwendet.

Meine Frage: Verlangt die korrekte Definition der Einstein Summation Convention, dass ein Index höher und der andere wiederholte Index niedriger sein muss. Oder wird diese bloße Stilkonvention in der Physik verwendet (zB Allgemeine Relativitätstheorie).

Und was ist die Autorität zu entscheiden, was die "richtige" Definition der "Einstein Summation Convention" ist? Die Konvention funktioniert, aber der Autor des Textes sagt, dass sie funktioniert.
Ich bin kein Experte oder das, aber wie ich weiß, hängt dies mit der Kovariante zusammen ( A ich ) und kontravariante ( B ich ) Natur der Vektoren und erst die Summation über die Komponente von kovariantem Vektor mit kontravariantem Vektor ergibt reelle Skalare.
Autoren definieren normalerweise ihre eigene Version der Einstein-Summierungskonvention am Anfang ihrer Texte. Dies sollte das sein, was Sie befolgen. Aus meiner Erfahrung verwenden fast alle Texte, die vier Vektoren (spezielle Relativitätstheorie oder allgemeine Relativitätstheorie) verwenden, eine Kontraktion zwischen oberen und unteren Indizes. Bei Fächern, die sich mit 3 räumlichen Dimensionen befassen (nicht relativistische Strömungsmechanik usw.), werden jedoch häufig obere und obere Indizes oder untere und untere Indizes zusammengezogen, da keine Notwendigkeit besteht, sie zu unterscheiden.
In den Lehrbüchern habe ich die Form gesehen A ich B ich wird nach der Einführung von kontra- und kovarianten Komponenten eingeführt, aber davor die A ich B ich wird normalerweise verwendet
Mögliche Duplikate: physical.stackexchange.com/q/105347/2451 und Links darin.
@Physics_Plasma Nur weil es nicht nötig ist, heißt das nicht, dass man es nicht tun sollte;)
@ACuriousMind Ich gehe davon aus, dass Einstein selbst diese "Autorität" für die korrekte Definition sein könnte. Aus dem Deutschen übersetzt, in Einsteins Aufsatz von 1916 mit dem Titel „Foundation of General Relativity“, sagt Einstein: „Anmerkung zu einer vereinfachten Schreibweise der Ausdrücke – Ein Blick auf die Gleichungen dieses Absatzes zeigt, dass es immer eine Summation in Bezug auf die Indizes gibt die unter einem Summierungszeichen zweimal vorkommen (z. B. der Index v in (5)), und zwar nur in Bezug auf Indizes, die doppelt vorkommen. Es ist daher ohne Verlust der Übersichtlichkeit möglich, das Summierungszeichen wegzulassen. <<Fortsetzung>>
@ACuriousMind <<Fortsetzung>> "An ihrer Stelle führen wir die Konvention ein: Wenn ein Index in einem Glied eines Ausdrucks zweimal vorkommt, ist er immer zu summieren, sofern nicht ausdrücklich etwas anderes angegeben ist." Und beachten Sie, dass Gleichung (5), auf die in Einsteins Zitat verwiesen wird, eine Transformation von Koordinaten unter Verwendung niedrigerer Indizes ist, aber einer der unteren Indizes im Nenner ist, sodass er wie ein oberer Index wirkt. Obwohl dies die Autorität ist, scheint sie (außer durch die Implikation des Beispiels) die Vorstellung zu ignorieren, dass der wiederholte Index ein oberer und ein unterer ist.
@ACuriousMind - übrigens stimme ich Ihrem Kommentar zu: "Die Konvention funktioniert, aber der Autor des Textes sagt, dass es funktioniert".

Antworten (2)

Im "strengen" Sinne sollten Sie die Summationskonvention nur dann auf ein Indexpaar anwenden, wenn einer erhöht und ein anderer verringert wird.

Betrachten Sie beispielsweise einen Vektor v und ein dualer Vektor F (dh eine Karte von Vektoren zu Zahlen). Dann kann man rechnen F ( v ) , die Zahl, die sich ergibt F Einwirken auf v . In Komponenten würde dies geschrieben werden als F ich v ich , da duale Vektoren niedrigere Indizes haben.

Wenn Sie stattdessen zwei Vektoren haben v Und w , es gibt im Allgemeinen keine Möglichkeit, sie zu einer Zahl zusammenzufassen, und die Menge v ich w ich macht keinen Sinn. Aber wenn Sie eine Metrik haben G ich J , Sie können es verwenden, um sich zu drehen w von einem Vektor in einen dualen Vektor mit neuen Komponenten G ich J w J . Dann kann man mit diesem dualen Vektor weiter agieren v , geben G ich J v ich w J . Beachten Sie, dass alle Indizes korrekt gepaart sind.

Davon abgesehen gibt es viele Ausnahmen:

  • Viele feldtheoretische Texte und sogar GR-Texte schreiben v ich w ich , aber Sie sollten sich daran erinnern, dass es wirklich bedeutet G ich J v ich w J . Wenn Sie explizite Berechnungen durchführen, müssen Sie diesen Faktor selbst berücksichtigen.
  • Wenn Sie in einem Raum mit einer einfachen Metrik arbeiten (wie dem euklidischen Raum, wo G ich J ist die Identität), Texte können weggelassen werden G ich J weil es "nichts tut". Das heißt, der Vektor w J und entsprechender dualer Vektor G ich J w J haben immer genau die gleichen Komponenten, also könnten sie sie genauso gut identifizieren.
  • Wenn der vorherige Punkt zutrifft, könnte der Autor die Indexposition verwenden, um eine andere Art von Informationen zu speichern, sodass die Summationskonvention „streng“ bleibt. Dies passiert häufiger in nicht-physikalischen Texten.

Es gibt genug mögliche Konventionen, dass Sie einfach jedes Mal auf der Vorderseite des Buches nachsehen sollten.

Ich habe noch nie einen GR-Text schreiben sehen v ich w ich .
Tatsächlich verwendet Volume II Feynman Lectures die Notation A μ B μ um die Summationskonvention zu demonstrieren (siehe Gleichung 25.7 Definitive Edition). Feynman bettet jedoch die Minuszeichen in räumliche Koordinaten ein, wie dies durch die Minkowski-Raummetrik impliziert wird η μ v aber er erwähnt nie explizit obere/untere oder nennt die Einstein-Summenkonvention.
@K7PEH In diesem Fall macht Feynman nur meinen ersten Aufzählungspunkt.
@knzhou Ja. Als ich meine Frage recherchierte, indem ich Elemente in verschiedenen Texten in meiner persönlichen Bibliothek nachschlug, sah ich Feynmans Notation als KEIN Beispiel für die Verwendung beider unterer oder beider oberer Indizes, sodass ich sie in meiner ursprünglichen Frage nicht erwähnte.

Es ist nichts falsch daran, Indizes zu summieren, wenn beide Indizes entweder steigen oder fallen. Es ist nur eine Frage der Konvention. Die Bedeutungen können jedoch unterschiedlich sein, wenn Sie sich in einer relativistischen Theorie befinden.

Wenn Sie in der Relativitätstheorie einen Aufwärts- und einen Abwärtsindex zusammenfassen, bedeutet dies, dass Sie eine Lorentz-invariante Größe haben, weil Sie kovariante und kontravariante Komponenten so kombinieren, dass sich die Kombination unter Lorentz-Transformationen nicht ändert. Dies ist eine (nette) Regel, die von den meisten Autoren angenommen wird, und ihre Bedeutung liegt darin, dass wir unveränderliche Größen sofort identifizieren können. Einige Autoren verwenden jedoch auch für relativistische Theorien immer Down-Indizes. Zum Beispiel Rubakovs klassische Theorie der Felder.

Wenn Sie sich im euklidischen Raum befinden, brauchen Sie sich keine Sorgen zu machen. Normalerweise verwenden die Leute alle Indizes nach unten.