Zwei unterschiedliche Bedeutungen von ∇∇\nabla mit Index?

Ich versuche die Bedeutung von zu verstehen wenn es mit Index erscheint. Ich habe zwei separate Physics SE-Antworten gefunden, die unterschiedliche Bedeutungen implizieren.

Die Notation B bedeutet einfach, dass die Ableitung nur auf den Vektor angewendet wird B .

Das ist :

(1) ( B ) ich ( A B ) = A B X ich

Feynmans tiefgestellte Notation

× B ϵ ich J k J B k
B ich B ich
B ich B
Indexnotation mit Del-Operatoren

Das zweite Zitat kann ich nicht entziffern: Das habe ich gelernt

× F = ϵ ich J k ( ich F J ) e ^ k F = ich F ich F = ( ich F ) e ^ ich

Könnte mir jemand helfen, diese offensichtliche Diskrepanz zu verstehen? Alle Erkenntnisse, Definitionen oder Erklärungen wären hilfreich. Wie spiegelt sich auch die Vektornatur der Locke in „ ϵ ich J k J B k “ und wie spiegelt sich die Vektornatur des Gradienten in „ ich B “?

Oft ich Und ich werden synonym verwendet, da ich sind die "Komponenten" des Gradientenoperators.
Ein Vorschlag: Indizes sollten immer ausgeglichen sein. Es ist in zwei des zweiten Zitats nicht ausgeglichen.
@WunderNatur Stimmt. Das ist ein weiterer Grund, warum ich so aus der Bahn geworfen werde.
@ user56478 Was fehlt, ist die Basis. Für einen Vektor wird immer eine Basis benötigt. Wenn Sie einen Vektor B aufschreiben, meinen Sie eigentlich B^ie_i.
@WunderNatur Ist dieses Weglassen des Einheitsvektors eine Standardkonvention oder ist das nur ein Fehler oder Mangel an Strenge seitens des Verfassers des zweiten Zitats?
@ user56478 Ich denke nicht, dass dies eine Konvention ist. Alternativ können Sie einen Index auf der linken Seite hinzufügen.
Machen Sie sich keine Sorgen um das zweite Blockzitat, es ist ein ziemliches Durcheinander. Du warst schon in Ordnung.
@knzhou Haha, okay. Danke schön! In diesem Fall bleibe ich einfach bei dem, was ich gelernt habe und was das erste Blockzitat sagt :)
Das Löschen des Einheitsvektors kann geometrisch in der Abstract-Index-Notation durchgeführt werden, ist jedoch etwas kompliziert. Geben Sie daher bitte an, ob Sie eine Antwort wünschen, die streng darauf eingeht.
@CRDrost Okay, sicher. Ich bin dafür, etwas Neues zu lernen.

Antworten (1)

Ich habe in Kommentaren gefragt, ob eine Antwort mit abstrakter Indexnotation willkommen wäre, und anscheinend war sie es.

Verteiler

Weil du redest , springen wir mit Krümmern ins kalte Wasser. Sie haben einen gewissen Raum von Punkten M und ein Zahlenfeld F (normalerweise die reellen Zahlen R oder die komplexen Zahlen C ); es wird zu einer "Mannigfaltigkeit", wenn wir beginnen, es mit einer Reihe von "erlaubten" Skalarfeldern auszustatten S ( M F ) die wir uns als "glatte Funktionen" vorstellen. Um diesen Punkt genauer zu machen, kann man sich die existierenden glatten Funktionen unter den Zahlen vorstellen, die wir viel besser verstehen, aus F N F . Dieser Raum C ( F N ,   F ) dieser Funktionen kann als Abschlussbeziehung verwendet werden, mit dem folgenden Kategoriediagramm,

Ein Kreis mit der Bezeichnung M auf der linken Seite zeigt von einem Kreis mit der Bezeichnung F mit einem breiten Pfeil mit der Bezeichnung S, dies sind alle zulässigen Skalarfelder.  Darunter befindet sich ein Kreis mit der Aufschrift F hoch n potenziert.  Ein weiterer Pfeil zeigt vom linken Kreis zum unteren, beschriftet mit S hoch n, und ein Pfeil zeigt vom unteren Kreis zum F-Kreis rechts, beschriftet mit den glatten Funktionen C-unendlich von F-to-the -N und F. Es gibt auch einige verstreute Identitätspfeile, aber sie sind nicht wirklich wichtig.

Beachten Sie, dass dies ein abstraktes Diagramm ist und Kreise impliziert sind N = 0 , 1 , 2 , . Also auf der linken Seite haben wir diese N -Tupel von Skalarfeldern S N ; diese würden normalerweise aus gehen M N F N aber wir wenden alle skalaren Felder auf denselben Quellpunkt an, also gibt es eine implizite Funktion M M N auch drin. Auf der rechten Seite haben wir diese glatten Funktionen, das "Kategoriediagramm" sagt, dass das Komponieren beliebig ist N -Tupel von Skalarfunktionen mit einer dieser glatten Funktionen der entsprechenden N , ergibt ein weiteres Skalarfeld, einen weiteren dieser Top-Pfeile. Und der Punkt ist, jede reibungslose Funktion aus F N Zu F genießt jetzt eine Art Doppelstatus, einerseits ist es eine herkömmliche reibungslose Funktion; andererseits kann es in eine Funktion aus "gehoben" werden S N S , und wir sagen, dass diese Skalarfelder glatt sind, genau weil sie unter all diesen angehobenen Funktionen geschlossen sind. Lassen Sie mich eine solche Funktion kurz an nennen N -Funktor und kennzeichnen Sie ihn mit eckigen Klammern, wenn er auf Skalarfelder angewendet wird, oder mit runden Klammern, wenn er auf Zahlen angewendet wird, so dass

F [ S 1 ,   S 2 ,   S 3 ] ( P ) = F ( S 1 ( P ) ,   S 2 ( P ) ,   S 3 ( P ) ) .

Ich möchte einige dieser Funktionen besonders hervorheben: Die Addition von Skalarfeldern ist jetzt definiert, weil ( + ) ist ein 2-Funktor, und die punktweise Multiplikation von Skalarfeldern ist jetzt definiert, weil ( ) ist ein 2-Funktor. Wir haben auch skalare Multiplikationen und skalare Additionen mit beliebigen Konstanten in F denn das sind 1-Funktoren, und wir haben konstante Felder, weil das 0-Funktoren sind. Ich werde für keine davon eckige Klammern verwenden. Schließlich stellt sich heraus, dass man aus den von Ihnen verwendeten Feldern eine natürliche Topologie ableiten kann (dies ist einer der Gründe, warum Sie nicht einfach verwenden möchten S = ( M F ) , Sie erhalten die diskrete Topologie auf dem Raum) - dafür ist es hilfreich, dass die Bump-Funktion ein 1-Funktor ist.

Was macht dieses Ding zu einem D -dimensionale Mannigfaltigkeit ist das Axiom, das für jeden Punkt gilt P M es gibt eine offene Menge, die diesen Punkt enthält, wo D Von diesen Skalarfeldern können "lokale Koordinatenfelder" verwendet werden, um (a) Punkte innerhalb dieser offenen Menge zu unterscheiden und (b) jedes andere Skalarfeld als a darzustellen D -Funktor auf diese Koordinatenfelder angewendet. Es gibt auch einige andere notwendige Axiome, wie zum Beispiel, wenn ein Skalarfeld stückweise auf einem Flickenteppich all dieser Räume konsistent definiert wird, dann sollte es auch darin enthalten sein S , aber lassen Sie uns diese der Kürze halber überspringen.

Vektorfelder

Es existiert nun eine schöne Definition des Raumes von Vektorfeldern M aber es ist ein bisschen abstrakt: es ist der Raum der gerichteten Ableitungen, die Ableitungen genannt werden , auf der Mannigfaltigkeit. Formal: v ist die Teilmenge der Funktionen aus S S , die dem Leibniz-Gesetz gehorchen: wenn v In dieser Teilmenge ist dann seine Aktion beliebig N -Funktor ist gegeben durch

v ( F [ S 1 , S N ] ) = ich = 1 N F ( ich ) [ S 1 , S N ] v ( S ich ) ,
Wo F ( ich ) ist die Ableitung von F in Bezug auf seine ich th Streit. (Hier ist eine Menge Maschinerie im Gange! Ich sage: Geh zurück zu was F ist als Funktion von Zahlen zu Zahlen, nimm die Ableitung, die resultierende Funktion ist an N -Funktor, wende es auf diese Skalarfelder als solche an und multipliziere diese dann punktweise mit v auf die einzelnen Skalarfelder anwenden, dann alles aufsummieren.)

Warum sollte dies ein "Vektorfeld" sein? Nun, gehen Sie zurück zu unserem Koordinatenaxiom: Jedes Skalarfeld ist a D -Funktor der Koordinatenfelder auf der offenen Menge. Dies bedeutet, dass auf dieser offenen Menge angesichts der D "Komponenten" v ich = v ( C ich ) (die auch skalare Felder sind), die Operation von v auf einem Skalarfeld S ist eindeutig gegeben durch v S = ich v ich S ( ich ) . Diese Komponenten definieren also den Vektor vollständig, und tatsächlich denke ich, dass Sie (nach dem Patchwork-Axiom) alle verwenden können D -Tupel von Skalarfeldern, um eines davon zu erstellen.

Der Raum der Vektorfelder v ist perverserweise nicht ganz ein Vektorraum über dem Feld S , und das liegt daran S verstößt gegen die Feldaxiome: Sie können eine Funktion haben, die in der oberen Hälfte der Kugel Null ist, und eine Funktion, die in der unteren Hälfte der Kugel Null ist, und sie multiplizieren, um zu erhalten 0 -Element, das auf der ganzen Kugel Null ist: und die Feldaxiome verbieten Teiler von Null. (Ich denke direkter: Jede dieser Funktionen hat keine multiplikative Inverse, aber es ist nicht das Nullelement.) Stattdessen müssen wir das sagen v ist ein Modul über dem kommutativen Ring S .

Tensoralgebra

Jetzt haben wir die Vektorfelder v Wir erfinden den Kovektorraum v ¯ , das ist der Raum linearer Abbildungen von Vektoren zu Skalarfeldern, v ¯ = Hom ( v , S ) . Dieser Raum ist auch ein Modul weiter S , wobei Skalarmultiplikation bedeutet "die Skalarfeldausgabe dieses Covektors punktweise mit dem gegebenen Skalarfeld multiplizieren" und Addition bedeutet "die Skalarfeldausgaben dieser beiden Covektoren addieren". Tatsächlich gibt es für alle Paare natürlicher Zahlen einen Modul aus multilinearen Operatoren M Covektoren u N Vektoren zu Skalarfeldern, dem Raum von [ M , N ] -Tensorfelder

T [ M , N ] = Hom ( v N × v ¯ M , S ) .
Um damit umzugehen, gibt es viele Notationen, die auf der ganzen Welt erfunden wurden. Ich werde Ihnen jetzt die als abstrakte Indexnotation bekannte Notation zeigen.

Abstrakte Indizes

Die Idee ist, dass wir Kopien der erstellen [ M , N ] Tensorraum für jede Menge von M + N eindeutige Symbole und bezeichnen Sie es entsprechend, T D e A B C eine Kopie des Raums von sein [ 3 , 2 ] -Tensoren. Jedes Element dieses Raums muss auch mit den entsprechenden Symbolen gekennzeichnet sein, und für einzelne Elemente müssen sie möglicherweise auch in einer bestimmten Reihenfolge sein (beim Tensorraum sind die oberen und unteren Symbole unabhängig von der Reihenfolge).

Dies offenbart für uns zwei Dinge: eine Familie von Außenprodukten , zum Beispiel eine dieser Außenprodukte Karten T e A B × T D C T D e A B C . Die Bedeutung davon ist ziemlich einfach, denke ich: die multilineare Karte A e A B   B D C nimmt als Argument die beiden Vektoren u D ,   v e und die drei Covektoren R A , S B , T C und erzeugt die beiden Skalarfelder A e A B   R A   S B   v e Und B D C   T C   u D und multipliziert diese beiden dann miteinander, um das Endergebnis zu erhalten. Wir verwenden eine direkte Gegenüberstellung der Subtensoren, um dieses äußere Produkt zu bezeichnen.

Das nächste, was wir bekommen, ist Kontraktion , was ein Axiom erfordert: gegeben an [ M , N ] -Tensor gibt es eine Zerlegung davon in Form einer Summe großer äußerer Produkte von M Vektoren und N Covektoren. Sobald dies existiert, können Sie einfach einen der Covektoren auf einen der Vektoren anwenden, wodurch ein Skalar entsteht, und ein Skalar mal ein Tensor ist nur ein Tensor. Wie Sie sich vorstellen können, bezeichnen wir dies, indem wir einen Index oben und unten wiederholen. So A M M N ist eine Kontraktion, die jetzt in lebt T N . Es kommt von einem Tensor A B A N anhand dieses Axioms: Dieser Tensor war eine Summe äußerer Produkte:

A B A N = a A   β N   γ B + + χ A   ψ N   ω B .
Die resultierende Kontraktion ist der Vektor ( γ M   a M ) β N + + ( ω M   χ M )   ψ N . Diese Begriffe in Klammern sind Anwendungen eines Covektors auf einen Vektor, um einen Skalar zu erzeugen, also addieren wir einfach skalare Vielfache von Vektoren, um einen neuen Vektor zu erzeugen. Dies ist also der koordinatenunabhängige Begriff der Spur , der verwendet werden kann, um beliebige zu reduzieren [ M , N ] -Tensor zu einem [ M 1 , N 1 ] -Tensorfeld, solange keine dieser beiden resultierenden Zahlen negativ ist.

Hinweis: Ich habe oben einen wichtigen Umbenennungs-Isomorphismus für selbstverständlich gehalten , der identifiziert, welcher a M ist der richtige darzustellende Vektor a A in einem ganz anderen Raum (in dem man wohnt T A , man wohnt darin T M ). Wir können diesen Umbenennungsisomorphismus expliziter als Tensor schreiben δ M A da es beschreibt, wie jeder Covektor aufgenommen wird T A das hätte direkt weiter operiert a A , und lässt es stattdessen mit einem Vektor in arbeiten T M . Dies ist also eine koordinatenunabhängige Version des "Kronecker-Deltas".

Punkt- und Kreuzprodukte,

Schließlich müssen Punktprodukte und Kreuzprodukte direkter implementiert werden. Nun, das ist einfach: Sie sind Tensoren im Raum!

Das Skalarprodukt ist eine multilineare Abbildung von zwei Vektoren auf einen Skalar, also a [ 0 , 2 ] -Tensor G A B , wird Metriktensor genannt . Es ist symmetrisch in seinen zwei Eingängen, G A B = G B A . Es hat eine Umkehrung G A B so dass G A B   G B C = δ C A , und ihre Inverse ist natürlich auch symmetrisch. So wie der Relabeling-Isomorphismus eine kanonische Identifizierung verschiedener Vektorräume ist, ist die Metrik eine kanonische Identifizierung von Vektoren mit Covektoren, jedem Vektor v entspricht dem Covektor ( v ) kanonisch. Wir zeigen dies normalerweise an, indem wir dasselbe Symbol für den Vektor verwenden, z v A = G A B   v B . Das können wir auch mit Tensoren machen; Normalerweise versuchen wir, die Indizes in derselben horizontalen Position zu halten, während wir ihre vertikale Position von oben nach unten ändern, so dass zum Beispiel

M       k ich J = G ich A   G J B   M ich J k .

Ein Orientierungstensor in D Dimensionen ist eine völlig antisymmetrische [ 0 , D ] -tensor, also in 3 Dimensionen ϵ A B C , Implementierung des Kreuzprodukts zwischen zwei Vektoren. Es wird normalerweise so genommen

ϵ ich J N   ϵ ich J N = G A ich   G B J   G F N   ϵ ich J N   ϵ A B F = ± D ! ,
die in der Regel die einzelnen Komponenten macht ± 1 in irgendeiner geeigneten Basis. Die Wahl der ± In ± D ! bezieht sich normalerweise auf die Determinante von G oder so ähnlich, wenn Sie also zum Minkowski-Raum kommen, wird -24 meiner Meinung nach häufiger verwendet, aber im 3D-Raum wird +6 verwendet und in 4D Euklidisch würden Sie wahrscheinlich stattdessen +24 verwenden.

Aus Gründen, die ich aufgrund der Antwortlänge nicht erklären kann, ich erfordert eine sorgfältigere Definition: Die geometrische Struktur, die es verkörpert, wird als "Verbindung" im Raum bezeichnet, und es stellt sich heraus, dass wir seine Operation auf skalaren Feldern eindeutig definiert haben, v ich   ich   S Sein v S direkt: aber seine Definition auf Vektorfeldern unterliegt einer Mehrdeutigkeit bis auf a [ 1 , 2 ] Tensorfeld (wenn man einen Vektor entlang eines anderen Vektors transportiert, welcher Vektor entsteht dabei?). Eine bestimmte kann jedoch so gewählt werden, dass sie keine „Torsion“ hat und der metrische Tensor keine Ableitung hat, dies wird die „Levi-Civita-Verbindung“ genannt, und das ist normalerweise das, was wir verwenden. Wie auch immer, alles, was ich hier sagen wollte, ist, dass es eindeutig einen natürlichen Covektor-Index hat, weil wir ihn auf Skalare anwenden.

Wiedereinführung expliziter Koordinaten

Alle oben genannten Indizes sind abstrakt , sie zeigen nur die Zugehörigkeit zu einer Menge an und ermöglichen eine kreative Buchhaltung. Aber schließlich werden Sie eine Art Koordinaten oder so über den Raum einführen und einige echte Berechnungen durchführen wollen. Wenn Sie dies tun möchten, konstruieren Sie im Wesentlichen innerhalb des Raums Ihre lokalen Basisvektoren C 1 A , C 2 A , C D A . Es hilft, zwei nicht überlappende Symbolsätze zu wählen, zB griechische Indizes sind abstrakte Indizes, römische sind Platzhalter für Zahlen. Diese Koordinatenvektoren sind also C A a .

Wir konstruieren eine Reihe von "dualen Vektoren" zu diesen eigentlichen Covektoren, C a A . Die Idee ist, dass diese senkrecht zu all denen sein müssen, die nicht ihr "Ziel" -Vektor sind, und sie müssen so skaliert werden, dass ihr Produkt mit ihrem Zielvektor 1 ist:

C a M   C N a = δ N M .
Das ist jetzt Ihr ganz normaler Kronecker δ Symbol auf der rechten Seite, es ist kein cleverer Isomorphismus. Jetzt irgendein Vektor v a kann durch diese dualen Vektoren bearbeitet werden, um einige Komponenten zu erhalten v A = C a A   v a die es in Bezug auf diese Bereiche vollständig charakterisieren. Aus diesen Komponenten können Sie dann das Original aufbauen, v a = A v A   C A a .

Durch das Verständnis der Operationen von a Auf den Komponentenfeldern erhält man Dinge wie die Christoffel-Symbole.

Nun ist im flachen euklidischen 3D-Raum jedes Skalarfeld eine glatte Funktion von X , j , z Felder des Raums, und jedes Vektorfeld hat kanonische skalare Feldkomponenten v X , v j , v z über den gesamten Raum definiert. Wenn Sie diese als Spaltenvektor schreiben, dann sind Covektoren Zeilenvektoren und unsere übliche euklidische Metrik identifiziert jeden Vektor mit seinem Covektor als Transponierte.

Als Konsequenz G M N = C M μ C N v G μ v zum Beispiel ist auch ein Kronecker-Delta, und so vergisst man typischerweise ganz die Unterscheidung zwischen unteren und oberen Indizes, dem Vektorprodukt u v ist mathematisch gleich ich u ich   v ich , und wir können das sogar löschen ich wenn wir die Einstein-Summierungskonvention verwenden. Sie wissen jetzt also, dass im „reinen Land“, aus dem diese Komponenten stammen, jeder niedrigere Index durch einen oberen ausgeglichen werden muss; aber in dieser einfacheren Welt ist es viel einfacher, sie müssen nur gepaart werden, um die Summierung über ihre Komponenten zu implizieren, was ein geometrisch sinnvolles Produkt zur Folge hat. In diesem Sinne sollten Sie betrachten ϵ ich J k   J   B k : seit J Und k wiederholt werden, wird dies implizit über diese Komponenten summiert; der Ersatzindex ich zeigt an, dass die verbleibenden Komponenten von a sind [ 1 , 0 ] -Tensor.

Die "geometrisch korrekte" Version wäre also ϵ         v λ μ   μ   B v , oder so; aber wir wissen, dass wir uns in einem flachen 3D-Raum befinden, also wissen wir, dass es nicht schaden kann, diese Vortäuschung einfach fallen zu lassen, solange wir bei Dingen wie "Ich habe diesen Index dreimal wiederholt, führt das zu einer Einstein-Summierung ? " (Antwort: Ja, aber WTF machst du?)