Ist die partielle Ableitung ein Vektor oder ein dualer Vektor?

Das Lehrbuch (Introduction to the Classical Theory of Particles and Fields, von Boris Kosyakov) definiert eine Hyperfläche durch

F ( x )   =   c ,
wo F C [ M 4 , R ] . Differenzieren gibt
d F   =   ( μ F ) d x μ   =   0.
Der Text sagt dann d x μ ist ein Covektor und μ F ein Vektor. Das habe ich aus einem anderen Buch gelernt d x μ sind 4 duale Vektoren (im Minkowski-Raum), μ indiziert duale Vektoren selbst, nicht Komponenten eines einzelnen dualen Vektors. Also denke ich μ F sollten ebenfalls 4 Vektoren sein, von denen jeder die Richtungsableitung entlang einer Koordinatenachse ist. Aber dieses Buch stellt das später fest ( μ F ) d x μ = 0 beschreibt eine Hyperebene Σ mit normal μ F durch Vektoren aufgespannt d x μ , und ruft an Σ eine Tangentialebene (Seite 33-34). Diesmal scheint es zu behandeln μ F als einzelner Vektor und d x μ als Vektoren. Aber ich denke d x μ sollte einen Kotangensraum aufspannen.

Ich brauche etwas Hilfe, um diese Dinge zu klären.

[bearbeitet von Ben Crowell] Das Folgende scheint der Text zu sein, auf den sich die Frage bezieht, aus Anhang A (den Amazon mich durch sein Guckloch sehen ließ):

Elie Cartan schlug vor, differentielle Koordinaten zu verwenden d x ich als bequeme Basis von 1-Formen. Die Differentiale d x ich transformieren wie Covektoren [...] Darüber hinaus bei Verwendung in der Richtungsableitung d x ich F / x ich , d x ich kann als lineare Funktion angesehen werden, die reelle Werte auf Vektoren annimmt F / x ich . Die Linienelemente d x ich heißen [...] 1-Formen.

Nachdem ich eine Antwort geschrieben und mir dann erfolgreich angesehen habe, was Kosyakov geschrieben hat, bin ich genauso verwirrt wie elflyao. Ich wäre daran interessiert, von anderen zu hören, die möglicherweise über umfassendere Erfahrungen verfügen oder erklären können, ob Kosyakov einen ungewöhnlichen Standpunkt vertritt.
μ F ist eine Funktion, kein Vektor. Vielleicht meinst du das Vierfache der μ F 's?
@MBN: " μ F ist eine Funktion, kein Vektor.“ Sie meinen, es ist eine Funktion in dem Sinne, dass sie sich über die Raumzeit ändert? Sicher, das ist sicher richtig, aber es ist eine vektorwertige Funktion. „Vielleicht meinen Sie das Vierfache von μ F 's?" Was ich normalerweise damit meinen würde, ist, dass wenn der Index μ ungebunden ist und kein Koordinatensystem angegeben wurde, ist die Indexnotation μ F gibt den gesamten Gradienten-Covektor an, wie in der abstrakten Indexnotation. Dies ist ähnlich wie "die Funktion f ( x ) ," wo x ist ungebunden. Kosjakows „Vektoren F / x ich ," mit [...]
Plural „Vektoren“, legt nahe, dass er an so etwas denkt F / x 0 als Vektor. Das macht für mich nicht viel Sinn, da es eindeutig nicht die Transformationseigenschaften eines Vektors haben kann. Es ist eine einzelne reelle Zahl und zB unter einem Koordinatenwechsel x 0 7 x 0 , F / x 0 ( 1 / 7 ) F / x 0 , was eine Komponente eines Covektors tun würde. Eine Komponente eines Vektors würde 7 Mal größer werden .
@BenCrowell: OK, dann macht es Sinn. Für mich sah es aus wie eine partielle Ableitung.
Wurde diese Frage nicht schon beantwortet? Ich sehe viele tolle Antworten unten ...
Ich habe Kosyakovs Definitionen mit Wald, General Relativity, S. 15 und 20ff verglichen. Es gibt einige Ungereimtheiten. Wald definiert F als die Menge glatter Skalarfelder auf einer Mannigfaltigkeit M , und definiert einen Tangentenvektor v v p als Karte v : F R das ist linear und gehorcht der Leibniz-Regel at p , sodass sie als Richtungsableitung at interpretiert werden kann p . Damit ist eine partielle Ableitung definitionsgemäß ein Vektor, und es bedeutet auch, dass z F F , F / x ich ist eine reelle Zahl, kein Vektor, wie Kosyakov es beschreibt.
kurze, einfache Antworten finden Sie unter physicaloverflow.org/24735

Antworten (5)

Unten folgt eine Handvoll Auszüge aus dem Buch Introduction to the Classical Theory of Particles and Fields (2007) von B. Kosyakov.

Kontroverse/irreführende/falsche Aussagen sind markiert r e d . Wir stimmen OP zu, dass die in markierten Aussagen r e d stehen im Gegensatz zu Standardterminologie/Konventionen. Einige (nicht alle) richtige Aussagen sind markiert g r e e n .

1.2 Affine und metrische Strukturen

[...] Lassen e 1 , , e n und e 1 ' , , e n ' seien zwei beliebige Basen. Jeder v e c t Ö r der letztgenannten Basis kann in Bezug auf erweitert werden v e c t Ö r s der ehemaligen Basis:

(1.37) e ich '   =   e j   L j ich .

[...] Lineare Funktionale bilden also den dualen Vektorraum v ' . Wenn v ist n -dimensional, so ist v ' . In der Tat, lassen Sie e 1 , , e n Basis sein in v . Dann irgendwelche ω v ' wird angegeben durch n reale Nummern ω 1 = ω ( e 1 ) , , ω n = ω ( e n ) , und der Wert von ω an a = a ich e ich wird von gegeben

(1.52) ω ( a )   =   ω ich a ich .
Wir sehen das v ' ist isomorph zu v . Deshalb beziehen wir uns manchmal auf lineare Funktionale als c Ö v e c t Ö r s . Eine genauere Betrachtung von (1.52) zeigt, dass a v e c t Ö r a kann als lineare Funktion auf betrachtet werden v ' . Man kann zeigen (Aufgabe 1.2.3), dass der Wechsel der Basis (1.37) die Transformation von impliziert ω ich nach demselben Gesetz:
(1.53) ω ich '   =   ω j   L j ich .
Wir werden normalerweise das Argument von unterdrücken ω ( a ) , und identifizieren ω mit seinen Komponenten ω ich . [...]

1.3 Vektoren, Tensoren und n -Formen

[...] Eine einfache Verallgemeinerung von Vektoren und Covektoren sind Tensoren. Algebraisch ein Tensor T von Rang ( m , n ) ist eine multilineare Abbildung

(1.112) T : v ' × × v ' m  mal × v × × v n  mal R .
Beispiele für Tensoren sind uns bereits im vorigen Abschnitt begegnet: Ein Skalar ist ein Rang ( 0 , 0 ) Tensor, a v e c t Ö r ist ein Rang ( 1 , 0 ) Tensor, a c Ö v e c t Ö r ist ein Rang ( 0 , 1 ) Tensor, die Metrik g ich j ist ein Rang ( 0 , 2 ) , während g ich j ist ein Rang ( 2 , 0 ) Tensor und das Kronecker-Delta δ ich j ist ein Rang ( 1 , 1 ) Tensor. Genauso wie f Ö u r   v e c t Ö r s können als Gegenstände angesehen werden, die sich nach dem Gesetz verwandeln
(1.113) a ' μ   =   Λ μ v   a v ,
wo Λ μ v ist die Lorentz-Transformationsmatrix, die die beiden Bezugsrahmen, also Rangtensoren, in Beziehung setzt ( m , n ) können in Form von Lorentzgruppendarstellungen durch die Forderung beschrieben werden, dass ihr Transformationsgesetz sei
(1.114) T ' μ 1 μ m v 1 v n   =   Λ μ 1 a 1 Λ μ m a m   T a 1 a m β 1 β n   Λ β 1 v 1 Λ β n v n .

[...]Der Differentialoperator

(1.140) μ   =   x μ
verwandelt sich wie ein c Ö v a r ich a n t   v e c t Ö r . Um dies zu sehen, verwenden wir die Kettenregel zur Differenzierung:
(1.141) x μ   =   x ' v x μ x ' v ,
und beachten Sie dies für lineare Koordinatentransformationen x ' μ = Λ μ v   x v + a μ
(1.142) x ' μ x v   =   Λ μ v .
Wir werden immer die Kurzschreibweise verwenden μ , und behandeln Sie diesen Differentialoperator als gewöhnlichen v e c t Ö r . [...]

1.4 Linien und Flächen

[...] Wir definieren eine Hyperfläche M n 1 durch

(1.176) F ( x )   =   C ,
wo F ist eine beliebige glatte Funktion M 4 R . Differenzieren von (1.176) ergibt
(1.177) ( μ F ) d x μ   =   0 .
Kann man anschauen d x μ Als ein c Ö v e c t Ö r , und μ F Als ein v e c t Ö r . In der Tat, d x μ verwandelt sich wie ein c Ö v e c t Ö r unter linearen Koordinatentransformationen x ' μ = Λ μ v   x v + a μ ,
(1.178) d x ' μ   =   x ' μ x v d x v   =   Λ μ v   d x v ,
und μ F verwandelt sich wie ein v e c t Ö r :
(1.179) F x ' μ   =   F x v x v x ' μ   =   F x v Λ v μ .
Im Minkowski-Raum können Vektoren und Kovektoren gemäß (1.121) ineinander umgerechnet werden. Aus diesem Grund werden wir oft betrachten d x μ als Vektoren. [...]

A. Differentialformen

[...] Elie Cartan schlug vor, differentielle Koordinaten zu verwenden d x ich als bequeme Grundlage Ö n e   f Ö r m s . Die Differentiale d x ich verwandeln wie c Ö v e c t Ö r s unter einer lokalen Koordinatenänderung,

(A.1) d x ' j   =   x ' j x ich d x ich .
[Wenn die Koordinatenänderung auf euklidische Transformationen spezialisiert ist x ' j = L j ich   x ich + c j , dann x ' j / x ich reduziert zu L j ich , eine orthogonale Matrix mit konstanten Einträgen, und (A.1) b e c Ö m e s (1.53), das Transformationsgesetz für c Ö v e c t Ö r s .] [...]

Anmerkungen:

  1. Die korrigierte Gl. (1.114) lautet

    (1.114) T ' μ 1 μ m v 1 v n   =   Λ μ 1 a 1 Λ μ m a m   T a 1 a m β 1 β n   ( Λ 1 ) β 1 v 1 ( Λ 1 ) β n v n .

  2. Die korrigierte Gl. (1.179) lautet

    (1.179) F x ' μ   =   F x v x v x ' μ   =   F x v ( Λ 1 ) v μ .

  3. Um zu erklären, warum (A.1) nicht zu (1.53) wird, sei gesagt e 1 , , e n , sei eine (duale) Basis in v ' . Angesichts von (1.53) in Ordnung für einen Covektor ω = ω ich e ich v ' Um von der Wahl der Basis unabhängig zu sein, muss sich die duale Basis als transformieren

    (*) e ' ich   =   M ich j   e j ,
    wo
    (1.45) M   =   L 1 .
    Identifizieren der dualen Basen e ich d x ich , wird die obige Gleichung (*) zu (A.1). Außerdem ist im folgenden Satz Gl. (A.1), die L Matrix sollte durch die ersetzt werden M Matrix an zwei Stellen.

  4. Lassen Sie uns abschließend die Titelfrage von OP beantworten: Eine partielle Ableitung μ F (einer Skalarfunktion F ) ist eine Komponente eines Kotangensvektors d F = ( μ F ) d x μ , während die nicht angewendete partielle Ableitung μ ist ein lokales Basiselement eines Tangentenvektors. Beide μ F und μ als Covektoren transformieren.

Nun, Punkt 4. ist schön formuliert, aber ich mag die rot/grünen Markierungen nicht so sehr, da dies eher Konvention ist als alles andere (natürlich alle Bucherrata ausgenommen).
@NikosM.: Die Punkte 1 und 2 von Qmechanic sind keine Konventionssache; Kosyakov hat an diesen Stellen Fehler gemacht.

Ich habe einen kurzen Blick auf die Seiten 59 und 60 von "Gravitation", Abschnitt 2.6 "Gradients and Directional Derivatives" geworfen, um zu sehen, ob es dort etwas gibt, mit dem wir dieses Problem klären können.

In diesem Abschnitt ist die Steigung von f ist d f , die Richtungsableitung entlang des Vektors v ist v f und es gilt folgende Beziehung:

v f = d f , v

Nehmen Sie dann eine Reihe von Basisformen an d x μ und duale Basisvektoren e μ wir haben

μ f e μ f = d f , e μ = f x μ

Laut MTW in diesem Abschnitt μ f sind die Bestandteile von d f auf dieser Grundlage.

Somit muss es sein, dass gemäß der 2. Gleichung in der Frage

d f = ( μ f ) d x μ

das ist nur die Erweiterung der Form d f auf den Basisformen d x μ

Warum Kosyakov dies als Kontraktion einer Form und eines Vektors identifizieren würde, habe ich keine Ahnung.

Ich glaube, dies ist nur ein ungenauer Sprachgebrauch des Autors - es passiert nichts Mysteriöses, es ist einfach nicht gut ausgedrückt:

Wie in der Frage angegeben, für eine Hyperfläche Σ definiert von

F ( x ) = c R

wir glauben, dass

d F = 0

muss durchhalten Σ . Das ist entscheidend - es bedeutet, dass die 1-Form d F Einwirken auf Tangentenvektoren von Σ muss identisch verschwinden:

v T x Σ : d F ( v ) = ( μ F ) v μ = 0

Aber wir können es erkennen ( μ F ) v μ als Skalarprodukt der Vektoren v und g ( d F , ˙ ) , wobei letzteres das übliche Dual von ist d F mit Komponenten μ F . Seit T x Σ T x M 4 das bedeutet natürlich d F = 0 fegt tatsächlich eine Hyperfläche im Tangentenraum aus, die in schlampiger Ausdrucksweise den Gradienten als Normalen hat (obwohl es eigentlich ihr Dual ist).

Ich glaube, der Knackpunkt liegt in dem Satz „Aber wir können doch erkennen …“, und da kann ich dir nicht folgen. Da der Gradient d F ist eine 1-Form, ihr Dual μ F ist ein Vektor. Wenn ja, dann können wir das Skalarprodukt des Vektors nicht nehmen μ F mit einem Vektor v μ . Ich sehe überhaupt keinen Grund, dual irgendwohin zu gehen. Selbst wenn wir keine Metrik hätten und daher keine Duals nehmen könnten, hätten wir es einfach haben können ( μ F ) v μ , das Skalarprodukt eines Covektors mit einem Vektor.
@BenCrowell: Ja, in der Tat. Dadurch wird immer noch eine Hyperfläche im Tangentialraum definiert, aber wir haben keinen "normalen Vektor", um sie zu beschreiben. Ich stimme zu, dass es nicht notwendig ist, Duals zu nehmen - aber ich denke, Kosyakov tut implizit genau das, wenn er davon spricht μ F ein normaler Vektor sein. Ihre Nomenklatur erscheint mir jedoch etwas unorthodox - ein Skalarprodukt liegt zwischen zwei Vektoren oder zwei Covektoren (und wird normalerweise durch die Metrik induziert) - das Anwenden eines Covektors auf einen Vektor ist kein Skalarprodukt.
OK, mit "Skalarprodukt" meinte ich einfach ein Produkt, das sich als Skalar transformiert. Nehmen Sie also "Skalarprodukt" in Ihrer Antwort an g ( , ) , Ich verstehe nicht, warum man das beschreiben würde ( μ F ) v μ als Skalarprodukt von v μ mit μ . Das könnte bedeuten, dass wir den Gradienten nehmen, seinen Index erhöhen, seinen Index senken und dann kontrahieren. Ich sehe keinen Sinn darin, einen Index zu erhöhen und ihn dann sofort wieder zu senken. Oder wir könnten den Index des Farbverlaufs erhöhen oder senken v μ 's Index und Vertrag. Warum überhaupt erhöhen oder senken?
@BenCrowell: Weil es die geometrische Interpretation von ergibt μ F als Normalenvektor zur Hyperebene von Tangentenvektoren von Σ . Ich glaube nicht, dass es hier etwas Tieferes gibt.

Ich glaube, Sie sind verwirrt, weil Sie verwandte, aber leicht unterschiedliche Mengen verwechseln.

Ja, eine partielle Ableitung ist ein Vektor und ja, ein Vektor ist ein Objekt mit einem oberen Index.

Die obige Aussage mag widersprüchlich erscheinen, ist es aber aus folgendem Grund nicht. Ein Vektor ist eine abstrakte Größe, die ein Element eines "Vektorraums" ist. In diesem Fall ist der diskutierte Vektorraum der Tangentenraum. Auf einem Vektorraum kann man eine Basis wählen, jede Basis. Sobald eine Basis gewählt wurde, kann jeder andere Vektor im Vektorraum beschrieben werden, indem einfach eine Menge von Zahlen vorgegeben wird. Zum Beispiel im R 2 (eher der entsprechende affine Raum), kann man als Basis von Vektoren wählen x ^ und j ^ . Sobald dies geschehen ist, kann jeder andere Vektor einfach durch 2 Zahlen beschrieben werden. Zum Beispiel die Zahlen ( 1 , 2 ) bedeutet wirklich, dass wir über den Vektor sprechen x ^ + 2 j ^ .

Wie gilt die obige Diskussion hier?

Auf dem Tangentenraum ist eine natürliche Wahl der Basis die Menge der partiellen Ableitungen μ = { 0 , 1 , 2 , 3 } (vorausgesetzt wir sind dabei M 4 . Jede partielle Ableitung ist für sich genommen ein Vektor.

Nun, wenn diese Basis gewählt ist, kann jeder andere Vektor durch eine Menge von 4 Zahlen beschrieben werden v μ = ( v 0 , v 1 , v 2 , v 3 ) was dem Vektor entspricht v μ μ . In diesem Sinne ist die obige kühne Aussage wahr. Da die Grundlage partieller Ableitungen offensichtlich ist, beschreibt man einen Vektor oft einfach als ein Objekt mit einem oberen Index v μ .

Lassen Sie uns als nächstes Co-Vektoren (Mengen mit einem niedrigeren Index) diskutieren. Dies sind Elemente des dualen Vektorraums (der Raum der linearen Funktionen im Vektorraum) des Tangentialraums. Angesichts der partiellen Ableitungsbasis auf dem Tangentenraum hat man dann eine natürliche Basis in dem mit bezeichneten Kotangensraum d x μ = { d x 0 , d x 1 , d x 2 , d x 3 } . Beachten Sie, dass jedes Differential selbst ein Covektor ist. Diese natürliche Basis wird durch die Relation definiert d x μ ( v ) = δ v μ . Sobald diese natürliche Basis gewählt ist, kann wie zuvor jedes Element des Kotangensraums durch 4 Zahlen beschrieben werden, nämlich v μ = { v 0 , v 1 , v 2 , v 3 } was dem Covektor entspricht v μ d x μ .

Zusammenfassend , _ μ für jeden μ einem 4-dimensionalen Vektor entspricht, wohingegen v μ für jeden μ entspricht 4 Komponenten eines einzelnen Vektors. Ähnlich, d x μ für jeden μ entspricht einem 4-dimensionalen Covektor, wohingegen v μ für jeden μ entspricht 4 Komponenten eines einzelnen Covektors.

PS 1 - Manchmal verwenden Leute gerne andere Basen als μ und d x μ auf den Tangenten- bzw. Kotangensräumen. Diese sind als nicht-koordinierte Basen bekannt.

PS 2 - Nur um klar zu sein, μ ist ein Vektor, aber μ F ist eine Funktion

Es ist interessant festzustellen, dass Elie Cartan nicht geschrieben hat d x ich wie wir es heute tun. Er hatte die sorgfältigen, Ricci-ähnlichen Unterscheidungen mit Indizes noch nicht übernommen. für ihn, x ich war keine Komponente oder Koordinate von irgendetwas: es war eine Funktion auf der Mannigfaltigkeit oder zumindest auf einer kleinen Nachbarschaft, also war es eine Form vom Grad Null, hatte überhaupt keine Komponenten, war weder kovariant noch kontravariant, es ist genau dasselbe wie x oder X oder Z . Nun ist das "d" ein Operator, der bei Anwendung auf p-Formen ergibt ( p + 1 ) Formen, also, wenn sie angewendet werden x 1 , ergibt es eine 1-Form, die ein Kotangensvektor an jedem Punkt in der Mannigfaltigkeit ist. Also ein Covektor, also kovariant. So d x ich hat kovariante Komponenten. Aber es ist ein Covektor. Seine Bestandteile sind x ich x 1 usw. Nun auf die gleiche Weise, x ich ist ein Vektor (Feld, dh ein Vektor, der von dem Punkt in der Mannigfaltigkeit abhängt). Es ist nicht die Komponente von irgendetwas, aber es hat Komponenten. Dies dient der Korrektur von Punkt 4 von @Qmechanic .

Ihre Verwirrung wäre ausgeräumt, wenn Sie für die Koordinatenfunktionen keine Indizes verwenden, sondern sie x, y und z nennen würden. Oder auch nur x und y. Zwei Dimensionen reichen oft aus, um die meisten Dinge zu klären. Und vergessen Sie die Einstein-Konvention oder Summenzeichen, schreiben Sie die Summen explizit aus. Die Verwendung von Indizes zur Angabe verschiedener Objekte, in diesem Fall von Funktionen, kann zu ernsthafter Verwirrung bei der Verwendung von Indizes zur Angabe der verschiedenen Komponenten des Objekts führen. Cartan setzte die Indizes unter das x, x ich , weil wir dachten an n verschiedene Objekte, nicht die n Bestandteile eines Objekts. Skalare Funktionen haben überhaupt keine Komponenten ....