Funktionale Ableitung in der Lagrange-Feldtheorie

Das folgende funktionale Derivat gilt:

δ q ( t ) δ q ( t ' )   =   δ ( t t ' )
und
δ q ˙ ( t ) δ q ( t ' )   =   δ ' ( t t ' )
wo ' ist d / d t .

Frage: Was ist

δ q ( t ) δ q ˙ ( t ' ) ?
Ich frage dies, weil der Dozent in QFT das kanonische Impulsfeld auf definiert hat ϕ durch
π ( x , t )   :=   δ L ( t ) δ ϕ ˙ ( x , t ) ,
wo L ist die Lagrange-Funktion, ein Funktional des Feldes: L [ ϕ , μ ϕ ] = d d x L ( ϕ , μ ϕ ) .

Ich weiß, ich sollte bekommen

π ( x , t )   =   L ( x , t ) ϕ ˙ ( x , t ) .
(Beachten Sie, dass es jetzt eine partielle Ableitung in Bezug auf die Lagrange-Dichte ist.) Aber wenn ich es tue, bekomme ich:
δ L = d d x L ϕ δ ϕ + L μ ϕ δ μ ϕ .
Irgendwie ignorieren wir also den ersten Term d d x L ϕ δ ϕ ! Warum ist das so?

Es kann nicht sein, dass wir behandeln δ ϕ und δ ϕ ˙ als unabhängig, denn wenn ich die funktionale Ableitung bzgl. nehmen würde ϕ ( x ' ) , müsste ich den Punkt verschieben δ ϕ ˙ nach L ϕ ˙ was mir geben wird

d d x ( L ϕ μ L μ ϕ ) δ ϕ

dh die funktionale Ableitung ergibt die Euler-Lagrange-Gleichungen.

Wie nehme ich also die funktionale Ableitung einer Funktion zur Ableitung einer Funktion?

Antworten (2)

Entgegen Ihrer Behauptung gegen Ende Ihrer Frage behaupte ich, dass die Zeitableitung des Feldes als "unabhängiges" Argument der Lagrange-Funktion behandelt wird . Ich werde versuchen, Sie davon zu überzeugen, indem ich Ihnen zeige, wie diese Unabhängigkeit dazu führt, dass alles so funktioniert, wie Sie es sich vorstellen. Einige der wichtigsten Punkte befinden sich am Ende, also lesen Sie bitte ganz durch, bevor Sie der Skepsis erliegen.

Gehen wir der Einfachheit halber von vornherein davon aus, dass es sich um eine klassische Feldtheorie handelt ϕ : R 2 R . Lassen F bezeichnen die Menge der zulässigen Felder in dieser Theorie. Das erste Feldargument bezeichnen wir mit t und das zweite Argument mit x , also schreiben wir ϕ ( t , x ) wie gewöhnlich.

Ok, jetzt wenden wir uns dem Lagrange zu. Um dies richtig zu beschreiben, stellen Sie sich vor, Sie nehmen die x Argument eines Feldes in unserer Theorie fixiert, dann ergibt dies eine reellwertige Funktion einer einzelnen, reellen Variablen ϕ ( , x ) : R R . Nehme an, dass G bezeichnet die Menge solcher Funktionen. Dann kann die Lagrange-Funktion als Funktion definiert werden L : F × F G . Mit anderen Worten, es nimmt zwei Funktionen auf, die abgebildet werden R 2 R und gibt eine abbildende Funktion aus R R . Wir bezeichnen das erste Argument suggestiv mit ϕ und das zweite Argument suggestiv von ϕ ˙ , aber im Prinzip kann man werten L auf welchen Feldern auch immer ϕ und ψ die man zum Beispiel auswählt und schreibt L [ ϕ , ψ ] . Ich behaupte, dass die Definitionen der relevanten funktionellen Derivate wie folgt sind:

δ L δ ϕ ( t , x ) [ ϕ , ϕ ˙ ] ( t ) = lim ϵ 0 L [ ϕ + ϵ Δ x , ϕ ˙ ] ( t ) L [ ϕ , ϕ ˙ ] ( t ) ϵ δ L δ ϕ ˙ ( t , x ) [ ϕ , ϕ ˙ ] ( t ) = lim ϵ 0 L [ ϕ , ϕ ˙ + ϵ Δ x ] ( t ) L [ ϕ , ϕ ˙ ] ( t ) ϵ
wobei ich die Notation verwende
Δ x ( t , x ' ) = δ ( x ' x )
Beachten Sie, dass dies im Wesentlichen wie partielle Ableitungen ist, da wir die Argumente von variieren L unabhängig.

Angenommen, wir haben eine Theorie, die durch eine Lagrange-Dichte beschrieben wird, die eine lokale Funktion des Felds und seiner ersten Ableitungen ist. Dann wird die Lagrange-Dichte als Funktion definiert L : R 3 R , und weil wir davon ausgehen, dass wir die Werte des Feldes und seiner Ableitungen in die Argumente der Lagrange-Dichte einsetzen werden, kennzeichnen wir seine drei Argumente mit den Symbolen ϕ , ϕ ˙ , ϕ ' . Die Symbole ϕ ˙ und ϕ ' sollen andeutend darauf hinweisen, dass die Argumente der Lagrange-Dichte auf die Werte eines Feldes und seiner zeitlichen und räumlichen Ableitung ausgewertet werden sollen. Dies ist natürlich ein bisschen ein Notationsmissbrauch ϕ In der Regel ist als Symbol für das Feld eine Funktion reserviert R 2 R , nicht für die Werte des Feldes. Aber solange wir diesen Notationsmissbrauch im Hinterkopf behalten, sollten wir uns nicht verwirren lassen. Dann haben wir

L [ ϕ , ϕ ˙ ] ( t ) = d x ' L ( ϕ ( t , x ' ) , ϕ ˙ ( t , x ' ) , ϕ ' ( t , x ' ) )
Wenden wir nun die obigen Definitionen der funktionalen Ableitungen an und sehen, was wir bekommen. Zum einen haben wir
δ L δ ϕ ˙ ( t , x ) [ ϕ , ϕ ˙ ] ( t ) = lim ϵ 0 d x ' L ( ϕ ( t , x ' ) , ϕ ˙ ( t , x ' ) + ϵ δ ( x ' x ) , x ' ϕ ( t , x ' ) ) d x ' L ϵ = d x ' L ϕ ˙ ( ϕ ( t , x ' ) , ϕ ˙ ( t , x ' ) , ϕ ' ( t , x ' ) ) δ ( x ' x ) = L ϕ ˙ ( ϕ ( t , x ) , ϕ ˙ ( t , x ) , ϕ ' ( t , x ) )
Das ist genau das, was Sie in Ihrer Frage gesagt haben. Ebenso überlasse ich es Ihnen zu zeigen, dass die obige Definition nachgibt
δ L δ ϕ ( t , x ) [ ϕ , ϕ ˙ ] ( t ) = L ϕ ( ϕ ( t , x ) , ϕ ˙ ( t , x ) , ϕ ' ( t , x ) ) x [ L ϕ ' ( ϕ ( t , x ) , ϕ ˙ ( t , x ) , ϕ ' ( t , x ) ) ]
oder, wenn wir die Notation etwas lockern, da wir wissen, was wir jetzt tun, können wir dies zusammenfassen als
δ L δ ϕ ˙ = L ϕ ˙ , δ L δ ϕ = L ϕ x L ϕ '
Nehmen wir nun an, wir wollen die Euler-Lagrange-Gleichungen erhalten. Dazu definieren wir die Wirkung für unsere Theorie als Funktion S : F R folgendermaßen:
S [ ϕ ] = d t L [ ϕ , ϕ ˙ ] ( t )
Beachten Sie, dass hier das Symbol ϕ ˙ bezeichnet die partielle zeitliche Ableitung des Feldes ϕ , nämlich ϕ ˙ = t ϕ . Der entscheidende Punkt hier ist, dass wir, obwohl die Argumente der Lagrange-Funktion unabhängig sind, immer die Freiheit haben, die Argumente für ein Feld und seine Ableitung zu bewerten , die sicherlich nicht unabhängig sind. Insbesondere bedeutet dies, dass wir, wenn wir die Aktion variieren, im Integral auf der rechten Seite die Art der Integration nach Teilen durchführen können, von der Sie befürchteten, dass wir dies nicht tun könnten. In der Tat, wenn Sie die Aktion variieren, werden Sie das finden
δ S [ ϕ ] = d t d x [ δ L δ ϕ t δ L δ ϕ ˙ ] δ ϕ
Setzen wir also die Variation auf Null und verwenden die Ergebnisse, die ich oben unter Verwendung der beanspruchten Definitionen der partiellen Variationsableitungen abgeleitet habe, erhalten wir die Standard-Euler-Lagrange-Gleichungen
L ϕ t L ϕ ˙ x L ϕ ' = 0.

@dj_mummy Tja was du da geschrieben hast ϵ Ableitungen sind die Standardmethode zum Definieren von Variationen, aber sobald die Definitionen vorgenommen wurden, ist es oft viel bequemer, Symbole in Kurzschrift zu schreiben. Ich würde auf jeden Fall bei Beschwerden zustimmen, dass die δ Notation führt oft zu Verwirrung und mathematischem Unsinn, aber für diejenigen, die die genauen Definitionen kennen, ist sie meiner Meinung nach eine nützliche Notation.
@joshphysics Hallo Josh, danke für deine Antwort. Ich habe es schließlich selbst herausgefunden (nachdem ich gepostet habe, was typisch ist -.-), aber was Sie getan haben, ist trotzdem richtig, aber ich glaube nicht, dass Sie gut erklärt haben, warum die Variation in ϕ und ϕ ˙ kann als unabhängig betrachtet werden, wenn in QM (nicht QFT) die Variation in q und q ˙ sind eindeutig nicht unabhängig. Die Lösung ist, dass wir den kanonisch konjugierten Impuls zum Feld nur zu einem festen Zeitpunkt definieren: π ( x , t 0 ) . Jetzt L = L [ ϕ ( x , t 0 ) , ϕ ˙ ( x , t 0 ) , ich ϕ ( x , t 0 ) ] Also in dieser Momentaufnahme,
wir können die Felder variieren δ ϕ zu einem anderen festen Zeitpunkt, aber das gibt mir auch die Freiheit zu variieren, wie schnell sich das Feld zu diesem anderen festen Zeitpunkt bewegt, also δ ϕ ( x ' , t ' ) und δ ϕ ˙ ( x ' , t ' ) sind unabhängige Variationen. Beachten Sie, dass δ ich ϕ ist nicht unabhängig von δ ϕ - weil ein neues gegeben ϕ ( x , t 0 ) bei t 0 , ist die Änderung der räumlichen Gradienten bekannt, was zur partiellen Integration und den Euler-Lagrange-Gleichungen nur in Raumkoordinaten führt. Schließlich führen sie zu denselben Variationen, die Sie aufgeschrieben haben
und zu machen π sich in der Zeit entwickeln, in QFT entwickeln wir Operatoren auf die übliche Weise, indem wir mit dem einheitlichen Zeitentwicklungsoperator darauf reagieren: π ( x , t ) = U ( t ) π ( x , 0 ) U ( t ) .
@nervxxx Entschuldigung, meine Antwort war nicht aufschlussreicher. Ein paar Dinge: Es ist nicht klar, wie Quanten hier relevant sind. Diese Probleme sind in der klassischen Mechanik und der klassischen Feldtheorie vorhanden. Bei der klassischen Mechanik q und q ˙ werden im Lagrange (denken Sie an den Phasenraum) als "unabhängig" behandelt, aber der Begriff der funktionalen Ableitungen von L ist nicht mehr besonders relevant, da es nicht das Integral einer Dichte ist. Wir können jedoch funktionale Ableitungen der Wirkung nehmen, die üblicherweise nur als Funktion von Pfaden und nicht von deren Ableitungen angesehen wird
, also stimme ich zu, dass es in diesem Fall ziemlich künstlich wäre, die Aktion um a zu erweitern q ˙ Argument und nehmen Sie unabhängige funktionale Ableitungen in Bezug auf q und q ˙ .
Können Sie einen Hinweis geben
@ bgr95 Es tut mir leid, dass ich keine gute Referenz dafür kenne. Wenn Sie einen finden, lassen Sie es mich bitte wissen.

Diese Antwort kann als Ergänzung zur richtigen Antwort von Joshphysics angesehen werden, wobei möglicherweise etwas andere Dinge betont und etwas andere Wörter verwendet werden.

Vor der Definition von funktionalen/variativen Ableitungen im Lagrange-Formalismus ist es entscheidend, genau zu verstehen, welche Variablen unabhängig voneinander sind und welche nicht? Mit anderen Worten, welche Variablen können wir frei variieren und welche nicht?

Dies ist am einfachsten in Punktmechanik (PM) zu verstehen, siehe zB diesen Phys.SE-Beitrag. Hier konzentrieren wir uns auf n + 1 dimensionale Feldtheorie (FT) mit n räumliche Dimensionen und eine zeitliche Dimension.

Nehmen wir der Einfachheit halber an, dass es nur ein Feld gibt q (das wir aus semantischen Gründen als Positionsfeld bezeichnen). Das Feld q ist dann eine Funktion q : R n × [ t ich , t f ] R . Es gibt auch ein Geschwindigkeitsfeld v : R n × [ t ich , t f ] R .

I) Gegeben sei ein beliebiger, aber fester Zeitpunkt t 0 [ t ich , t f ] . Die (momentane) Lagrange-Funktion ist ein lokales Funktional

(1) L [ q ( , t 0 ) , v ( , t 0 ) ; t 0 ]   =   d n x   L ( q ( x , t 0 ) , q ( x , t 0 ) , 2 q ( x , t 0 ) , , N q ( x , t 0 ) ; v ( x , t 0 ) , v ( x , t 0 ) , 2 v ( x , t 0 ) , , N 1 v ( x , t ) ; x , t 0 ) ,

wo bezeichnet die räumliche (im Gegensatz zur zeitlichen) Ableitung. Hier N für eine lokale FT endlich ist, und N 1 für eine relativistische FT. Die Lagrange-Dichte L eine Funktion der in Gl. (1) aufgeführten Variablen ist.

Die (momentane) Lagrange-Funktion (1) ist ein Funktional sowohl der momentanen Position q ( , t 0 ) und die Momentangeschwindigkeit v ( , t 0 ) im Augenblick t 0 . Hier q ( , t 0 ) und v ( , t 0 ) sind unabhängige Variablen. Genauer gesagt handelt es sich um unabhängige (räumlich verteilte) Profile oder anders ausgedrückt um unabhängige Funktionen R n R über dem x -Platz. Die (momentane) Lagrange-Funktion (1) kann im Prinzip auch explizit davon abhängen t 0 . Beachten Sie, dass die (momentane) Lagrange-Funktion (1) nicht von der Vergangenheit abhängt t < t 0 noch die Zukunft t > t 0 .

Daher ist es sinnvoll, zeitgleiche funktionale Differentiationen als zu definieren

δ q ( x , t 0 ) δ q ( x ' , t 0 )   =   δ n ( x x ' ) , δ v ( x , t 0 ) δ q ( x ' , t 0 )   =   0 ,
(2) δ v ( x , t 0 ) δ v ( x ' , t 0 )   =   δ n ( x x ' ) , δ q ( x , t 0 ) δ v ( x ' , t 0 )   =   0.

Und es ist sinnvoll, kanonisches Momentum als zu definieren

(3) p ( x , t 0 )   :=   δ L [ q ( , t 0 ) , v ( , t 0 ) ; t 0 ] δ v ( x , t 0 ) ,

wo es implizit verstanden wird, dass die Position q wird in der Geschwindigkeitsdifferenzierung (3) festgehalten. In dem N 2 Fall wird die feldtheoretische Impulsdefinition (3).

(4) p ( x , t 0 )   =   ( v ( x , t 0 ) ich = 1 n d d x ich ( ich v ( x , t 0 ) ) ) L ( q ( x , t 0 ) , q ( x , t 0 ) , 2 q ( x , t 0 ) ; v ( x , t 0 ) , v ( x , t 0 ) ; x , t 0 ) .

In dem N 1 Fall wird die feldtheoretische Impulsdefinition (3) einfach zu einer partiellen Ableitung

(5) p ( x , t 0 )   =   L ( q ( x , t 0 ) , q ( x , t 0 ) ; v ( x , t 0 ) ; x , t 0 ) v ( x , t 0 ) .

II) Lassen Sie uns abschließend über die Zeit integrieren t [ t ich , t f ] . Das Aktionsfunktional lautet:

(6) S [ q ]   :=   t ich t f d t   L [ q ( , t ) , v ( , t ) ; t ] | v = q ˙ .

Hier die zeitliche Ableitung v = q ˙ kommt auf die Funktion an q : R n × [ t ich , t f ] R .

(7) δ q ( x , t ) δ q ( x ' , t ' )   =   δ n ( x x ' ) δ ( t t ' ) ,

(8) δ q ˙ ( x , t ) δ q ( x ' , t ' )   =   δ n ( x x ' ) d d t δ ( t t ' )     δ n ( x x ' ) δ ' ( t t ' ) .

Insbesondere ist es nicht sinnvoll, unabhängig bzgl. zu variieren. auf die Geschwindigkeit in der Aktion (6), während die Position fixiert bleibt.

Siehe auch diesen verwandten Phys.SE-Beitrag.

Danke für die Bearbeitung meines Beitrags, aber Sie haben ein Minuszeichen in der Variation von qdot gegen q gelöscht. Ich habe es nochmal eingefügt.
@nervxxx: Das Minuszeichen in deiner zweiten Gl. sollte nicht dabei sein: δ δ q ( t ' ) q ˙ ( t ) = δ δ q ( t ' ) d d t q ( t ) = d d t δ δ q ( t ' ) q ( t ) = d d t δ ( t t ' ) δ ' ( t t ' ) . Diese Berechnung kann auch strenger durchgeführt werden, indem Testfunktionen und zwei Integrationen nach Teil verwendet werden.
Es ist dort. Sie nehmen ein Minuszeichen auf, wenn Sie eine partielle Integration durchführen, um die Ableitung von der qdot- zur Delta-Funktion zu übertragen.
Ja, aber es gibt zwei partielle Integrationen (vor und zurück).
Was ist dann falsch an diesem Argument: q ˙ ( t ) = q ˙ ( t ' ) δ ( t t ' ) d t ' = q ( t ' ) δ ˙ ( t t ' ) d t ' . Variierend, δ q ˙ ( t ) = δ q ( t ' ) δ ˙ ( t t ' ) d t , also die funktionale Ableitung von q ˙ ( t ) wrt q ( t ' ) ist, was davor ist δ q ( t ' ) unter dem Integral, das ist δ ˙ ( t t ' ) . Ich kann sehen, wo das schief geht, wenn ich es auf die Lagrange-Funktion anwende - ich bekomme die EL-Gleichungen nicht, aber ich habe das Ergebnis δ ˙ ( t t ' ) zweimal in meinen Notizen aus einer Klasse mit dem Stringtheoretiker Alexander Polyakov geschrieben! :Ö
Diese Berechnung geht wie folgt: q ˙ ( t ) = d t '   δ ( t t ' ) q ˙ ( t ' ) = d t '   δ ( t t ' ) d d t ' q ( t ' ) = d t '   q ( t ' ) d d t ' δ ( t t ' ) = d t '   q ( t ' ) d d t δ ( t t ' ) d t '   q ( t ' ) δ ' ( t t ' ) .
Gut, danke. Anscheinend haben wir beide Recht. Ich war nur nicht vorsichtig genug, um zu überlegen, was mein Punkt bedeutete. Mein Punkt ist a d / d t ' ...