Strenge Definition der Variation

In der Physik ist es üblich, im Zusammenhang mit der Variationsrechnung von der Variation zu sprechen . Insbesondere bei einer Aktion S Das ist ein Funktional, wir sprechen von der Variation δ S .

Im Kontext der Klassischen Mechanik kann man das Variationsprinzip folgendermaßen verstehen: Wir betrachten die Konfigurationsmannigfaltigkeit M des Teilchensystems und wir betrachten die Lagrange-Funktion als L : T M R auf dem Tangentialbündel definiert.

In diesem Fall definieren wir die Aktion S als die auf Pfaden definierte Funktion γ : [ A , B ] R M von

S [ γ ] = A B L ( γ ( T ) , γ ' ( T ) ) D T .

Dann betrachten wir eine Variation des Pfades als eine parametrisierte Familie von Pfaden ϕ : [ A , B ] × ( ϵ , ϵ ) M so dass ϕ ( T , S ) = γ S ( T ) .

In diesem Fall erhalten wir eine Funktion

S [ γ S ] = A B L ( ϕ ( T , S ) , T ϕ ( T , S ) ) D T

Damit wir das Extremum davon studieren können R R funktionieren durch Differenzieren

D S [ γ S ] D S = D D S A B L ( ϕ ( T , S ) , T ϕ ( T , S ) ) D T

und dies kann mit einem Diagramm gelöst werden ( U , Q ) An M die zu einem Diagramm hebt ( T U , ( Q , Q ˙ ) ) An T M .

Obwohl dies streng ist, definiert dies nicht die Variationsoperation. Derzeit studiere ich Allgemeine Relativitätstheorie, und im Kontext der klassischen Feldtheorie tauchte dieses Variationskonzept häufig auf.

In der Tat berechnet man beim Ableiten der Einstein-Gleichungen aus der Einstein-Hilbert-Aktion die Variation δ S und setzt es auf null. Dazu gehört das Rechnen δ R A B Zum Beispiel.

Mit anderen Worten wirkt diese Variationsoperation auf das Aktionsfunktional, so dass das Variationsprinzip wird δ S = 0 , wirkt aber auch auf C Funktion auf dem Verteiler mögen δ R A B .

Meine Frage hier ist: Wie definiert man in diesem Kontext der Allgemeinen Relativitätstheorie und der klassischen Feldtheorie die Variationsoperation streng δ ? Wie kann es sowohl auf Funktionale als auch auf Funktionen einwirken? In welcher Beziehung steht es zu dem traditionellen Ansatz der Klassischen Mechanik, den ich oben skizziert habe?

Ich habe das Gefühl, Ihre Frage ähnelt einer Funktion F ( X ) , warum kannst du schreiben D F Und D X für einen Differentialoperator D . Ich kann mir den Variationsoperator nicht vorstellen δ etwas anders als das normale sein D , außer dem Raum, in dem es lebt.
Aber eine Funktion wie die, von der Sie sprechen, ist auf einer glatten Mannigfaltigkeit definiert M und hat eine genaue Definition von D F . Wir definieren D F das Kovektorfeld sein, so dass D F ( X ) = X F für alle Vektorfelder X . Wir können nicht dasselbe für S , seit S ist nicht auf einer glatten Mannigfaltigkeit definiert, sondern auf einer Menge von Funktionen. Im Prinzip könnte dieser Satz von Funktionen mit einer solchen Struktur ausgestattet werden, aber ich glaube, es wäre höchst unnatürlich und umständlich. Also ich glaube, der genaue Weg, um Sinn zu machen δ ist ein bisschen anders. Das ist mein Punkt hier.
Ich glaube nicht, dass der Veranstaltungsraum S ist strukturlos. Wir haben zumindest zusätzliche Funktionen, also S ist ein Vektorraum. In der Physik gehen wir davon aus, dass Funktionen zueinander konvergieren können. Dazu bedarf es eines Normbegriffs. Wir gehen normalerweise auch davon aus S ist nach dieser Norm vollständig. Somit S ist ein vollständiger normierter Vektorraum (Banachraum), der eine Frechet-(Funktions-)Ableitung zulässt. Zugegebenermaßen bin ich mit der formalen Mathematik nicht vertraut, daher ist dies keine vollständige Antwort.
Das ist IMHO nicht ganz der Punkt. Die Aktion S ist eine Funktion. Es ist auf dem Raum der Wege definiert C ( ICH , M ) Wo ICH = [ A , B ] R . Nun, der Raum C ( ICH , M ) trägt nicht die Struktur eines Vektorraums. M hat nicht unbedingt Operationen über Punkte. Da für jeden T [ A , B ] , γ ( T ) M es ist nicht klar, wie wir uns bilden können λ γ + a , da punktweise Operationen nicht verfügbar sind. Die Aktion ist eine Karte S : C ( ICH , M ) R und da C ( ICH , M ) ist kein Vektorraum, von dem wir nicht über eine Frechet-Ableitung sprechen können S .

Antworten (2)

Eine Definition kann durch direkte Verallgemeinerung der auf die Frage gegeben werden. Nimm den Raum der Felder als den Raum C ( X , M ) glatter Funktionen zwischen zwei Mannigfaltigkeiten. Für jede reibungslose Funktion S : C ( X , M ) R und jede Familie von Feldern mit einem Parameter H : R × X M Wir können eine Funktion definieren F S , H C ( R ) von F S , H ( T ) = S ( H T ) . Die Variation δ S ist das Differenzial D F S , H dieser Karte.

Im Fall der Mechanik spezialisieren wir uns nur auf diese Definition X = [ A , B ] . In der allgemeinen Relativitätstheorie X ist die Raumzeit. R μ v sollte in diesem Zusammenhang als Funktion über der Mannigfaltigkeit gesehen werden, die jedem Punkt zuordnet X X ein funktionales R μ v ( X ) der Metrik.

Der Benutzer coconut war schneller (und kürzer), daher zielt die Antwort möglicherweise eher darauf ab, die technischen Aspekte der Variationsrechnung für die (lokale) klassische Feldtheorie ein wenig zu erweitern.

Ein Physikbuch, das ziemlich gute Arbeit bei der Definition der Variation eines Aktionsfunktionals für die Feldtheorie leistet, ist General Relativity von Robert M. Wald (University of Chicago Press, 1984) – siehe Anhang E, S. 450ff. Da es aber noch ein paar technische Details außer Acht lässt, skizziere ich im Folgenden die Vorgehensweise.

Die Idee ist im Wesentlichen die gleiche, die Sie für die klassische Mechanik geschrieben haben. Man versteht Feldkonfigurationen (darunter die Raum-Zeit-Metrik G ) als glatte Abschnitte

ϕ Γ ( π ) := { ϕ C ( M , E )   |   π ϕ = ich D M }
eines Faserbündels π : E M über der Raum-Zeit-Mannigfaltigkeit M . (Endliche) Feldvariationen sind dann nur glatte Abbildungen Φ : M × ICH E , Wo ICH R ist ein offenes Intervall, so dass
ϕ S := Φ ( , S ) Γ ( π )
für alle S ICH . Letzteres bedeutet das ϕ S ( P ) = Φ ( P , S ) π 1 ( P ) für alle P M , S ICH - insbesondere, wenn (sagen wir) 0 ICH Und ϕ 0 = ϕ , dann eine unendlich kleine Feldvariation herum ϕ würde jeweils gegeben werden P M von δ ϕ ( P ) = Φ ( P , S ) S | S = 0 . Es folgt dem δ ϕ kann als glatter Abschnitt des Pullbacks angesehen werden
ϕ v E := { ( P , X ) M × v E   |   ϕ ( P ) = π T E ( X ) }
des vertikalen Bündels
π T E : v E := { X T E   |   T π ( X ) = 0 T M } E
unter ϕ , der als "Tangentenvektor" angesehen werden kann Γ ( π ) bei ϕ . Umgekehrt, wenn Sie eine (vollständige) Riemannsche Metrik auf die Fasern von setzen E , können Sie die ihnen zugeordnete Exponentialkarte verwenden, um eine Feldvariation aus einer infinitesimalen zu erstellen.

Dies ist ungefähr das Bild von Γ ( π ) als unendlich dimensionale Mannigfaltigkeit (es gibt einige Vorbehalte, die im technischen Anhang am Ende dieser Antwort kurz erörtert werden, aber im Folgenden keine Rolle spielen).

Um von dort zu Aktionsvariationen zu gelangen, muss man zunächst skizzieren, was ein Aktionsfunktional ist. Daran erinnern, dass eine funktionale auf Γ ( π ) ist nur eine Karte F : Γ ( π ) C . Es stellt sich heraus, dass eine Aktion kein einzelnes Funktional ist, sondern eine Familie von Funktionalen { S K   | K M  kompakt } so dass S K ( ϕ 1 ) = S K ( ϕ 2 ) für alle ϕ 1 , ϕ 2 Γ ( π ) so dass ϕ 1 = ϕ 2 An K . Hier geht es darum, die (am häufigsten anzutreffende) Möglichkeit zu berücksichtigen, nach der die Lagrange-Dichte ausgewertet wurde ϕ ist insgesamt nicht integrierbar M . Verlangt man dazu das jede S K ist lokal und hängt von den Ableitungen von ab ϕ auf Bestellung (sagen) R (in einem genauen Sinne, den ich hier nicht definieren werde), folgt daraus

S K ( ϕ ) = K L ( P , ϕ ( P ) , ϕ ( P ) , , R ϕ ( P ) ) D N X   ,
wo die Lagrange-Dichte L ist glatt in seinen Argumenten (das verlangen wir auch L hängt nicht davon ab K , natürlich - dies kann in Kompatibilitätsbedingungen zwischen den verschlüsselt werden S K 's, deren Details für uns hier irrelevant sind).

Ich bin absichtlich locker bei der Definition von Ableitungen (erster und höherer Ordnung). k ϕ von glatten Abschnitten ϕ von π (die verschlüsseln, im Fall von ϕ = G , die Krümmung von G und so weiter), da dies den Begriff von Strahlbündeln erfordert π , der etwas langatmig ist und uns hier von unserem Hauptziel ablenken wird (ich kann später ein paar Details dazu hinzufügen, wenn Sie es für nötig halten). Sobald dies alles eingestellt ist, wird die (endliche) Variation von S K korrespondierend zu Φ ist nur S K ( ϕ S ) , und die entsprechende infinitesimale Variation ist gerade

δ S K ( ϕ ) = D D S | S = 0 S K ( ϕ S )   .
An dieser Stelle wird dies zu einer normalen Differenzierung unter dem Integralzeichen, was unter den obigen Anforderungen durchaus zulässig ist.

Ein wichtiger Schritt in der Informatik δ S K ( ϕ ) soll zeigen, dass Faser- und Basenderivate pendeln , d.h

k Φ ( P , S ) S = k Φ ( P , S ) S   ,
so dass k ( δ ϕ ) = δ ( k ϕ ) , für alle k R . Auf diese Weise erhält man die üblichen Divergenzterme, die in Standardbehandlungen der Variationsrechnung vorkommen. Um diese loszuwerden (zum Beispiel bei der Ableitung der Euler-Lagrange-Gleichungen), kann man annehmen, dass die infinitesimalen Feldvariationen im Inneren von unterstützt werden K (weitere Informationen hierzu finden Sie im technischen Anhang unten) bei Bedarf.

Es ist wichtig zu beachten, dass das oben erläuterte Variationsprinzip inhärent lokal ist, so dass die obigen Überlegungen tatsächlich unabhängig davon sind K .

( Technischer Anhang: Wenn Sie eine Art glatte Verteilerstruktur haben möchten Γ ( π ) , müssen Sie angeben, welche Modellvektorräume Sie verwenden. Es stellt sich heraus, dass Sie verwenden müssen

Γ C ( ϕ v E M ) := { X ϕ Γ ( ϕ v E M )   |   X ϕ  hat kompakte Unterstützung }
als Modelle, ansonsten die resultierende Topologie von Γ ( π ) (unter Verwendung der im zweiten Absatz oben erwähnten Exponentialkarten zum Erstellen eines Atlas) ist nicht garantiert, dass sie lokal pfadweise verbunden sind (dies kann fehlschlagen, wenn M ist nicht kompakt), also keine Mannigfaltigkeitstopologie. Dies hat zur Folge, dass Feldvariationen eingeschränkt werden sollten Φ so sein, dass für jedes kompakte (= abgeschlossene und beschränkte) Teilintervall J ICH Es gibt eine kompakte Teilmenge K M so dass Φ ( P , S ) ist ständig an ( M K ) × J . Der Grund dafür ist, dass diese Feldvariationen mit dem oben genannten Atlas genau die glatten Kurven von werden Γ ( π ) , und daher Γ C ( ϕ v E M ) = T ϕ Γ ( π ) wird der Tangentenraum (ohne Anführungszeichen) zu Γ ( π ) bei ϕ . Interessanterweise sind dies genau die Art von Feldvariationen, die zur Ableitung der Euler-Lagrange-Gleichungen benötigt werden, was ihrer Bedeutung ein zusätzliches Gewicht verleiht, das über die bloße ästhetische Anforderung der Konsistenz mit einer mannigfaltigen Struktur hinausgeht Γ ( π ) . Ein weiteres technisches Detail ist, dass bei Verwendung der standardmäßigen (induktiven Grenze) lokal konvexen Vektorraumtopologie von Γ C ( ϕ v E M ) um die Topologie von zu induzieren Γ ( π ) Durch den obigen Atlas erhält man eine topologische Mannigfaltigkeitsstruktur (die übrigens die sogenannte Whitney-Topologie auf Γ ( π ) ) aber nicht glatt . Für letzteres müssen Sie die durch die glatten Kurven induzierte endgültige Topologie verwenden
Ξ : R Γ C ( ϕ v E M )
An Γ C ( ϕ v E M ) , das feiner ist als sein Standard. Die sanften Rundungen Ξ An Γ C ( ϕ v E M ) , sind ihrerseits glatte Karten Ξ : M × ICH E , Wo ICH R ist ein offenes Intervall, so dass
X S := Ξ ( , S ) Γ C ( ϕ v E M )
für alle S ICH so dass für jedes kompakte Teilintervall J ICH Es gibt eine kompakte Teilmenge K M so dass die Unterstützung von X S darin enthalten ist K für alle S J . (Erinnern Sie sich daran, dass die Unterstützung eines Abschnitts X eines Vektorbündels vorbei M ist die kleinste abgeschlossene Teilmenge S u P P X von M so dass X entspricht dem Nullabschnitt außen S u P P X ) Für (viele) weitere Details zu dem hier skizzierten Verfahren siehe das Buch von Andreas Kriegl und Peter W. Michor, The Convenience Setting of Global Analysis (AMS, 1997))

Danke für die Antwort. Ist es wirklich notwendig, den Raum von Abschnitten mit einer glatten Verteilerstruktur zu behandeln? Können wir dies nicht mit dem Strahlbündelformalismus vermeiden und alles in einer endlichdimensionalen Mannigfaltigkeit tun? Ich habe davon gehört, als ich versuchte, das Feld Lagrange in dieser Frage zu verstehen ( Physics.stackexchange.com/questions/143543/… ), daher glaube ich, dass es mit dieser neuen Frage zur Variation zusammenhängt.
Wenn Sie sich nur für die kinematische Struktur feldtheoretischer Modelle aus der Sicht von Feldkonfigurationen interessieren und wie man Variationsgleichungen wie die Euler-Lagrange-Gleichungen herleiten kann, reicht in der Tat der Jet-Bundle-Formalismus aus. Der Grund dafür ist, dass der von uns definierte Begriff der Feldvariation selbst lokal ist . Dies reicht nicht mehr aus, wenn Sie die Lösungsräume von Variationsgleichungen untersuchen wollen. Menschen, die mit dem Strahlbündelformalismus arbeiten, behandeln die Feldlösungsräume normalerweise formal, ohne Rücksicht auf die spezifische Struktur der Bewegungsgleichungen.
Wenn Sie die Feldtheorie aus der Sicht von Observablen (= Funktionalen) studieren möchten, sind lokale Funktionale wie das Aktionsfunktional in einem kompakten Bereich nicht unter Produkten abgeschlossen. Wenn Sie wirklich eine Algebra von Observablen wollen, müssen Sie sich mit nichtlokalen Funktionalen befassen. Dies wird noch schlimmer, wenn Sie eine Art Poisson-Struktur haben möchten - Sie können versuchen, Lösungen mit Anfangsdaten zu identifizieren, um eine lokale Formel für die Poisson-Klammer zu erhalten, aber genau diese Identifizierung ist nicht lokal und wird nach der Quantisierung vermasselt , speziell für interagierende Modelle.