Warum machen Grenzterme das Variationsprinzip schlecht definiert?

Lassen Sie mich mit den Definitionen beginnen, an die ich gewöhnt bin. Lassen ICH [ Φ ich ] sei die Aktion für eine Sammlung von Feldern. Eine Variation der Felder über die Feldkonfiguration Φ 0 ich ( X ) ist eine Ein-Parameter-Familie von Feldkonfigurationen Φ ich ( λ , X ) so dass Φ ich ( 0 , X ) = Φ 0 ich ( X ) Wo λ ( ϵ , ϵ ) . Wir nehmen die Karte λ Φ ich ( λ , X ) differenzierbar sein. In diesem Fall ist die erste Variation definiert durch

(1) δ Φ ich ( X ) λ | λ = 0 Φ ich ( λ , X ) .

Ebenso ist die erste Variation der Aktion definiert

(2) δ ICH [ Φ ich ] D D λ ICH [ Φ λ ich ] , Φ λ ich Φ ich ( λ , ) .

Nun, so wie ich es verstehe, ist das Variationsprinzip die Aussage, dass die physikalische klassische Feldkonfiguration sein sollte Φ ich so dass δ ICH [ Φ ich ] = 0 für jede erste Variation δ Φ ich .

So kommt es meistens vor ICH [ Φ ich ] ist das Integral über die Raumzeit einer Lagrange-Dichte D -form L [ Φ ich ] . Dann wenn M hat eine Art Grenze M das kann passieren δ ICH [ Φ ich ] hat Randbedingungen, die dazu beitragen.

Nun, in diesem Artikel sagen die Autoren, dass solche Grenzterme das Variationsprinzip schlecht definiert machen (vgl. Seite 61):

Wie von Regge und Teitelboim angegeben, muss die Aktion wohldefinierte funktionale Ableitungen besitzen: diese muss von der Form sein δ ICH [ ϕ ] = ( etwas ) δ ϕ ohne zusätzliche Randbedingungen, die die Ableitung verderben. Die Wirkung muss differenzierbar sein , damit das Extremumprinzip sinnvoll ist.

Darauf wird auch auf der WP-Seite über den Gibbons-Hawking-York-Begriff in der Schwerkraft angespielt:

Die Einstein-Hilbert-Aktion ist die Grundlage für das elementarste Variationsprinzip, aus dem die Feldgleichungen der Allgemeinen Relativitätstheorie definiert werden können. Die Verwendung der Einstein-Hilbert-Wirkung ist jedoch nur bei der zugrunde liegenden Raumzeit-Mannigfaltigkeit angemessen M geschlossen ist, dh eine Mannigfaltigkeit, die sowohl kompakt als auch ohne Begrenzung ist. Für den Fall, dass der Verteiler eine Grenze hat M , sollte die Aktion durch einen Randterm ergänzt werden, damit das Variationsprinzip wohldefiniert ist.

Der oben erwähnte Grenzterm wird genau eingeführt, um einen Grenzterm aufzuheben, der auftritt, wenn man die Einstein-Hilbert-Wirkung variiert. Ich nehme dies also noch einmal so, dass das Variationsprinzip nicht gut definiert wäre, wenn die Variation der EH-Aktion einen solchen Grenzterm hätte.

Nun, obwohl dies so eine grundlegende Sache zu sein scheint, muss ich gestehen, dass ich es immer noch nicht verstanden habe:

  1. Bezüglich der Diskussion in dem verlinkten Artikel, durch wiederholte Anwendung der Liebnitz-Regel, die Variation der Lagrange-Dichte L kann immer geschrieben werden als

    (3) δ L = E ich δ Φ ich + D Θ ,
    Wo E ich sind die Bewegungsgleichungen und Θ ist das präsympletische Potential. Die Aktion ist also von der Form
    (4) δ ICH [ Φ ich ] = M E ich δ Φ ich + M Θ ,
    Ich verstehe nicht, wie die Anwesenheit von Θ hält uns davon ab, zu definieren E ich als funktionelle Derivate.

    Darüber hinaus ist für mich der vernünftigste Begriff der Differenzierbarkeit für die Aktion, dies zu sagen λ ICH [ Φ λ ich ] ist eine differenzierbare Abbildung. Ich sehe nicht, wie sich Grenzbedingungen darauf auswirken.

    Warum also Grenzbegriffe rein δ ICH [ Φ ich ] ergibt schlecht definierte funktionelle Derivate? Und in welchem ​​Sinn das macht ICH nicht differenzierbar?

  2. Noch wichtiger ist, dass sowohl das Papier als auch die WP-Seite zum GHY-Begriff darauf anspielen, dass das Variationsprinzip schlecht definiert ist, wenn δ ICH [ Φ ich ] enthält Randbedingungen. Wir haben eine Zuordnung λ ICH [ Φ λ ich ] und wir suchen ein Extremum einer solchen Karte. Ich sehe nicht, wie die Tatsache, dass δ ICH [ Φ ich ] Randterme hat, würde dieses Optimierungsproblem schlecht definiert machen.

    Warum also machen Grenzterme das Variationsprinzip schlecht definiert? Mit anderen Worten, warum ein wohldefiniertes Variationsprinzip verlangt δ ICH [ Φ ich ] Form sein δ ICH [ Φ ich ] = ( etwas ) δ Φ ich wie die Autoren des Papiers zu behaupten scheinen?

Antworten (3)

Wenn wir nicht verschwindende Randbedingungen haben, dann die Karte λ ICH [ Φ λ ich ] ist im folgenden Sinne nicht differenzierbar. Unter Verwendung einer etwas weniger ausgefeilten Notation lassen Sie

ICH [ Φ λ ich : η ] := M L ( Φ 0 ich ( X ) + λ η ( X ) , Φ 0 ich ( X ) + λ η ( X ) ) D 4 X

für eine beliebige differenzierbare Funktion η . Diese Karte ist sicherlich differenzierbar, und das finden wir

D D λ ICH [ Φ λ ich : η ] | λ = 0 = M ( L Φ 0 ich μ [ L ( μ Φ 0 ich ) ] ) η ( X )   D 4 X + M N μ L ( μ Φ 0 ich ) η ( X )   D S

Wo N μ sind die Komponenten des Flächennormalenvektors. Das ist Differenzierbarkeit im Sinne von Torten . Dieses Gateaux-Derivat hängt jedoch allgemein davon ab η wir wählen.

Das ultimative Ziel besteht darin, zu fordern, dass die Variation im Aktionsfunktional unabhängig von unserer Wahl verschwindet η . Unter der Annahme, dass der Randterm verschwindet, impliziert dies dies

M E [ Φ 0 ich ] η ( X ) D 4 X = 0 E [ Φ 0 ich ] = 0

Bei Vorhandensein der Grenzterme ist eine solche Implikation jedoch nicht möglich. Für jede bestimmte Feldkonfiguration wird die Variation im Aktionsintegral

D D λ ICH [ Φ λ ich : η ] | λ = 0 = M F ( X ) η ( X ) D 4 X + M N μ G μ ( X ) η ( X ) D S

Damit dies willkürlich verschwindet η , müssen entweder beide Integrale verschwinden oder sich gegenseitig aufheben. Im ersteren Fall sind die Randbedingungen doch nicht vorhanden, während der letztere Fall eigentlich nicht funktioniert. Um dies zu sehen, stellen Sie sich das vor

M F ( X ) η ( X ) D 4 X = M N μ G μ ( X ) η ( X ) D S = C 0

für eine Auswahl an η , und beachten Sie, dass wir immer etwas hinzufügen können η eine glatte Funktion, die an der Grenze verschwindet, aber in jedem von uns gewählten Bereich der Masse Unterstützung hat. Dies würde das erste Integral ändern, aber nicht das zweite, wodurch die Gleichheit gebrochen würde. Folglich können sich die beiden Integrale für einige Auswahlmöglichkeiten von aufheben η , sie können unmöglich alle Wahlmöglichkeiten von stornieren η (wieder, es sei denn, sie verschwinden von vornherein).

In gewissem Sinne noch schlimmer impliziert das Vorhandensein der nicht verschwindenden Randterme aus Gründen, die sich unmittelbar aus den obigen ergeben, dass die Variation so gestaltet werden kann, dass sie jeden Wert annimmt R durch entsprechende Skalierung von η .

Man kann sich das ziemlich analog zum Kalkül mit mehreren Variablen vorstellen. Die Existenz von partiellen (Gateaux) Ableitungen einer Funktion (des Wirkungsfunktionals) entlang einer bestimmten Richtung (zur willkürlichen Wahl von η ) reicht nicht aus, um zu garantieren, dass die Abbildung differenzierbar ist. In diesem Fall mit Blick auf unser Endziel, eine verschwindende funktionale Ableitung zu haben, die unabhängig von ist η , definieren wir ein Funktional als differenzierbar, wenn seine Frechet-Ableitung in die Form gebracht werden kann

D D λ ICH [ Φ λ ich : η ] | λ = 0 = M E [ Φ 0 ich ]   η ( X ) D 4 X

und definiere sein funktionelles Derivat als sein E [ Φ 0 ich ] .


Ich möchte Ihre Aussage kurz anmerken

Ich verstehe nicht, wie die Anwesenheit von Θ hält uns davon ab, zu definieren E ich als funktionelle Derivate.

Es ist ein gutes Stück Wahrheit in dem, was Sie sagen. In der Tat, wenn Sie nur die Euler-Lagrange-Gleichungen für das Feld wollen, dann könnten Sie argumentieren, dass die korrekte formale Vorschrift darin besteht, die Aktion zu variieren, alle Grenzterme wegzuwerfen und dann zu fordern, dass die Variation verschwindet. Es scheint ein bisschen unelegant, aber es würde Ihnen die Gleichungen geben, nach denen Sie suchen.

Man stößt jedoch auf Probleme, wenn man zum Hamiltonschen Rahmen übergeht. Mehrdeutigkeit in Grenzbegriffen führt zu Mehrdeutigkeit, wenn man versucht, zB Begriffe der Gesamtenergie einer bestimmten Raumzeit zu definieren. In Abwesenheit von Oberflächentermen verschwindet der Hamiltonoperator für G ich J , π ich J die den Bewegungsgleichungen gehorchen; Die Wahl eines Grenzterms läuft darauf hinaus, einen Wert für das Integral des Hamilton-Operators über die gesamte Raumzeit zu wählen, und der GHY-Term ergibt die ADM-Energie.

Solche Grenzterme sind offensichtlich auch für die Quantengravitation sehr wichtig, aber das ist ein Gebiet, mit dem ich völlig unbekannt bin, also kann ich es unmöglich vernünftig kommentieren.


Lassen Sie mich etwas fragen, Sie sagen: "In Gegenwart der Grenzbegriffe ist jedoch keine solche Implikation möglich". Wenn wir verlangen δ ICH [ Φ 0 ich ] = 0 bzgl. jeglicher Variation, dann würde dies insbesondere für kompakt gestützt gelten η ( X ) . Dies würde nicht bedeuten

M E [ Φ 0 ich ] η ( X ) D 4 X = 0
für alle kompakt unterstützt η ( X ) und wiederum implizieren E [ Φ 0 ich ] = 0 auch in Gegenwart von Randbedingungen? Was läuft hier schief?

Es hört sich so an, als würden Sie die Anforderung, dass die Aktion unter willkürlicher Variation stationär ist, durch die Anforderung schwächen, dass die Aktion nur unter Variationen mit kompakter Unterstützung stationär ist. Wenn Sie dies tun, erhalten Sie die Implikation (und damit die EL-Gleichungen) zurück. Dies bedeutet jedoch, dass Sie den Raum der "Kandidaten"-Feldkonfigurationen auf diejenigen verkleinern, die mit der ursprünglichen an der Grenze identisch sind.

Wenn Sie an keiner Art von Zeitentwicklung an der Grenze interessiert sind, dann ist dies in Ordnung; im Allgemeinen ist dies zu restriktiv. Man könnte sich zum Beispiel eine Kombination aus Anfangsbedingung und Evolutionsgleichungen vorstellen, die zwangsläufig das Feld an der Grenze verändern würde. Das Auferlegen fester (Dirichlet-)Randbedingungen zusätzlich zu den Evolutionsgleichungen und dieser speziellen Anfangsbedingung würde zu überhaupt keinen Lösungen führen.

Erschwerend kommt hinzu, dass im speziellen Fall der Schwerkraft die Lagrange-Dichte tatsächlich zweite Ableitungen der Metrik über eine totale Ableitung enthält

μ ( H μ v v Φ 0 ich )
Dies ist eine Möglichkeit, die ich in meiner obigen Arbeit nicht in Betracht gezogen habe. In diesem Fall folgt, dass der Randterm wird

M N μ [ G μ ( X ) η ( X ) + H μ v ( X ) v η ( X ) ] D S

In diesem Fall würde es nicht ausreichen, die Variation an der Grenze festzuhalten – wir müssten auch ihre Ableitungen ebenfalls festhalten. Dies ist nicht akzeptabel, da die Bewegungsgleichungen selbst zweiter Ordnung sind; beides fixieren Φ 0 ich Und v Φ 0 ich an der Grenze würde das System im Allgemeinen überbestimmen, außer in jenen zufälligen Fällen, in denen N μ H μ v 0 .

Danke für die tolle Antwort! Lassen Sie mich etwas fragen, Sie sagen: "In Gegenwart der Grenzbegriffe ist jedoch keine solche Implikation möglich". Wenn wir verlangen δ ICH [ Φ 0 ich ] = 0 bzgl. jeglicher Variante , dann würde dies insbesondere für kompakt gestützt gelten η ( X ) . Dies würde nicht bedeuten
M E [ Φ 0 ich ] η ( X ) D 4 X = 0 ,
für alle kompakt unterstützt η ( X ) und wiederum implizieren E [ Φ 0 ich ] = 0 auch in Gegenwart von Randbedingungen? Was läuft hier schief?
@ user1620696 Ich habe meine Antwort bearbeitet, um Ihre Frage zu beantworten.

Hier ist ein Kommentar. Wenn wir die Definition von OP anpassen

(4) δ ICH [ Φ ich ] = M E ich δ Φ ich + M Θ ich δ Φ ich ,

dann um für die Bulk-Laufzeit E ich und der Grenzterm Θ ich um eindeutig definiert zu werden, müssen wir zunächst auferlegen, dass sie keine Differentialoperatoren ungleich nullter Ordnung sind (agieren auf δ Φ ich ). Für die EH- Einwirkung auf eine Mannigfaltigkeit mit Rand stellt sich heraus , dass dies ohne den GHY- Randterm nicht möglich ist (wegen höherer Raumzeitableitungen in der EH-Einwirkung).

Ich stimme keiner der beiden Antworten vollständig zu, also hier eine andere. Es scheint, dass sich die Fragen von OP im Wesentlichen auf zwei einigermaßen in sich geschlossene Fragen beschränken:

Frage 1: Wie ist die funktionale Ableitung einer Wirkung definiert und beeinflussen Randbedingungen diese Definition?

Frage 2: Was macht ein Variationsprinzip wohlgestellt oder schlecht definiert und wie wirken sich Grenzterme darauf aus?


I. Über die funktionale Ableitung: Ich mag den Begriff der „funktionalen Ableitung“ nicht, weil es, wie es in den meisten physikalischen Texten und Veröffentlichungen erscheint, kein streng definiertes mathematisches Objekt oder Operator ist. Unterscheiden wir also zwischen der funktionalen Ableitung und dem Euler-Lagrange-Operator (EL-Operator).

Nehme an, dass X ist glatt N -Verteiler, π : Y X ist ein glattfaseriger Verteiler vorbei X deren (möglicherweise lokale) Abschnitte die Körper sind, die im Variationsproblem auftreten, und lassen L : J ( π ) Λ N X ein Lagrange sein N -form. In dieser Antwort möchte ich die Verwendung von Strahlräumen so weit wie möglich vermeiden, daher die Definition eines Lagranges N -Formular wird das für jeden lokalen Abschnitt sein ϕ Γ π ( U ) von π über U X es verbindet eine glatte N -form L [ ϕ ] Ω N ( U ) über U und hat die Eigenschaft, dass es eine nichtnegative ganze Zahl gibt R N (genannt die Reihenfolge von L ) so dass, wenn zwei Abschnitte ϕ , ψ beide nahe definiert X hat die gleichen Ableitungen bis einschließlich Ordnung R bei X (Ableitungen werden in Bezug auf jedes Faserdiagramm der Faserung genommen π ), Dann L [ ϕ ] X = L [ ψ ] X . Wenn wir in einem Faserdiagramm arbeiten, können wir dann einen Vertrauten schreiben

L [ ϕ ] X = L ( X , ϕ ( X ) , ϕ ( 1 ) ( X ) , , ϕ ( R ) ( X ) ) D X 1 D X N
Form für die Lagrangian N -form. Äußere Ableitungen sind dann totale äußere Ableitungen, dh sie differenzieren sich durch die funktionalen Abhängigkeiten des Feldes ϕ und seine Derivate.

Die erste Variationsformel für die Lagrange-Funktion lautet dann

δ L [ ϕ , δ ϕ ] = E ( L ) [ ϕ ] δ ϕ + D Θ [ ϕ , δ ϕ ] ,
wo überhaupt E ( L ) [ ϕ ] ist Ordnung 2 R In ϕ und algebraisch ein δ ϕ (gekennzeichnet durch die "Punktnotation") während Θ ist Ordnung 2 R 1 In ϕ und bestellen R 1 und linear ein δ ϕ .

Diese Formel gilt auch global, aber wenn R > 2 Und N > 1 dann das global Existierende Θ N 1 -Form wird nicht nur aus den Koeffizienten der Lagrange-Funktion konstruiert, sie benötigt einige zusätzliche Daten, wie eine Teilung der Einheit oder eine Verbindung. Unnötig zu sagen, dass es nicht einzigartig ist. Der Operator nullter Ordnung δ ϕ E ( L ) δ ϕ ist jedoch global definiert und eindeutig. Wir nennen L E ( L ) der EL-Operator .

Beachten Sie, dass hier keinerlei Randbedingungen erforderlich sind. Eine andere Art, die Dinge zu betrachten, ist zu definieren

E ( L ) = [ δ L ] = δ L Mod genaue Bedingungen .
Es stellt sich heraus, dass jede Klasse [ δ L ] hat einen eindeutigen Repräsentanten, der in der Feldvariation eher algebraisch als differentiell ist δ ϕ . Dieser kanonische Vertreter dieser Klasse ist genau
E ( L ) δ ϕ = k = 0 R ( 1 ) k D μ 1 D μ k L ϕ , μ 1 . . . μ k ich δ ϕ ich D N X .

Dies stimmt also im Wesentlichen mit dem überein, was OP geschrieben hat, und wurde auch in J. Murrays Antwort angedeutet. Es ist nichts Falsches daran, den EL-Operator auf diese Weise zu definieren, und tatsächlich wird es (zumindest im Geiste) in eg so gemacht. die Theorie des Variationsbikomplexes .

Im Gegensatz dazu für einen geeigneten Begriff der funktionalen Ableitung D wir würden uns folgendes wünschen:

  1. Der Raum F := Γ π ( X ) von glatten Abschnitten kann mit einer verallgemeinerten differenzierbaren Struktur ausgestattet werden.
  2. Functionals (d. h. im Grunde Funktionen auf F ) des Formulars
    S [ ϕ ] = X L [ ϕ ]
    Wo L ist eine reibungslose Bestellung R Lagrange, sind glatt.
  3. Das funktionale Derivat D ist eine Art wohldefinierter Differentialoperator für glatte Funktionen F die gewissermaßen den EL-Operator reproduzieren, z. D S = 0 E ( L ) = 0 , wann immer S ist eine Funktion vom "Aktionstyp".
  4. Die funktionale Ableitung kann im Prinzip auf Funktionale angewendet werden, die allgemeiner sind als Wirkungsfunktionale, dh solche, die "weniger lokal" sind.

Dies ist möglich und ich werde es im Anhang am Ende dieser Antwort tun. Allerdings etwas dezent. Um einige Feinheiten zu veranschaulichen, der Raum Γ π ( X ) könnte leer sein, dh die Fibration π möglicherweise keine globalen Abschnitte. Der vorherige "formale" Ansatz, der uns die Definition des EL-Operators gegeben hat, ist eine lokale Formulierung, die im Wesentlichen mit Garben (naja, eigentlich Jets) von Abschnitten arbeitet. Wenn also die Menge der globalen Abschnitte leer ist, können wir immer mehr einschränken. Weniger offensichtlich ist es, diese Lokalität in einer rein funktionalen Formulierung zu berücksichtigen, da der Funktionsraum ein für allemal festgelegt sein sollte. Auch wenn globale Schnitte existieren, das Integral S [ ϕ ] = X L [ ϕ ] konvergiert möglicherweise nicht, obwohl es als "formales Integral" (vgl. formale Potenzreihen) immer noch gültige Informationen enthält.

Da der formale Ansatz ohne Integrale arbeitet, ist dies kein Problem.

Der Punkt ist, dass OP im Wesentlichen richtig ist

Ich verstehe nicht, wie die Anwesenheit von Θ hält uns davon ab, zu definieren E ich als funktionelle Derivate.

obwohl ich nach meinem Geschmack hier den Begriff "funktionale Ableitung" durch "EL-Operator" ersetzen würde.

Trotzdem wird am Ende dieser Antwort eine strenge Definition der funktionalen Ableitung gegeben, die hoffentlich veranschaulicht, wie sich Randbedingungen auf die Definition beziehen.

II. Zur Wohlgestelltheit von Variationsprinzipien: In diesem Abschnitt werde ich mich nur mit der Variationsformulierung gewöhnlicher Differentialgleichungen (ODE) befassen. Der Grund dafür ist, dass PDE-Systeme im Gegensatz zu ODEs, wo der Existenz- und Eindeutigkeitssatz von Picard-Lindelöf einen sehr allgemeinen Satz von Kriterien für die Wohlgestelltheit von Differentialgleichungen liefert, keine analogen Theoreme haben, zumindest keine, deren Allgemeinheit vergleichbar ist.

Betrachten wir also die folgenden Daten:

  1. Ein geschlossenes und kompaktes Intervall ICH = [ T 0 , T 1 ] .
  2. Eine glatte N -Verteiler Q (Konfigurationsraum). Ich möchte mit Koordinaten arbeiten, also nehme das an Q R N ist eine offene Menge. Die Verallgemeinerung auf den Fall when Q eine allgemeinere Mannigfaltigkeit ist, ist unmittelbar.
  3. Eine glatte Lagrange-Funktion
    L [ Q ] ( T ) = L ( T , Q ( T ) , Q ( 1 ) ( T ) , , Q ( R ) ( T ) )
    der Ordnung R .
  4. Der Funktionsraum F = C ( ICH , Q ) von glatten Funktionen aus ICH Zu Q .

Wir brauchen eine allgemeine erste Variationsformel für die Lagrange-Funktion. Es ist

δ L = E ich δ Q ich + D D T ( k = 0 R 1 P ich ( k + 1 ) δ Q ( k ) ich ) ,
wo natürlich F ( k ) = D k F / D T k , und die kanonischen Impulse sind
P ich ( k ) = l = 0 R k ( 1 ) l D l D T l L Q ( k + l ) ich , 1 k R .
Beachten Sie, dass Sie formell fortfahren k = 0 wir haben P ich ( 0 ) = E ich .

II. A. Randbedingungen:

Mit einem Variationsproblem sind zwei Arten von Randbedingungen verbunden, auferlegte Randbedingungen und natürliche Randbedingungen . Dies sind nur die beiden Extreme, in der Praxis kann man eine Mischung aus beiden verwenden.

Lassen

B = { A 0 ich , A 1 ich , , A R 1 ich , B 0 ich , B 1 ich , , B R 1 ich }
ein Satz sein 2 N R Zahlen, die wir Randbedingungen nennen . Das Auferlegen von Randbedingungen bedeutet, dass wir nur diese (glatten) Trajektorien betrachten Q : ICH Q die befriedigen
Q ( k ) ich ( T 0 ) = A k ich , Q ( k ) ich = B k ich , 0 k R 1.
Lassen
F B = { Q F :   Q  erfüllt die BCs  B } .

Wenn also die Randbedingungen B auferlegt werden, betrachten wir das Variationsprinzip im reduzierten Funktionenraum F B . Da wir in dieser Klasse variieren, sind die Variationen der Trajektorien glatt und befriedigend

δ Q ( k ) ich ( T 0 ) = δ Q ( k ) ich ( T 1 ) = 0 , 0 k R 1.

Daraus folgt dann, dass die erste Variation der Aktion ist

δ S = T 0 T 1 E ich δ Q ich D T ,
da die Randterme aufgrund der Randbedingungen verschwinden. Daher die Stationaritätsbedingung δ S = 0 führt auf die Differentialgleichung E ich [ Q ] = 0 .

Um natürliche Randbedingungen zu erhalten, betrachten wir stattdessen den gesamten Raum F als Arena für das Variationsproblem. Die erste Variation der Aktion wird

δ S = T 0 T 1 E ich δ Q ich D T + k = 0 R 1 P ich ( k + 1 ) δ Q ( k ) ich | T 0 T 1 ,
mit Randtermen ungleich Null. Wenn δ S = 0 auf einer Bahn gültig sein soll Q für jede Variation δ Q , muss es auch für solche Variationen gelten, die zB. die Randbedingung erfüllen B oder Unterstützung ausschließlich innerhalb haben ICH , daher die EL-Gleichung E ich [ Q ] = 0 muss noch gelten. Wenn Sie dies jedoch wieder in die erste Variationsformel für die Aktion einfügen, erhalten Sie einen reinen Grenzterm:
δ S [ Q ] = k = 0 R 1 P ich ( k + 1 ) [ Q ] ( T 1 ) δ Q ( k ) ich ( T 1 ) k = 0 R 1 P ich ( k + 1 ) [ Q ] ( T 0 ) δ Q ( k ) ich ( T 0 ) .

Da die Variationen und ihre Ableitungen an den Endpunkten prinzipiell jeden möglichen Wert annehmen können , erhalten wir also, dass alle Koeffizienten getrennt voneinander verschwinden müssen

P ich ( k ) ( T 1 ) = P ich ( k ) ( T 0 ) = Q , 1 k R .
Mit anderen Worten, die kanonischen Impulse müssen an den Endpunkten verschwinden. Das ist dann wieder ein Satz 2 N R Randbedingungen der Funktionen Q ich ( T ) , und da sie dynamisch erschienen, nennen wir sie "natürlich".

II. B. Gut gestellte Variationsprinzipien:

Die übliche Definition für ein gut gestelltes Variationsproblem ist die folgende: Das Variationsprinzip δ S [ Q ] = 0 ist gut gestellt, wenn es unter den gegebenen (auferlegten oder natürlichen) Randbedingungen ein und nur ein Extremal der Wirkung gibt.

Wenn die Lagrange L ist Ordnung R , gibt es ungefähr drei hinreichende Bedingungen, damit das Variationsprinzip gut gestellt ist. Ich wage nicht zu behaupten, dass sie auch notwendig sind, da ich denke, dass selbst wenn einige verletzt werden, einige ungewöhnliche Unfälle passieren können, aber für die meisten Absichten und Zwecke sind diese Bedingungen auch notwendig:

  1. Der Lagrange L muss regelmäßig sein, dh
    det ( 2 L Q ( R ) ich Q ( R ) J ) 0
    .
  2. Die EL-Gleichungen E ich [ Q ] = 0 sind Ordnung 2 R (eigentlich impliziert 1. dies, aber nicht umgekehrt).
  3. Es werden keine „unglücklichen Entscheidungen über Endpunktdaten“ getroffen.

Punkt 3. ist hier am mysteriösesten, wird aber später näher ausgeführt. Die EL-Gleichungen haben die Form

E ich [ Q ] = ( 1 ) R 2 L Q ( R ) ich Q ( R ) J Q ( 2 R ) J + Terme niedrigerer Ordnung ,
also wenn Bedingung 1. erfüllt ist und die Matrix W ich J = 2 L Q ( R ) ich Q ( R ) J ist invertierbar, die Multiplikation mit dem Inversen erhalten wir
Q ( 2 R ) ich = F ich ( T , Q , Q ( 1 ) , , Q ( 2 R 1 ) )
für die EL-Gleichung, die in Standardform vorliegt, gilt das Theorem von Picard-Lindelöf (PL). Das kennen wir - einmal die erste Zeit T 0 fest ist, hat diese Gleichung eine eindeutige Lösung, vorausgesetzt, die Anfangspositionen, Geschwindigkeiten, Beschleunigungen, ..., 2 R 1 -Derivate Q ich ( T 0 ) , Q ( 1 ) ich ( T 0 ) , , Q ( 2 R 1 ) ich ( T 0 ) sind angegeben. Das ist 2 N R Anfangsdaten.

Aber wir haben gesehen, dass die Anzahl der Randbedingungen (auferlegt oder natürlich) ebenfalls ist 2 N R , also enthalten die Randbedingungen aus rein "numerologischer" Perspektive gerade genug Daten, um eine Lösung der EL-Gleichung eindeutig zu spezifizieren.

Das Variationsprinzip verlangt jedoch Randbedingungen und das PL-Theorem verlangt Anfangsdaten. "Meistens" gibt es eine bijektive Karte zwischen den beiden, aber bei "schlechter" Wahl der Endpunkte kann diese Korrespondenz zusammenbrechen. Ein typisches Beispiel ist der harmonische Oszillator

Q ¨ + k 2 Q = 0 ,
dessen allgemeine Lösung ist
Q ( T ) = C 1 cos ( k T ) + C 2 Sünde ( k T ) ,
Wo C 1 Und C 2 kann direkt auf Anfangsbedingungen bei z. B. bezogen werden. T = 0 . Betrachten Sie jedoch das Randwertproblem Q ( 0 ) = A ,   Q ( T ) = B für ein letztes Mal T . Die Beziehung ist
A = C 1 , B = C 1 cos ( k T ) + C 2 Sünde ( k T ) ,
was unlösbar ist für C 2 bezüglich A Und B Wenn T = N π / k für N Z . Also zum Beispiel, wenn wir das Intervall wählen ICH = [ 0 , π / k ] für den Bereich der Dynamik, dann wird das Variationsprinzip für den harmonischen Oszillator schlecht definiert, obwohl Bedingungen 1. (und damit 2.) erfüllt sind.

Wenn andererseits die Bedingungen 1., 2. und 3. alle erfüllt sind, dann 1) ist die EL-Gleichung in Standardform und somit gilt das PL-Theorem, 2) die Randbedingungen (auferlegt oder natürlich) ergeben genau 2 N R Datenstücke für die Differentialgleichung, 3) diese Daten können bijektiv auf Anfangsdaten abgebildet werden, daher gibt es ein eindeutiges Extremal für das Variationsproblem und somit ist das Variationsprinzip gut gestellt.

II. C. Ok, aber was hat das mit Randbedingungen zu tun?

Beginnen Sie mit einem Beispiel: Der Lagrange

L = 1 2 Q Q ¨ 1 2 k 2 Q 2 .
Dies ist ein Lagrangian zweiter Ordnung für den harmonischen Oszillator. Sie kann aus der üblichen erhalten werden, indem man eine Gesamtzeitableitung hinzufügt. Die Abwechslung ist
δ L = ( Q ¨ + k 2 Q ) δ Q + D D T ( 1 2 Q ˙ δ Q 1 2 Q δ Q ˙ ) .
Unter der Annahme eines Intervalls ICH = [ 0 , T ] und der Einfachheit halber T N π / k , sind die auferlegten Randbedingungen
Q ( 0 ) = A , Q ( T ) = B Q ˙ ( 0 ) = A ' , Q ˙ ( T ) = B ' ,
Wo A , A ' , B , B ' sind unabhängige Daten. Dies sind vier Datenelemente für eine Gleichung zweiter Ordnung, sodass man durch geeignete Angabe ein unlösbares System erstellen kann. Da es nun Randbedingungen gibt, für die es keine Extremale gibt, ist dieses Variationsprinzip nicht mehr gut gestellt.

Es sollte jedoch angemerkt werden, dass die "übliche" Lagrange-Funktion L ' = 1 2 Q ˙ 2 1 2 k 2 Q 2 ergibt ein wohlgestelltes Variationsproblem if T N π / k . Weiterhin das durch die natürlichen Randbedingungen gegebene Randwertproblem auf L tatsächlich lösbar ist, obwohl es die triviale Nulllösung liefert. Allerdings könnte man für den harmonischen Oszillator leicht einen Lagrangian erfinden, wo selbst die natürlichen Randbedingungen schlecht sind.

Allgemeiner, wenn L ist eine Bestellung R Lagrange mit kanonischen Impulsen P ich ( k ) ( 1 k R ), und die Lagrange-Funktion wird geändert als

L ' = L + D F D T ,
Wo F ist eine Bestellung R 1 Funktion (daher L Und L ' die gleiche Ordnung haben), dann ändert sich die Anzahl der Randbedingungen nicht, aber die kanonischen Impulse ändern sich wie
P ich ' ( k ) = P ich ( k ) + F Q ( k 1 ) ich .
Es ist vielleicht aufgefallen, dass die auferlegten Randbedingungen flexibel (beliebig einstellbar) sind, die natürlichen Randbedingungen jedoch nicht , dh sie sind immer so, dass die kanonischen Impulse an den Endpunkten verschwinden müssen. Die Möglichkeit, die natürlichen Randbedingungen abzustimmen, zeigt sich dann in der Äquivalenztransformation L ' = L + D F / D T , was es dann erlaubt, die natürlichen Randbedingungen beliebig zu setzen.

Allerdings die Verwandlung L ' = L + D F / D T behält auch die EL-Gleichungen bei, wenn wir sagen L ist Ordnung R Aber F ist Ordnung S 1 mit S > R . Dann jetzt L ' ist ein Lagrangian der Ordnung S > R und kommt mit 2 N S > 2 N R Randbedingungen, aber die EL-Gleichungen sind immer noch Ordnung 2 R und somit verlangen 2 N R Stücke von Daten. Die so gewonnenen zusätzlichen Randbedingungen sind im Wesentlichen willkürlich und überbestimmten das Randwertproblem. Daher wenn die Bestellung S des Lagrange, aus dem eine Ordnung 2 R Gleichung abgeleitet wird, ist so, dass 2 S > 2 R , dann ist dieses Variationsprinzip notwendigerweise schlecht definiert, da es Randbedingungen (einschließlich der natürlichen) gibt, denen kein Extremal entspricht.

Abschließend die Frage von OP

Warum also machen Grenzterme das Variationsprinzip schlecht definiert? Mit anderen Worten, warum ein wohldefiniertes Variationsprinzip verlangt δ ICH [ ϕ ] Form sein δ ICH [ ϕ ] = ( etwas ) δ ϕ wie die Autoren des Papiers zu behaupten scheinen?

kann beantwortet werden: Es ist streng genommen nicht erforderlich, dass die Variation die Form hat δ S [ ϕ ] = ( ) δ ϕ damit das Variationsprinzip wohldefiniert ist, da die verbleibenden Randbedingungen einfach zu natürlichen Randbedingungen werden. Wenn jedoch die natürlichen Randbedingungen selbst ungeeignet sind (z. B. zu viele davon), kann dies zu einem schlecht definierten Variationsprinzip führen.

II. D. Messsymmetrien, PDE-Systeme und all dieser Jazz:

Ich möchte darauf nicht sehr detailliert eingehen, aber für Systeme, die nicht zufrieden stellen det ( W ich J ) 0 oder PDE-Systemen ist die obige Analyse viel komplizierter.

Die Singularitätsbedingung det ( W ich J ) = 0 signalisiert das Vorhandensein von Eichsymmetrien, dh die allgemeine Lösung des Systems enthält beliebige Funktionen der Zeit, daher ist das Variationsprinzip und jedes mögliche Anfangs- oder Randwertproblem schlecht definiert, da jede gegebene Lösung immer in eine neue Lösung umgewandelt werden kann, die eichfähig ist behält das Anfangs- oder Grenzwertproblem bei. Um diese Fälle zu handhaben, muss eine Art von Reduktionsschema verwendet werden (Pegelfixierung, Dirac-Bergman-Prozess, symplektische Reduktion, BV/BRST usw.), um das Problem im Wesentlichen ohne Eichsymmetrien neu zu formulieren.

Für PDE-Systeme ist das engste Analogon des PL-Theorems das Cauchy-Kovalevskaya-Theorem, das jedoch nur für evolutionäre Systeme mit analytischen Koeffizienten funktioniert. Daher wird die obige Analyse oft auch auf Feldtheorien analog angewendet, aber für strenge Ergebnisse ist eine Fall-zu-Fall-Analyse erforderlich.

Anhang. Ein strenges Modell für funktionale Derivate:

Wir verwenden die Formulierung diffeologischer Räume (eine gute Quelle dafür ist das Buch von Patrick Iglesias-Zemmour ). Ich nenne hier nur die Grundlagen. Für P N A P -domain ist eine offene Teilmenge U von R P . Eine Domäne ist dann a P -Domäne für einige P . Set gegeben Z A P -Parametrierung von Z ist eine festgelegte Karte φ : U Z , Wo U ist ein P -Domäne und eine Parametrisierung von Z ist ein P -Parametrisierung für einige P .

Eine Diffeologie auf Z ist eine Sammlung D von Parametrisierungen, genannt Plots, die die folgenden Axiome erfüllen:

  1. Überdeckung : Jede konstante Parametrisierung ist ein Plot.
  2. Ort : Wenn φ : U Z ist eine Parametrisierung, so dass in irgendeiner Umgebung von jedem R U die Beschränkung auf diese Nachbarschaft ist dann eine Verschwörung φ ist eine Handlung.
  3. Reibungslose Kompatibilität : Wenn φ : U Z ist eine Handlung und F : v U ist eine glatte Karte ( v ist auch eine Domäne) dann φ F ist auch eine Handlung.

Dann das Paar ( Z , D ) ist ein diffeologischer Raum , wird ihn aber zu verkürzen Z wenn die Diffeologie aus dem Kontext klar ist. Gegebene diffeologische Räume Z , W eine Karte ϕ : Z W ist glatt, wenn für jede Handlung φ : U Z , die Karte ϕ φ : v W ist auch eine Handlung. Diffeologische Räume sind cool, weil die Kategorie D ich F F deren Objekte diffeologischer Raum und deren Morphismen glatte Abbildungen sind, ist im Grunde unter jeder Mengen- oder kategorialen Operation unter der Sonne abgeschlossen (Summen, Produkte, Quotienten, Abbildungsräume/Exponentiale, Grenzwerte, Kolimse usw.).

Ein Differential k - Form an Z ist eine Regel, die zu jedem Grundstück φ : U Z es assoziiert eine gewöhnliche glatte k -form ω [ φ ] Ω k ( U ) auf der Domäne des Plots, so dass für jede glatte Karte F : v U ( v ist auch eine Domäne)

ω [ φ F ] = F ω [ φ ] .
Dann werden das äußere Produkt, die äußere Ableitung und der Pullback von Differentialformen auf natürliche Weise definiert, wobei alle die üblichen Eigenschaften haben (indem sie mit Auswertungen auf Diagrammen pendeln).

Wir brauchen noch ein paar Dinge über diffeologische Räume:

  • Die D-Topologie auf Z ist die beste Topologie, die alle Diagramme kontinuierlich macht.

  • Ein diffeologischer Raum ist genau dann zusammenhängend (bezüglich der D-Topologie), wenn er glatt wegzusammenhängend ist, dh zwei beliebige Punkte können durch eine glatte Kurve verbunden werden.

  • Wenn ω Ω k ( Z ) ist ein Differential k -form, dann ω = 0 dann und nur dann, wenn ω [ φ ] = 0 für alle k -Parzelle φ (mit anderen Worten, Differentialformen sind eindeutig durch die bestimmt k -Grundstücke).


Anstatt mit allgemeinen Faserverteilern zu arbeiten, betrachten wir ein vereinfachtes Modell, das einige Dinge transparenter macht. Lassen X R N Bohne N Dimensionskompakte Untermannigfaltigkeit mit Rand von R N und lass Y R M sei eine konvexe offene Teilmenge.

Betrachten Sie den Funktionsraum

F = C ( X , Y )
von glatten Karten aus X Zu Y . Wir diffeologisieren F auf vielfältige Weise.

  • Die standardmäßige funktionale Diffeologie ist wie folgt definiert. Gegeben U R P A P -Domäne eine Karte φ : U F ist ein Plot genau dann, wenn die gemeinsame Karte φ : U × X Y ,   ( S , X ) φ ( S ) ( X ) ist glatt.
  • Legen Sie eine Zahl fest R N { , ω } . Eine Parametrisierung φ : U F ist ein Plot der Variationsdiffeologie der Ordnung R wenn 1) φ ist ein Diagramm der Standardfunktionsdiffeologie, 2) der gemeinsamen Funktion φ ( S ) ( X ) ist so, dass (z 0 R < ) für jede 0 k R die Derivate
    k φ ich X μ 1 . . . X μ k ( S ) ( X )
    sind konstante Funktionen von S U Wenn X X ist ein Grenzpunkt. Diese Definition gilt auch für R = in dem Sinne, dass alle partiellen Ableitungen sie erfüllen sollten.
  • Für R = ω stattdessen ist die Definition, dass die Grenze X hat etwas Nachbarschaft N X so dass φ ( S ) ( X ) ist eine konstante Funktion von S Wenn X N .

An N { , ω } die Bestellung einrichten N < < ω für alle N N .

Wie zuvor eine Funktion S : F R ist vom Aktionstyp, wenn es eine Lagrangedichte endlicher Ordnung gibt L [ ϕ ] An X verknüpft mit F so dass

S [ ϕ ] = X L [ ϕ ] = X D X L ( X , ϕ ( X ) , , ϕ ( R ) ( X ) ) ,
wo hier D X = D N X . Dieses Integral konvergiert weil X ist kompakt. Wenn L ist Ordnung R , dann die aktionsartige Funktion S soll auch Ordnung sein R . Dann:

  1. eine aktionsartige Funktion S spezifiziert durch einen glatten Lagrange-Operator ist glatt in Bezug auf die funktionale Standard-Diffeologie und alle Variations-Diffeologien an F ;
  2. Wenn S ist eine Bestellung R Aktionstyp funktional und F ist mit der Variationsdiffeologie der Ordnung ausgestattet k R 1 , dann kann sein äußeres Derivat mit dem üblichen funktionellen Derivat identifiziert werden .

Wir überprüfen speziell diesen letzten Punkt auf einer Bestellung R aktionsartige Funktion. Um die äußere Ableitung weiter zu unterscheiden F und auf jeder Domäne U ab Differentialen X , wir gebrauchen D für das ehemalige. Das äußere Derivat D S ist wohldefiniert 1 - Form an F es reicht also aus, es auf an zu bewerten 1 -Parzelle. Auf jedem 1 -Parzelle S φ ( S ) = ϕ S wir haben

D S [ ϕ S ] = S [ ϕ S ] S D S = [ X D X k = 0 R L ϕ , μ 1 . . . μ k ich [ ϕ S ] μ 1 μ k ϕ S ich S ] D S = [ X D X k = 0 R ( 1 ) k D μ 1 . . . D μ k L ϕ , μ 1 . . . μ k ich [ ϕ S ] ϕ S ich S + X ( D X ) μ k = 0 R 1 P ich μ μ 1 . . . μ k [ ϕ S ] μ 1 μ k ϕ S ich S ] D S .
Wir dürfen schreiben
μ 1 μ k ϕ S ich S = S ( μ 1 μ k ϕ S ich )
und durch die Definition der Variationsdiffeologie (unter der Annahme, dass die Ordnung der Diffeologie mindestens ist R 1 ), verschwinden diese Funktionen auf X , daher sind die Randterme Null und wir erhalten
D S [ ϕ S ] = [ X D X E ich [ ϕ S ] ϕ S ich S ] D S ,
das tatsächlich die gleiche Information enthält wie das funktionale/EL-Derivat im üblichen Sinne.

Also, wenn wir ausstatten F mit der Variationsdiffeologie der Ordnung oder ω , dann sind alle Funktionale vom Wirkungstyp differenzierbar und die äußere Ableitung ist im Grunde die funktionale Ableitung. Der Raum F enthält noch alle reibungslosen Funktionen aus X Zu Y , so dass keine Randbedingungen auferlegt werden mussten und die funktionale Ableitung trotzdem wohldefiniert ist und die klassische Form hat.

Grenzbeschränkungen sind jedoch immer noch durch seine Diffeologie in den Raum kodiert. Unter den getroffenen Annahmen auf Y z.B. dass er konvex ist (was streng genommen nicht notwendig ist, aber den Beweis vereinfacht), finden wir folgende Tatsachen über die Konnektivität des Raums F .

Nehmen wir zunächst an, dass F ist mit dem Variational ausgestattet R -diffeologie ( R N { , ω } ). Zwei Felder ϕ , ψ F Sind B -Äquivalent , wenn für jeden X X es stimmt, dass

μ 1 μ k ϕ ich ( X ) = μ 1 μ k ψ ich ( X ) , 0 k R ,
und für die ω -diffeology statt der Zustand B -Äquivalenz ist, dass es eine Nachbarschaft der Grenze gibt X worauf sie sich einigen. Lassen B ϕ bezeichnen die Äquivalenzklasse, zu der ϕ gehört unter B -Gleichwertigkeit.

Dann:

  1. Wenn F ist mit der üblichen funktionalen Diffeologie, dem Raum, ausgestattet F Ist verbunden.
  2. Wenn F ist mit dem Variational ausgestattet R -diffeologie ( R N { , ω } ) Dann F getrennt wird und die angeschlossenen Komponenten von F sind in Bijektion mit der Menge von allen B -Äquivalenzklassen B ϕ .

[Ich könnte später einen Beweis dafür geben, aber es ist einfach und ich bin müde]

Der Nettoeffekt davon ist im Wesentlichen

F = B ϕ F B ϕ
ist eine Vereinigung von verbundenen Komponenten, so dass jedes Mitglied F B ϕ ist eine Reihe von Feldern, die geeignete vorgeschriebene Randbedingungen erfüllen (die im Vergleich zu den üblichen auferlegten/natürlichen BCs unterschiedlich sein können, insbesondere die Randbedingung, die dem entspricht ω -diffeologie ist etwas anderes).

Es hat auch einen gewissen Einfluss auf die Genauigkeitseigenschaften des Differentials D . Zum Beispiel gilt auch für diffeologische Räume, dass wenn eine glatte Funktion abgeschlossen ist (d.h D F = 0 ) dann ist sie lokal konstant, d.h. konstant auf jeder angeschlossenen Komponente separat.

Aus der Variationsrechnung ist bekannt, dass auf einer aktionsartigen Funktion S , D S = 0 bedeutet das nicht S konstant ist, anstatt (vorausgesetzt, dass X Und Y kontrahierbar sind), dass sein Integrand (Lagrange) eine totale Divergenz ist, daher die Werte von S werden durch die Werte bestimmt, die das Feld und eine Reihe seiner Ableitungen an der Grenze annehmen. Dasselbe Ergebnis wird qualitativ aus der obigen Analyse erhalten, da if D S = 0 Dann S muss an jeder angeschlossenen Komponente konstant sein F B ϕ getrennt und (angenommen, die oder ω diffeologien) als die Räume F B ϕ durch die Grenzwerte der Felder in dieser Komponente angegeben werden, zeigt dies, dass S [ ϕ ] (für D S = 0 ) Faktoren durch die Klasse B ϕ wie erwartet.


Um diesem Anhang etwas wegzunehmen, können funktionale Ableitungen in der Variationsrechnung gut definiert werden, unabhängig von einer Reihe von Randbedingungen, die den Feldern auferlegt werden, oder von Oberflächentermen, die in der Aktion auftreten, jedoch unter einem strengen Rahmen, Randbedingungen tauchen in wesentlicher Weise in der Definition der Glätte selbst auf und beeinflussen die topologischen Eigenschaften des Funktionenraums.