Warum gibt es zwei Definitionen für die funktionale Ableitung?

Ich habe zwei Definitionen für die funktionale Ableitung gesehen. Warum gibt es zwei Definitionen?

  1. In Goldstein's Classical mechanics 3rd edition Seite 574 Gl. (13.63) und auch in a Student's Guide to Lagrangians and Hamiltonans von Patrick Hamill auf Seite 55 Gl. (2.10), die funktionale Ableitung einer Funktion Φ ( j , j ' , X ) , Wo j = j ( X ) , ist gegeben durch
    δ Φ δ j = Φ j D D X Φ j ' .
  2. Die zweite Definition eines funktionellen Derivats ist gegeben durch
    δ F [ j ( X ) ] δ j ( X ' ) = lim ε 0 1 ε ( F [ j ( X ) + ε δ ( X X ' ) ] F [ j ( X ) ] ) .
    Diese Definition findet sich auf Wikipedia und wird in QFT verwendet. Diese Definition sagt uns, dass für das Funktionale
    S [ j ( X ) ] = Φ ( j , j ' , X ) D X
    Wo j = j ( X ) , die funktionelle Ableitung ist gegeben durch
    δ S δ j = Φ j D D X Φ j '

Eine Definition bezieht sich auf eine Funktion und die andere auf eine Funktion, aber beide geben die gleiche Ausgabe?

Welche Seiten?
In Goldstein's Classical mechanics 3rd edition Seite 574 Gl. (13.63) und auch in a Student's Guide to Lagrangians and Hamiltonans von Patrick Hamill auf Seite 55 Gl. (2.10)

Antworten (3)

Für eine funktionale

(0) S   =   D N X   L ( X ) , L ( X )     L ( ϕ ( X ) , ϕ ( X ) , , X ) ,
die zweite Definition mit Notation
(2) δ S δ ϕ a ( X )
ist die traditionelle Definition der funktionalen / variierenden Ableitung (FD), während die erste Definition mit Notation ist
(1) δ L ( X ) δ ϕ a ( X )
ist die sogenannte „gleiche Raumzeit“ FD, die ihren Variationsursprung verschleiert/verrät, aber oft aus Gründen der Notation verwendet wird. Weitere Details finden Sie zB in meinen Phys.SE-Antworten hier und hier .

Die allgemeinere Idee stammt also aus der Variationsrechnung; es ist, dass wir eine Lagrange-Abbildung eines Konfigurationsraums haben L ( C ) : C R und wir haben einen Weg durch den Konfigurationsraum P ( S ) : [ 0 , 1 ] C und die Aktion ist das Integral ihrer Zusammensetzung S = 0 1 D S   L ( P ( S ) ) . Die Idee ist, dass wir eine kleine Pfadstörung einführen, die an den Endpunkten verschwindet: ϵ   P ( S ) so dass P ( 0 ) = P ( 1 ) = 0.

Die resultierende Änderung in der Aktion ist

δ S = 0 1 D S   ( L ( P + ϵ P ) L ( P ) ) ,
und das Ziel ist es, nach den Pfaden durch den Konfigurationsraum zu suchen P derart, dass die Aktion in erster Ordnung gegen solche Pfadstörungen stationär ist; dh lim ϵ 0 δ S / ϵ = 0. Wir Physiker stehlen die Mathematik, die zur Lösung dieser Gleichung verwendet wird.

Wie wir daraus die Euler-Lagrange-Gleichungen bekommen

Sie können das an unserer schlampigen Physik sehen L steht sowas geschrieben

L = 1 2 M D R D T D R D T U ( R ) .
Der obige Formalismus hat keinen Platz für diese Schlamperei: L hat keine Ahnung vom Weg; es kann keine Zeitableitungen nehmen. Stattdessen müssen wir den Konfigurationsbereich erstellen C sechsdimensional, mit drei unabhängigen Geschwindigkeitsdimensionen, unabhängig von den drei unabhängigen Positionsdimensionen, die wir bereits haben. Das heißt, der richtige Ausdruck ist L = 1 2 M v v U ( R ) ohne Ahnung, auf Lagrange-Ebene, der Verbindung zwischen v Und R . Diese Abhängigkeit fügen wir dann explizit in die Form von ein P Und P die wir in Betracht ziehen. Dazu ist es sinnvoll zu schreiben ϵ   P als δ R für einen Moment, damit wir dies auf die erste Ordnung in erweitern können ϵ als:
δ S = T 0 T 1 D T   ich ( L R ich   δ R ich + L v ich D D T δ R ich ) ,
und dann die Bedingung, dass δ R ( T 1 ) = δ R ( T 0 ) = 0 ist entscheidend, weil es uns erlaubt, den letztgenannten Begriff durch Teile zu integrieren, zu finden
δ S = T 0 T 1 D T   ich δ R ich ( L R ich D D T L v ich ) .
Beachten Sie die sehr seltsame Bedeutung dieses Ausdrucks, es ist absolut wichtig: L nur eine einfache Funktion ist, nehmen wir eine partielle Ableitung in Bezug auf eine ihrer unabhängigen Variablen v ich : dann werten wir diese partielle Ableitungsfunktion an den Punkten des Pfades aus ( R ( T ) ,   D R / D T ) , dann nehmen wir die zeitliche Ableitung dieses Durcheinanders . Aber seit δ R ich beliebig sein kann, muss jede dieser Gleichungen unabhängig voneinander verschwinden δ S und wir müssen die Euler-Lagrange-Gleichungen haben,
L R ich D D T L v ich = 0 ,
an den akzeptablen Punkten des Pfades. Auch hier ist es sehr wichtig, um diesen Ausdruck zu interpretieren, dass die partielle Ableitung in Bezug auf v ich ohne Angabe, dass Position und Geschwindigkeit zusammenhängen, dann die tatsächliche Geschwindigkeit R ˙ ich dafür eingesetzt, und schließlich gilt die zeitliche Ableitung für beide gleichermaßen. Deshalb mit einem Ausdruck 1 2 M v v bekommt man normalerweise M R ¨ ich ab dieser Amtszeit, ohne Beitrag ab U ( R ) die verschwand, als wir die partielle Ableitung bildeten.

Wie es komplizierter ist als das

Wir haben also gesehen, dass der Umgang mit ersten zeitlichen Ableitungen in unserem Ausdruck eine Vergrößerung des Konfigurationsraums bewirkt, der außerhalb der Lagrangefunktion aufgelöst wird. Aber auch für zweite Ableitungen muss genau das gleiche Prinzip gelten, von dem wir jetzt unseren Lagrange abhängig machen müssen ( R 1 , R 2 , R N ,   v 1 , v 2 , v N , A 1 , A 2 , A N ) . Wenn wir die Euler-Lagrange-Gleichungen lösen, werden wir daher einen neuen Term finden, der sich aus der doppelten partiellen Integration ergibt,

L R ich D D T L v ich + D 2 D T 2 L A ich = 0.
Dies passiert normalerweise nicht bei Zeitableitungen in der Physik, aber hier ist ein Beispiel, wo es bei Raumableitungen auftritt: Betrachten Sie die Verformung eines Balkens entlang der X -Achse in der j -Richtung, Formung einer Form j ( X ) . Es gibt eine gewisse Masse pro Längeneinheit λ ( X ) und wir erwarten daher, dass die Wirkung eine Summe über jedes kleine Massenelement ist. Aber was ist unsere potentielle Energie hier? Unsere potentielle Energie darf nicht davon abhängen j ( X ) oder auch j ' ( X ) Da es in Ordnung ist, dass der Strahl flach in einem Winkel liegt, muss seine innere Energie wie gehen j ( X ) , aber wir erwarten, dass dies wie eine Federenergie wirkt und daher quadriert wird. Wir erwarten auch etwas Kraft F ( X ) etwas am Balken zu arbeiten. Dies alles verursacht
L = 0 D X   ( 1 2 λ ( X )   [ j ˙ ( X ) ] 2 1 2 a ( X ) [ j ( X ) ] 2 + F ( X )   j ( X ) ) .
Wir führen genau das gleiche Argument aus, außer statt D S Wo S [ 0 , 1 ] wir erwägen jetzt a D S 2 = D S 1   D S 2 Wo ( S 1 , S 2 ) [ 0 , 1 ] × [ 0 , 1 ] , die resultierende "Lagrange-Dichte" wird normalerweise als "Lagrange-Dichte" bezeichnet. Aber die gleiche Argumentationsmethode wird durchgehend beibehalten: j ' Und j werden für die Langrangsche Dichte berücksichtigt L zuliebe völlig unabhängig voneinander zu sein und j Und j ˙ , die ebenfalls als voneinander unabhängig betrachtet werden. Die Euler-Lagrange-Gleichungen werden nun zu:
L j T L j ˙ X L j ' + 2 X 2 L j = 0.
Wir leiten daher die Strahlgleichung ab als
F ( X ) λ ( X )   j ¨ 2 X 2 ( a ( X )   j ( X , T ) ) = 0.
In dem Fall wo a konstant ist und wir einen stationären Zustand erreichen, sehen wir, dass das, was hier ist, ein Ausdruck ist j ( 4 ) ( X ) = F ( X ) / a : es ist die vierte Ableitung, die wichtig ist, wenn wir die Balkenbelastung betrachten. Dies ist die Euler-Bernoulli-Balkentheorie auf den Punkt gebracht und für Ingenieure, die über "Biegemomente" und "neutrale Achsen" und dergleichen nachdenken müssen, sehr kompliziert abzuleiten, aber wir Physiker haben den Vorteil, alles zu stehlen Die Leckerbissen der Mathematiker sind in der Lage, die Antwort von dem, was die Lagrange-Funktion "sein sollte", einfach zu "sehen".

Die erste Definition ist also in einer wichtigen Weise falsch

Ich meine, Definitionen an sich können nicht falsch sein, aber sie können nutzlos sein , und genau das sehen wir oben. Was wir wollen, ist in der Lage zu sein, zu sagen "für die Pfade, die uns wichtig sind, ist die funktionale Ableitung der Aktion in Bezug auf den Pfad Null", und die erste Definition erfasst dies nur im häufigsten Fall. Die zweite Definition erfasst dies stattdessen in einem allgemeineren Sinne.

Goldsteins Definition ist nur für die Funktionale geeignet, die in der Lagrange-Mechanik vorkommen. Die zweite Definition ist die allgemeinere mathematische Definition. Solange die Funktion nur davon abhängt j Und j ' sie sind äquivalent, aber die Einführung von Ableitungen höherer Ordnung als erster Ordnung würde die erste Definition ungültig machen.