Warum gibt es im Lagrange nur Ableitungen erster Ordnung?

Warum ist die Lagrange-Funktion eine Funktion des Ortes und der Geschwindigkeit (evtl. auch der Zeit) und warum werden Abhängigkeiten von Ableitungen höherer Ordnung (Beschleunigung, Ruck,...) ausgeschlossen?

Gibt es dafür einen guten Grund oder ist es einfach "weil es funktioniert".

Die Frage ist viel spezifischer als der Titel, daher möchte ich darauf hinweisen, dass eine erfolgreiche Erklärung dessen, was in der Frage behauptet wird, nicht die Wahrheit der Behauptung im Titel impliziert. Höhere Ableitungen sind manchmal in der Physik wichtig. Ingenieure, die Nockenwellen entwerfen, arbeiten sehr hart daran, den "Ruck" zu minimieren j = d 3 x / d t 3 , weil zu hoher Ruck den Schlepphebel beschädigt. Die Lorentz-Dirac-Strahlungsreaktionskraft auf ein geladenes Teilchen ist proportional zum Ruck. Der gemeinsame Nenner ist, dass nur eine wechselnde Kraft zur Abstrahlung mechanischer oder elektromagnetischer Wellen führen kann.
Zur Ableitung von Euler-Lagrange (EL)-Gleichungen höherer Ordnung für Lagrange-Operatoren höherer Ordnung siehe diesen Phys.SE-Beitrag.
Es ist in der Frage irgendwie impliziert, aber ich möchte es trotzdem erwähnen - Sie berücksichtigen nur Ableitungen in Bezug auf die Zeit. Allerdings Ableitungen höherer Ordnung in Bezug auf die Raumvariable x sind in der klassischen Mechanik kein Problem. Zum Beispiel hat der Lagrange-Operator, der die Korteweg-de-Vries-Gleichung liefert x 2 ϕ Abhängigkeit. Siehe en.wikipedia.org/wiki/Korteweg-de_Vries_equation für weitere Details.
Ist es nicht merkwürdig, dass unsere Bewegungsgleichungen und die geodätische Gleichung beide von zweiter Ordnung sind? Man könnte das freie (F = 0) zweite Gesetz geometrisch als Ausdruck der geodätischen Gleichung (in Koordinaten verschwindender Christoffel-Symbole) und die F = / = 0-Gleichung als eine Störung davon ansehen. Das würde es erklären, oder? Schließlich kann auch der freie Lagrange als genau das angesehen werden, was die Geodäten nach Euler-Lagrange liefert. Wenn alles eine Störung der freien Bewegung ist... Handwinken.

Antworten (7)

Ich reproduziere einen Blogbeitrag, den ich vor einiger Zeit geschrieben habe:

Wir neigen dazu, keine höheren Ableitungstheorien zu verwenden. Es stellt sich heraus, dass es dafür einen sehr guten Grund gibt, aber dieser Grund wird in Lehrbüchern selten diskutiert. Wir werden der Konkretheit halber nehmen, L ( q , q ˙ , q ¨ ) , eine Lagrangefunktion, die wesentlich von der 2. Ableitung abhängt. Unwesentliche Abhängigkeiten sind Begriffe wie z q q ¨ die teilweise integriert werden können, um zu geben q ˙ 2 . Mathematisch drückt sich dies durch die Notwendigkeit aus, den Ausdruck umkehren zu können

P 2 = L ( q , q ˙ , q ¨ ) q ¨ ,
und erhalten Sie ein geschlossenes Formular für q ¨ ( q , q ˙ , P 2 ) . Beachten Sie, dass wir normalerweise auch eine ähnliche Anweisung für benötigen q ˙ ( q , p ) , und ein Versagen in dieser Hinsicht ist ein Zeichen für ein eingeschränktes System, möglicherweise mit Eichfreiheitsgraden.

In jedem Fall führt die Nichtentartung in der üblichen Weise zu den Euler-Lagrange-Gleichungen:

L q d d t L q ˙ + d 2 d t 2 L q ¨ = 0.
Dies ist dann die vierte Bestellung t , und erfordern daher vier Anfangsbedingungen, wie z q , q ˙ , q ¨ , q ( 3 ) . Das sind doppelt so viele wie üblich, und so können wir ein neues Paar konjugierter Variablen erhalten, wenn wir zu einem Hamilton-Formalismus übergehen. Wir folgen den Schritten von Ostrogradski und wählen unsere kanonischen Variablen als Q 1 = q , Q 2 = q ˙ , was dazu führt
P 1 = L q ˙ d d t L q ¨ , P 2 = L q ¨ .
Beachten Sie, dass die Nichtentartung dies zulässt q ¨ ausgedrückt werden durch Q 1 , Q 2 und P 2 durch die zweite Gleichung, und die erste muss nur definiert werden q ( 3 ) .

Wir können dann auf die übliche Weise vorgehen und den Hamilton-Operator durch eine Legendre-Transformation finden:

H = ich P ich Q ˙ ich L = P 1 Q 2 + P 2 q ¨ ( Q 1 , Q 2 , P 2 ) L ( Q 1 , Q 2 , q ¨ ) .
Wie üblich können wir wieder die zeitliche Ableitung des Hamilton-Operators nehmen, um herauszufinden, dass er zeitunabhängig ist, wenn der Lagrange-Operator nicht explizit von der Zeit abhängt und somit als die Energie des Systems identifiziert werden kann.

Allerdings haben wir jetzt ein Problem: H hat nur eine lineare Abhängigkeit von P 1 , kann also beliebig negativ werden. In einem interagierenden System bedeutet dies, dass wir positive Energiemodi anregen können, indem wir Energie von den negativen Energiemodi übertragen, und dabei würden wir die Entropie erhöhen – es gäbe einfach mehr Teilchen, und daher müssten sie irgendwo platziert werden. Daher könnte ein solches System niemals ein Gleichgewicht erreichen und sofort in einer Orgie der Partikelerzeugung explodieren. Dieses Problem ist tatsächlich ganz allgemein und gilt in ähnlicher Weise für noch höhere Ableitungen.

Gute Antwort, +1. Allerdings lässt es mich etwas unbefriedigt zurück. Der letzte Absatz geht davon aus, dass dies QFT ist, und q ist ein Feld, aber das ist ein sehr enger Kontext. Wir sehen keine höher abgeleiteten Theorien, die irgendeinen Aspekt der Physik beschreiben. Und selbst in QFT, wie wäre es mit einem Dirac-Seebild, wo alle negativen Energien voll sind?
Ausgezeichnete Antwort ... in Bezug auf die "Orgie der Partikelerzeugung" ... ist das nicht ein Aspekt des Urknalls? Können wir eine instabile Theorie höherer Ordnung haben, die sich selbst zu einer effektiven Theorie der üblichen Form erster Ordnung stabilisiert, da sie einen ausreichend großen Pool wechselwirkender Teilchen erzeugt?
Ursprünglicher Blogbeitrag des Autors: tcm.phy.cam.ac.uk/~gz218/2010/01/…
Warum kann die Erklärung nicht einfach sein, dass Stabilität nur an Extrema und Sattelpunkten des Potentials erreicht wird, also überall dort, wo seine zweite Ableitung Null ist? Alle Terme höherer Ordnung sind daher irrelevant. Vereinfache ich die Dinge zu sehr?

Ausgezeichnete Frage, und eine, auf die ich nie eine wirklich zufriedenstellende Antwort gefunden habe . Aber bedenken Sie Folgendes: In der elementaren klassischen Mechanik ist eines der Grundgesetze das zweite Newtonsche Gesetz, F = m a , die die Kraft auf ein Objekt mit der Beschleunigung des Objekts in Beziehung setzt. Nun werden die meisten Kräfte von einem bestimmten Objekt auf ein anderes bestimmtes Objekt ausgeübt, und der Wert der Kraft hängt nur von den Positionen der Quellen- und "Ziel"-Objekte ab. In Verbindung mit dem zweiten Newtonschen Gesetz bedeutet dies, dass in einem klassischen System mit N Objekte, jeder gehorcht einer Formgleichung

x ¨ ich = f ( { x j | j 1 , , N } )

wo f ist eine vektorwertige Funktion. Der Punkt dieser Gleichung ist, dass man, wenn man die Positionen aller Objekte hat, die Beschleunigungen aller Objekte berechnen kann .

Indem Sie die Ableitung dieser Gleichung nehmen, erhalten Sie

x ich = f ' ( { x j } ) { x ˙ j }

(Ich werde hier ziemlich locker mit der Notation; p) Dies ermöglicht es Ihnen, den Ruck (dritte Ableitung) anhand der Positionen und Geschwindigkeiten zu berechnen. Und Sie können dieses Verfahren wiederholen, um eine Formel (zumindest in einem abstrakten Sinne) für jede höhere Ableitung zu erhalten. Um es einfach auszudrücken, da Newtons zweites Gesetz Funktionen betrifft, die zwei Ordnungen der Ableitung voneinander entfernt sind, benötigen Sie nur die 0. und 1. Ableitung, Position und Geschwindigkeit, um den Prozess zu "booten", wonach Sie jede höhere Ableitung berechnen können Sie wollen, und daraus jede physikalische Größe. Dies ist analog (und tatsächlich eng verwandt) mit der Tatsache, dass Sie zum Lösen einer Differentialgleichung zweiter Ordnung nur zwei Anfangsbedingungen benötigen, eine für den Wert der Funktion und eine für ihre Ableitung.

Die Geschichte wird in anderen Zweigen der Physik komplizierter, aber wenn Sie sich die meisten von ihnen ansehen, werden Sie feststellen, dass die fundamentale Evolutionsgleichung den Wert einer Funktion mit ihrer ersten und zweiten Ableitung in Beziehung setzt, aber nicht höher. In der Quantenmechanik haben Sie zum Beispiel die Schrödinger-Gleichung,

ich Ψ t = 2 2 m 2 Ψ x 2 + U ( x ) Ψ

oder in der Quantenfeldtheorie die Klein-Gordon-Gleichung,

2 ϕ t 2 + 2 ϕ x 2 m 2 ϕ = 0

und andere, oder die Maxwell-Gleichungen (äquivalent die daraus ableitbare Wellengleichung) im klassischen Elektromagnetismus. In jedem Fall können Sie ein ähnliches Argument verwenden, um zumindest die Tatsache zu begründen, dass nur die Position oder ihr äquivalentes Feld und ihre erste Ableitung ausreichen, um den gesamten Zustand des Systems anzugeben.

Natürlich fragen Sie sich vielleicht immer noch, warum die Gleichungen, die das Universum beschreiben, Funktionen in Beziehung setzen, die nur zwei Ableitungen voneinander entfernt sind und nicht drei oder vier. Dieser Teil ist ein Mysterium, aber eines, das eher in den Bereich der Philosophie als der Physik fällt.

Gute Antwort +1. Warum wir nur zwei Ableitungen haben, oder allgemeiner, warum Lagrangianer die Form haben, die sie haben, werfen Sie einen Blick auf dieses Papier von B. Roy Frieden. Er versucht seit langem, die Rolle der Information in der Physik zu betonen. Erst in jüngster Zeit hat der Mainstream begonnen, diese Tatsache zu würdigen. Lassen Sie sich nicht von den Titeln einiger Arbeiten von Frieden abschrecken. Grandiosität ist ein verzeihliches Vergehen, besonders für Arbeiter in solch unversöhnlichem Gebiet :)
super antwort. Betreff. physical.stackexchange.com/q/4102 . Gibt es Referenzen für "Um es einfach auszudrücken, da Newtons zweites Gesetz Funktionen betrifft, die zwei Ableitungsordnungen voneinander entfernt sind, benötigen Sie nur die 0. und 1. Ableitung, Position und Geschwindigkeit, um den Prozess zu "booten", ein Buch oder Papier?

Es gibt Implikationen für die Kausalität, wenn eine Bewegungsgleichung höhere als zweite Ableitungen der Felder enthält, EM-Strahlung von geladenen Körpern geht über die Ableitung der Beschleunigung

Ich kenne die Details des WARUMs nicht, aber dieses Buch sollte mehr Details geben: (Kausalitäts- und Dispersionsbeziehungen) http://books.google.com/books?id=QDzHqxE4anEC&lpg=PP1&dq=causality%20dispersion%20relations&pg=PP1#v =eine Seite&q&f=false

+1 Ich denke, dieses Thema wird (zumindest meiner Erfahrung nach) stark unterschätzt und ist äußerst interessant.

Es gibt Formulierungen mit Derivaten höherer Ordnung, aber Sie haben eine faire Charakterisierung vorgenommen.

Ich denke, eine Faustregel wäre, nach dem einfachsten Lagrangian zu suchen, den man sich vorstellen kann. Im Allgemeinen sollte ein guter Lagragian der Homogenität von Raum, Zeit und Isotropie des Raums gehorchen, was bedeutet, dass er Ort, Zeit und Geschwindigkeit nicht explizit enthalten kann v , beziehungsweise. Dann ist die einfachste erlaubte Möglichkeit, einen Lagrange-Operator mit einer Geschwindigkeit im Quadrat zu haben. Da wir nicht nach weiteren zu erfüllenden Bedingungen suchen müssen, besteht keine Notwendigkeit, Terme mit höheren Ableitungen oder Kombinationen anderer Terme hinzuzufügen.

Sie können dieses Verfahren (eigentlich ziemlich oft) in Landau & Lifshitz, The Classical Theory of Fields, bei der Arbeit sehen.

Wenn Sie Recht haben, dann ist meine Antwort falsch. Können Sie ein Beispiel für einen Lagrange-Operator geben, der höhere Ableitungen beinhaltet?
@gabgoh: Ohne zu lange zu suchen, habe ich dies als Beispiel gefunden arxiv.org/abs/1012.2969 .
Danke für die Antwort. Unglücklicherweise scheint die Abhandlung die Gauge-Theorie zu beinhalten, etwas, mit dem ich nicht sehr vertraut bin. Ich hatte auf ein einfaches Beispiel aus der klassischen Mechanik gehofft, das einen Lagrangian höherer Ordnung beinhaltet. Oder muss ich mich vielleicht über die Mechanik hinauswagen, um eine Lösung zu finden?
@gabgoh: Ich glaube nicht, dass es eine Mainstream-Formulierung mit Lagrangian höherer Ordnung aus der klassischen Mechanik gibt (obwohl ich mich irren könnte). Vielleicht kann der Beitrag von @lurscher ein solches Beispiel geben.

Nun, die übliche Physik in der klassischen Mechanik wird in Form von Differentialgleichungen zweiter Ordnung formuliert. Wenn Sie mit dem Prozess der Ableitung von Euler-Lagrange-Gleichungen aus der Lagrange-Gleichung vertraut sind, sollte es selbstverständlich sein, dass der kinetische Term proportional zu sein muss ( t x ) 2 das zu reproduzieren.

Wenn Sie allgemeinere Lagrangianer betrachtet hätten (was Ihnen sicherlich freisteht), würden Sie willkürlich komplizierte Bewegungsgleichungen erhalten, aber diese würden nichts Physikalischem entsprechen. Trotzdem könnten einige dieser Gleichungen einige mathematische Objekte beschreiben (weil der Lagrange-Formalismus und die Variationsrechnung nicht nur der Physik, sondern auch vielen anderen mathematischen Disziplinen eigen sind).

Diese Frage muss eigentlich in zwei Schritten beantwortet werden:

  1. Warum hat Lagrange nur Ableitungen erster Ordnung?:

Lagrange wurde so definiert, dass das zu lösende Problem eine zeitliche Ableitung zweiter Ordnung erzeugen würde, wenn die Euler-Lagrange-Gleichung erstellt wird. Es enthält eine implizite Ableitung des Impulses (beachten Sie die Zeitableitung nach dem Minuszeichen L q d d t L q ˙ = 0 ), was wiederum eine Positionsableitung erster Ordnung ist. Dies bedeutet, dass die Beschleunigung tatsächlich berücksichtigt wird, wenn das vollständige Problem eingerichtet ist. Man kann es verifizieren, indem man einfach überprüft, dass sich die Euler-Lagrange-Gleichung in den meisten Fällen als ergibt L q m q ¨ = 0 und wenn man definiert L q = F es wird Newtons zweites Gesetz. Allerdings müssen wir zum nächsten Schritt übergehen, nämlich

  1. Warum ist Ruck (oder eine größere Zeitableitung) nicht erforderlich?:

Diese Frage wurde bereits beantwortet (einschließlich einer von mir) hier Warum F = m a und nicht F = m a ˙ . Die kurze Antwort lautet: „… Ableitung zweiter Ordnung ist alles , was man braucht, um natürliche Bewegungszustände von beeinträchtigten Bewegungszuständen zu unterscheiden “.

Nehmen wir beispielsweise eine zweite Ableitung in der Lagrange-Funktion an, die Euler-Lagrange-Gleichungen, die die Wirkung minimieren

EIN [ q ] = x 1 x 2 L ( x , q , q ' , q ) d x

wäre

L q d d t L q ' + d 2 d t 2 L q = 0

Dies ist eine Differentialgleichung vierter Ordnung. Dies kann jedoch nicht der Fall sein, da wir das bereits wissen q = F / m , dh die Beschleunigung wird durch die Kraft bestimmt, die "außerhalb" der Anfangsbedingungen liegt. In einem Gravitationskraftfeld beispielsweise sind a piori die Kräfte an jedem Punkt des Systems und damit die Beschleunigung an jedem Punkt des Systems bereits bekannt. Ein DE vierter Ordnung würde zu einer internen Inkonsistenz führen.

Die tiefere Frage, die man sich stellen muss, ist, nehme ich an, warum F = m q , nicht F = m q oder F = m q . Ich werde nicht vorgeben, die Antwort darauf zu kennen, aber ich vermute, dass es eine geben könnte.