Warum ist die Euler-Lagrange-Gleichung nicht trivial?

Die Euler-Lagrange-Gleichung gibt die Bewegungsgleichungen eines Systems mit Lagrangefunktion an L . Lassen q a stellen die verallgemeinerten Koordinaten einer Konfigurationsmannigfaltigkeit dar, t Zeit darstellen. Die Lagrange-Funktion ist eine Funktion des Zustands eines Teilchens, dh der Position des Teilchens q a und Geschwindigkeit q ˙ a . Die Euler-Lagrange-Gleichung ist

d d t L q ˙ a = L q a

Warum ist das ein Gesetz der Physik und keine einfache Nebensächlichkeit für irgendeine Funktion ? L auf den Variablen q a und q ˙ a ? Der folgende "Beweis" der Lagrange-Gleichung verwendet keine Physik und scheint darauf hinzudeuten, dass die Lagrange-Gleichung einfach eine mathematische Tatsache ist, die für jede Funktion funktioniert.

d d t L q ˙ a = q ˙ a d L d t Kommutativität von Derivaten   = L ˙ q ˙ a   = L q a Aufhebung von Punkten

Das kann nicht stimmen, sonst würde sich niemand für diese Gleichung interessieren und es wäre völlig nutzlos, irgendein Problem zu lösen. Was ist falsch an der logischen Argumentation oben?

Sie können die EL-Gleichung für jede Funktion anfordern. Ihre These, dass es sich um eine allgemeine Identität handelt, ist jedoch falsch. Woher haben Sie die Ideen für Schritt 1 und 3?
Mehrere Kommentare, die die Frage beantworteten, wurden gelöscht. Bitte beachten Sie, dass Kommentare dazu gedacht sind, Klarstellungen anzufordern oder Verbesserungen des übergeordneten Beitrags vorzuschlagen, und nicht, um die Frage zu beantworten.
Tatsächlich ist bei der Ableitung von EL-Gleichungen eines der wichtigsten Prinzipien der Physik beteiligt, das als Variationsprinzip oder Hamilton-Prinzip bekannt ist. Dieses Prinzip, von dem die EL abgeleitet sind, besagt, dass der Weg, dem das Objekt folgt, wenn Sie es frei bewegen lassen, derjenige ist, der die Variation der Aktion verschwinden lässt S . In der Formel, δ S = 0

Antworten (7)

Ah, was für ein kniffliger Fehler, den Sie da gemacht haben. Das Problem ist, dass Sie einfach einige Begriffe in der Multivariablenrechnung verwechselt haben. Fühlen Sie sich aber nicht schlecht – das ist im Allgemeinen sehr schlecht erklärt. Beide Schritte 1 und 3 oben sind falsch. Seien Sie versichert, die Euler-Lagrange-Gleichung ist nicht trivial.

Gehen wir zunächst einen Schritt zurück. Die Lagrangedichte für ein Teilchen, das sich in einer Dimension in einer externen potentiellen Energie bewegt v ( q ) ist

L ( q , q ˙ ) = 1 2 m q ˙ 2 v ( q ) .
So schreiben es die meisten. Dies ist jedoch sehr verwirrend, da eindeutig q und q ˙ sind keine unabhängigen Variablen. Einmal q ist für alle Zeiten angegeben, q ˙ ist ebenfalls für alle Zeiten angegeben.

Ein besserer Weg, den obigen Lagrange zu schreiben, könnte sein

L ( a , b ) = 1 2 m b 2 v ( a ) .
Hier haben wir den Lagrange-Operator als das entlarvt, was er wirklich ist: eine Funktion, die zwei Zahlen aufnimmt und eine reelle Zahl ausgibt. Ebenso können wir das deutlich sehen
L a = v ' ( a ) L b = m b .
Normalerweise schreiben die meisten Leute dies als
L q = v ' ( q ) L q ˙ = m q ˙ .
Jedoch, q und q ˙ müssen als unabhängige Variablen verstanden werden, um dies korrekt zu tun. Genauso wie a und b waren unabhängige Variablen, q und q ˙ sind es auch, wenn sie in den Lagrangian gesteckt werden. Mit anderen Worten, wir könnten zwei beliebige Zahlen eingeben L ; wir haben uns einfach entschieden einzusteigen q und q ˙ .

Betrachten wir außerdem die Gesamtzeitableitung d d t . Wie ist folgender Ausdruck zu verstehen?

d d t L ( q ( t ) , q ˙ ( t ) )
Beide q und q ˙ sind Funktionen der Zeit. Deshalb, L ( q ( t ) , q ˙ ( t ) ) hängt einfach von der Zeit ab, weil q ( t ) und q ˙ ( t ) tun. Um den obigen Ausdruck auszuwerten, müssen wir daher die Kettenregel im Kalkül mit mehreren Variablen verwenden.
d d t L ( q ( t ) , q ˙ ( t ) ) = d q d t L a ( q ( t ) , q ˙ ( t ) ) + d q ˙ d t L b ( q ( t ) , q ˙ ( t ) ) = q ˙ ( t ) L a ( q ( t ) , q ˙ ( t ) ) + q ¨ ( t ) L b ( q ( t ) , q ˙ ( t ) )

Im obigen Ausdruck habe ich noch einmal verwendet a und b um meine Aussage klarer zu machen. Wir müssen partielle Ableitungen von nehmen L vorausgesetzt a und b sind unabhängige Variablen. NACH dem Differenzieren werten wir DANN aus L / a und L / b durch Einstecken ( q , q ˙ ) in die ( a , b ) Schlüssel. Dies ist genau wie beim Kalkül mit einzelnen Variablen, falls Sie dies haben

f ( x ) = x 2
und du willst finden f ' ( 3 ) , differenzieren Sie zunächst f ( x ) unter Beibehaltung x eine unspezifizierte Variable, und DANN einstecken x = 3 .

In Ihrem ersten Schritt pendeln die Ableitungen NICHT, weil t und q sind nicht unabhängig. ( q kommt drauf an t .) Ja, partielle Ableitungen kommutieren, aber NUR wenn die Variablen unabhängig sind. In Ihrem dritten Schritt können Sie die Punkte nicht "abbrechen", weil L hängt von zwei Eingängen ab. Wenn L nur abhängig q , dann ja, Sie könnten "die Punkte abbrechen" (da dies der Kettenregel im Kalkül mit einer einzigen Variable entspricht), aber das tut es nicht, also können Sie es nicht.

EDIT: Sie können selbst sehen, dass die Euler-Lagrange-Gleichung nicht identisch ist 0 . Wenn Sie den Lagrange nehmen L ( q , q ˙ ) Ich habe oben geschrieben und es in die Euler-Lagrange-Gleichung eingesetzt, Sie erhalten

m q ¨ ( t ) + v ' ( q ( t ) ) = 0.
Dies ist nicht dasselbe wie 0 = 0 . Es ist eine Bedingung , dass ein Pfad q ( t ) zufrieden stellen müsste, um die Handlung zu extremisieren. Wenn es war 0 = 0 , dann würden alle Pfade die Aktion extremisieren.

EDIT: Wie Arthur betont, ist dies auch ein guter Zeitpunkt, um den Unterschied zwischen zu diskutieren d L / d t und L / t . Wenn wir einen zeitabhängigen Lagrange haben,

L ( q , q ˙ , t )
dann L abhängen kann t explizit, im Gegensatz zu einfach durch q und q ˙ . So haben wir zum Beispiel die Lagrange-Funktion für ein Teilchen in einem konstanten Gravitationsfeld g ist
L ( a , b ) = 1 2 m b 2 m g a
wenn wir es zulassen L abhängig sein von t explizit könnten wir das Gravitationsfeld im Laufe der Zeit stärker werden lassen:
L ( a , b , t ) = 1 2 m b 2 m ( C t ) a .
( C ist eine Konstante, so dass C t hat die gleichen Einheiten wie g .)

Die Quantität

t L ( a , b , t )
ist als Unterscheidung zu verstehen „ t -Steckplatz" von L . Im obigen Beispiel hätten wir
t L ( a , b , t ) = m C a .
Die Quantität
d d t L ( q ( t ) , q ˙ ( t ) , t )
sollte als Vollzeitableitung von verstanden werden L aufgrund der Tatsache, dass q und q ˙ auch abhängen t . Für das obige Beispiel
d d t L ( q ( t ) , q ˙ ( t ) , t ) = q ˙ ( t ) L a ( q ( t ) , q ˙ ( t ) , t ) + q ¨ ( t ) L b ( q ( t ) , q ˙ ( t ) , t ) + L t ( q ( t ) , q ˙ ( t ) , t ) = ( q ˙ ) ( m C t ) + q ¨ ( t ) ( m q ˙ ( t ) ) m C q ( t )

Danke für eine umfassende Antwort. Wir brauchen mehr davon im Stack Exchange Network.
Die Euler-Lagrange-Gleichungen waren das erste Mal, dass ich den Unterschied richtig erkannte und d bei Derivaten. Zum Beispiel eine gegebene Funktion L ( t , q , q ˙ ) , der Ausdruck L t bedeutet "Differenzieren Sie die multivariable Funktion L ( t , q , q ˙ ) in Bezug auf die erste Variable", während d L d t bedeutet "Differenzieren der einzelnen Variablenfunktion L ( t , q ( t ) , q ˙ ( t ) ) in Bezug auf die Variable t ".
+1 Ich bin ein großer Fan des Schreibens L ( a , b ) das zu betonen L hängt nur von zwei Variablen ab. Aber vielleicht würde es helfen, ein winziges Detail hervorzuheben: dass wir bei der Berechnung der Aktion (und damit beim Auffinden der EL-Gleichungen) Funktionen der Zeit einsetzen q ( t ) und q ˙ ( t ) Pro a und b . Ansonsten scheint es, als wäre die Lagrange-Funktion eine Funktion der Zeit, und gleichzeitig ist sie es nicht.
  1. Der Kommutator

    (1) [ q ˙ j , d d t ]   = ( 2 )   q j
    einer Geschwindigkeitsableitung q ˙ j mit der Gesamtzeitableitung
    (2) d d t   =   t + q ˙ j q j + q ¨ j q ˙ j + q j q ¨ j +
    ist nicht null. Siehe auch z. B. diesen verwandten Math.SE-Beitrag und diesen verwandten Phys.SE-Beitrag.

  2. Die Aufhebung von Punkten

    (3) L ˙ q ˙ j   =   L q j
    arbeitet für Funktionen L ( q , t ) die nicht von Geschwindigkeiten abhängen q ˙ k . Aber ein Lagrange hängt typischerweise von Geschwindigkeiten ab. Siehe auch diesen verwandten Phys.SE-Beitrag.

  3. Beachten Sie das folgende algebraische Poincare-Lemma:

    L  erfüllt die Euler-Lagrange (EL)-Gleichungen. identisch 
    (4)
    L  ist eine Gesamtzeitableitung
    (modulo möglicher topologischer Hindernisse). Für Details siehe zB this & this Phys.SE posts.

Ihre Antwort hat mir am besten gefallen, sie war kurz und sehr prägnant und direkt auf den Punkt gebracht. Ich wünschte, ich hätte es schreiben können.

Grundsätzlich kann man also grundsätzlich wählen a n j Lagrange L mit ausreichend gewählten Koordinaten (und möglicherweise Einschränkungen) und wenden Sie die Variationsrechnung über die Euler-Lagrange-Gleichungen darauf an. Die dabei entstehenden Bewegungsgleichungen können einem verständlichen Realitätsmodell entsprechen oder auch nicht. Es gibt viele Lagrangianer, die (scheinbar) nicht der Realität entsprechen. Die Lagrangianer, die physikalische Modelle produzieren, wurden normalerweise durch Raten und Prüfen und Rücksprache mit Experimenten/Beobachtungen gefunden.

Warum ist dies ein grundlegendes Gesetz der Physik und keine einfache Trivialität JEDER Funktion L auf den Variablen q und q ˙ ?

Der Euler-Lagrange-Formalismus ist kein "Grundgesetz der Physik". Vielmehr handelt es sich um eine partielle Differentialgleichung (oder einen Satz davon), deren Lösungen ein bestimmtes Funktional stationär machen, was bedeutet, dass die Lösungen dem Prinzip der extremisierten Aktion gehorchen. Dieses mathematische Konzept wurde tatsächlich in der Steuerungstheorie durch Pontryagins Maximumprinzip verallgemeinert. Die Gesetze der Physik lassen sich durch die Euler-Lagrange-Methode ableiten, aber die Methode ist nicht grundlegend, ähnlich wie die bestimmte gewählte Geometrie nicht grundlegend ist(Absatz 17) zur Ableitung physikalischer Gesetze. Physiker verwenden Mathematik, um die Realität zu modellieren, also verwenden wir natürlich die Dinge, die funktionieren! Zum Beispiel hat Einstein seine Feldgleichungen heuristisch abgeleitet, aber Hilbert hat sie (etwa zur gleichen Zeit) aus dem Wirkungsprinzip abgeleitet, indem er das Richtige erraten hat L . Aber heutzutage gehen fast alle, die mit der Allgemeinen Relativitätstheorie oder der modifizierten Gravitation arbeiten, davon aus L und das Aktionsprinzip verwenden (außer in der Kosmologie gehen sie normalerweise von der Metrik selbst aus).

Da wir natürliche Wesen sind, die sich entwickelt haben, um Muster unserer Umgebung zu verstehen, ist es nicht völlig überraschend, dass die von uns geschaffenen Werkzeuge – insbesondere die abstrakten wie Mathematik – eine gewisse Übereinstimmung mit der Realität aufweisen könnten. Eugene Wigner hat zu diesem Thema einen sehr schönen Aufsatz mit dem Titel „The Unreasonable Effectiveness of Mathematics in the Natural Sciences“ geschrieben, in dem er argumentiert, dass es offensichtlich ist, dass Mathematik so gut bei der Modellierung der Realität funktioniert, aber es ist überhaupt nicht offensichtlich, warum dies funktioniert .

„Warum“-Fragen sind sehr schwer zu beantworten, und diese ist besonders schwierig. Einige Lagrangianer arbeiten an der Erstellung physikalischer Modelle, andere nicht, und vielleicht funktionieren die EL-Gleichungen als Filter, um dies herauszufinden, da sie verwendet werden können, um überprüfbare Vorhersagen zu treffen.

@ AccidentalFourierTransform hat deine mathematischen Fehler bereits geklärt, also werde ich das nicht tun.

Ich folge Ihrem Argument nicht, dass die Gleichungen kein physikalisches Gesetz sind. Sind die Gleichungen bei typischen Definitionen nicht perfekt äquivalent zu Newtons 2. Gesetz, das eindeutig ein Gesetz ist? Ich möchte nicht in eine Debatte über die Definition von "physikalischem Gesetz" einsteigen, aber eine Klarstellung hier könnte nützlich sein.
Wie Sie sagten, steht natürlich die Definition von "physikalischem Gesetz" zur Debatte, aber in dem von mir verlinkten Wiki-Artikel heißt es: "Physikalische Gesetze sind typischerweise Schlussfolgerungen, die auf wiederholten wissenschaftlichen Experimenten und Beobachtungen über viele Jahre basieren und die haben in der wissenschaftlichen Gemeinschaft allgemein akzeptiert werden." Die EL-Gleichungen sind ein mathematischer Formalismus - insbesondere die PDE, die Sie lösen, um eine Aktion zu extremisieren. Das Aktionsprinzip ist kein Gesetz, sondern ein theoretisches Prinzip, das sehr nützliche Modelle hervorbringt, ähnlich wie andere Prinzipien, zB das Relativitätsprinzip. Diese Hilfe?
Um den Punkt klarzumachen, werden Newtons Bewegungsgesetze empirisch verifiziert, während die EL-Gleichungen eine Methode sind, um diese Bewegungsgesetze abzuleiten. Newtons Gesetze können als Axiome genommen oder abgeleitet werden, aber wir nennen sie "Gesetze", weil sie empirisch sind.

Ihre Frage: „ Warum ist die Lagrange-Gleichung keine Trivialität? Was ist an meiner Berechnung falsch? ''.

Zuerst einige Notationen. Unter Verwendung der eindeutigen Notation von SICM lauten die Lagrange-Gleichungen:

(wo D ist die Gesamtableitung (entspricht der zeitlichen Ableitung) und Γ [ q ] = ( q , D q , . . . ) ist die Funktion, die den Pfad und seine Ableitung(en) bereitstellt.)

(Wenn Sie sich fragen, was an der traditionellen Notation falsch ist, dann empfehle ich, das Vorwort von SICM zu lesen, das dies anspricht, aber im Grunde sind es genau solche Verwirrungen, um die es in dieser Frage geht.)

Der Versuch, Ihre Berechnung mit der eindeutigen Notation von SICM umzuschreiben, offenbart sofort einige Probleme:

Unmöglich, Ableitungen einfach zu tauschen: Weder noch

D ( ( 2 L ) Γ [ q ] ) 2 ( ( D L ) Γ [ q ] )
Noch
D ( ( 2 L ) Γ [ q ] ) 2 D ( L Γ [ q ] )
irgendeinen Sinn machen.

Punkte können nicht gelöscht werden:

2 D ( L Γ [ q ] ) 1 ( L Γ [ q ] )
Sowohl links als auch rechts sehen ziemlich unsinnig aus.

Dann müssen Sie tun

1 ( L Γ [ q ] ) = ( 1 L ) Γ [ q ]
einen gesunden Ausdruck zu rekonstruieren.

Somit ist kein Schritt in Ihrem Beweis gewährleistet.

Diese Notation erscheint etwas verwirrend. Es schlägt die Variablen nicht explizit vor (1 und 2 könnten alles sein). Ist die ∘ funktionale Zusammensetzung? Tut das Γ [ q ] ein inneres Produkt darstellen? Soweit ich das beurteilen kann, ist der Hauptvorteil die Benutzerfreundlichkeit mit einer bestimmten Programmiersprache, aber sie könnte ein wenig ungewohnt sein. Auch Verwechslungsgefahr mit den Christoffel-Symbolen oder der Gamma-Funktion besteht. Könnten Sie es in Ihrer Antwort etwas ausführlicher erläutern?
@Obie2.0, ich empfehle das Vorwort von SICM , um die Gründe für die unterschiedliche Notation zu erläutern, aber ich werde versuchen, es in meiner Antwort etwas besser zu erklären.
+1, diese Notation macht es so viel besser!

Hier geht es nicht darum, "was falsch ist", sondern darum, wie Sie herausfinden können, was falsch ist (oder zumindest etwas finden, das in Ihrem Beweisversuch falsch ist). Nehmen Sie einen schönen einfachen Lagrange-Operator wie den für ein freies Teilchen in einer Dimension: L = m 2 ( q ˙ ) 2 (wo q steht für Distanz). Und nehmen Sie eine Bewegung, die in dieser physikalischen Situation nicht korrekt ist, wie eine gleichmäßige Beschleunigung q = a t 2 , wo a ist eine Konstante ungleich Null. Von L , erhalten Sie die Euler-Lagrange-Gleichung d d t ( m q ˙ ) = 0 (Weil L / q ˙ = m q ˙ und L / q = 0 ), dh Sie erhalten Impulserhaltung. Andererseits von q = a t 2 , du erhältst d d t ( m q ˙ ) = m q ¨ = 2 m a (Masse vorausgesetzt m ist konstant). Die Euler-Lagrange-Gleichung ist also verletzt. Das zeigt bereits, dass die Euler-Lagrange-Gleichung nicht "einfach eine mathematische Tatsache sein kann, die für jede Funktion gilt". Aber Sie können mehr Informationen erhalten, indem Sie dieses Besondere einstecken L und diese besondere q ( t ) in Ihren Beweisversuch, um genau zu sehen, welche Ihrer Gleichungen in diesem Beweis fehlschlagen.

Hallo Andreas! Wäre das nicht besser als Kommentar geeignet? Ich bin mir nicht ganz sicher, nur ein Vorschlag.
@DvijMankad Ich stimme Ihnen so sehr zu, dass ich anfing, dies als Kommentar zu schreiben, aber ich denke, zum Kommentieren muss man sich auf dieser Site 100 Reputation verdient haben (nicht, indem man auf anderen Stackexchange-Sites aktiv war). Wenn also jemand, der die Befugnis dazu hat, dies in einen Kommentar verschiebt, habe ich überhaupt nichts dagegen.
Ach, ich verstehe! Ich glaube nicht, dass das getan werden könnte. Ich denke, es kann perfekt als „ergänzende Antwort“ funktionieren, da der Hauptteil des Textes klar erwähnt, was er vorhat. Willkommen bei Physics.SE! :-)

Das ist eine interessante Abfolge symbolischer Manipulationen!

Aufgrund des Mangels an Genauigkeit ist es leicht, in diese Fallstricke zu geraten, und normalerweise geht Physiktext nicht darauf ein, wo diese sind und warum und wie man sie vermeidet. Es ist eine Fähigkeit, die man sich aneignet, indem man Probleme macht, die Theorie durchgeht und herumliest.

Ähnliche Probleme sind mit dem Pfadintegral verbunden, das keine strenge Definition hat. Die Variationsrechnung kann jedoch rigoros gemacht werden. Dies ist jedoch schwierig. Es wird in der Regel in einem Mathematikkurs im Grundstudium nicht angesprochen, in dem sie den Kalkül für eine reelle Variable, für eine komplexe Variable und viele reelle Variablen rigoros definieren - entweder Kalkül auf einer Mannigfaltigkeit oder typischer, Kalkül mit mehreren Variablen, der Kalkül in einem ( endlichdimensionaler) Vektorraum.

Um dies rigoros mathematisch zu machen, sind Apparate von Strahlbündeln erforderlich. Sie können eine Ausstellung von Saunders Jet Bundles und Michors Natural Operations finden . Es braucht einiges an Entwicklung.

N. Steinle hat auf die Frage schon eine tolle Antwort gegeben

Warum ist dies ein grundlegendes Gesetz der Physik und keine einfache Trivialität IRGENDEINER Funktion L

aber ich möchte auf einen zusätzlichen Leckerbissen bezüglich des Teils hinweisen

.. scheint darauf hinzudeuten, dass die Lagrange-Gleichung einfach eine mathematische Tatsache ist, die für jede Funktion funktioniert.

Während die Lagrange-Gleichungen mathematisch wirklich nur eine Funktion/einen Prozess beschreiben, der ein Extremwert einer Lagrange-Funktion (oder auch einer Energie oder eines Aktionspotentials) ist, ist der wichtige Teil, dass die Umkehrung nicht so einfach ist.

Es scheint ein "Grundgesetz der Physik" zu sein, dass viele Prozesse, die wir in der Natur beobachten, sogar eine Lagrange-Funktion haben , ein Energiepotential. Das ist eigentlich nicht trivial, nicht jede mehrdimensionale Funktion hat ein solches Potential und ist eine Aussage über die Symmetrie dieser Prozesse.

Sie haben dort einige doppelte Absätze ...