Frage zum offensichtlichen Schlupfloch im Prinzip der kleinsten Wirkung: Randbedingung vs. Anfangsbedingung

Im Lagrange-Formalismus zwei Punkte gegeben ( X 1 , T 1 ) Und ( X 2 , T 2 ) , stellen wir die Frage, welche Pfade X ( T ) die Aktion machen S = T 1 T 2 L   D T stationär und erfüllen die Randbedingung X ( T 1 ) = X 1 ,   X ( T 2 ) = X 2 . Diese Frage entspricht der Lösung der Euler-Lagrange-Gleichung

D D T L X ˙ = L Q
mit Randbedingung X ( T 1 ) = X 1 ,   X ( T 2 ) = X 2 .

Meine Frage ist, warum wir berechtigt sind, die Euler-Lagrange-Gleichung zu verwenden, um das Anfangsbedingungsproblem zu lösen X ( T 1 ) = X 1 ,   X ˙ ( T 1 ) = v 1 .

Das scheinen zwei unterschiedliche Probleme zu sein. Ein Problem besteht darin, einen Pfad zu finden, der die Randbedingung erfüllt X ( T 1 ) = X 1 ,   X ( T 2 ) = X 2 und machen die Aktion stationär.

Das andere Problem besteht darin, einen Pfad mit Anfangsbedingung zu finden X ( T 1 ) = X 1 ,   X ˙ ( T 1 ) = v 1 und ich weiß nicht einmal, wie ich andere Anforderungen stellen soll, damit die Bewegungsgleichung die Euler-Lagrange-Gleichung ist.

Wie können Sie beweisen, dass diese beiden Probleme äquivalent sind, wenn Sie das zweite Problem klarstellen können? Oder vielleicht ist es ein Axiom, dass wir verlangen, dass das Anfangsbedingungsproblem durch die Euler-Lagrange-Gleichung gelöst wird. Ich bin verwirrt über die Logik des Lagrange-Formalismus.

Ich habe hier eine ähnliche Frage beantwortet und erklärt, dass dies in der Praxis kein Problem darstellt. Ich habe hier auch eine Frage gestellt , wie schlimm die Lücke werden kann (ziemlich schlimm!).
Warum sind wir berechtigt, diese Gleichung zu verwenden? Sie benötigen keine Autorisierung, um eine Gleichung zu verwenden.

Antworten (3)

Tatsächlich ist das Problem mit den Randbedingungen im Allgemeinen nicht gut gestellt.

Es gibt Randbedingungen, die keine Kurven zulassen oder viele Kurven zulassen, die sowohl diese Bedingungen als auch die Euler-Lagrange-Gleichungen erfüllen.

Beispiele.

(1) Stellen Sie sich ein Teilchen vor, das gezwungen ist, auf einer glatten Kugel zu bleiben, wo es sich frei bewegen kann. Legt man als Randbedingungen den Nord- und den Südpol der Kugel zu, erhält man unendlich viele Lösungen, da die Bewegung immer eine Geodäte beschreibt.

(2) Ebenso, wenn Sie einen offenen Ball entfernen R 3 Sie haben keine Lösungen, wenn Sie Randbedingungen auf den gegenüberliegenden Seiten des Balls für ein freies Teilchen zuweisen R 3 .

Wenn L ist quadratisch bezüglich der Q ˙ Variablen und diese quadratische Form streng positiv definiert ist, wie es bei Systemen klassischer Teilchen der Fall ist (die auch ideale holonome Nebenbedingungen erfüllen), ist das Problem mit den Anfangsbedingungen immer gut gestellt, vorausgesetzt L ausreichend regelmäßig ist. Es gibt genau eine maximale Lösung, die sowohl die Euler-Lagrange-Gleichungen als auch die Anfangsbedingungen erfüllt.

Mit diesen Hypothesen ist auch das Problem mit den Randbedingungen gut gestellt mit der zusätzlichen Bedingung, dass die beiden Randbedingungen hinreichend nahe beieinander liegen (dies wird an den beiden oben vorgestellten Beispielen deutlich).

Aus diesen Gründen ist eine sicherere (mathematisch orientierte) Sichtweise davon auszugehen, dass das Variationsprinzip die Bewegungsgleichung bestimmt, nicht aber die Lösungen selbst.

Danke. Ihre Bedeutung ist also, dass die EL-Gleichung mit der Randbedingung manchmal schlecht definiert ist. Aber die EL-Gleichung mit Anfangsbedingung ist meistens gut definiert. Angesichts dieser Motivation fordern wir, dass die Bewegungsgleichung eine EL-Gleichung sein sollte. Und das ist eine Art Axiom im Lagrange-Formalismus.
Ich denke nicht, dass Ihre "sicherere Sichtweise" gerechtfertigt ist. Dieser ganze negative „Geist“ in der Interpretation dieser Dinge ist weitgehend irrational. Wenn einige Gesetze der Physik in Bezug auf die Wirkung formuliert werden - und sie sind oft in der Praxis - und die Lösung des Prinzips der kleinsten Wirkung sagt, dass es keine oder viele Lösungen gibt, dann ist das eine richtige und wichtige Erkenntnis, die etwas bedeutet und wir sollten es sehr ernst nehmen, ungeachtet des (naiven!) Vorurteils, dass es immer eine einzigartige Lösung geben muss.
Beispielsweise findet man im Euklidischen Wegintegral in der QFT (unter Ausnutzung des Aktionsprinzips) zahlreiche Lösungen auch bei gegebenen Randbedingungen, den Instantonen. Das bedeutet nicht, dass etwas nicht stimmt und wir diese Konfigurationen oder die Theorie verwerfen sollten. Diese Instantons (obwohl sie nur "lokale Minima" der Aktion sind) sind echt und liefern Beiträge zu den Wahrscheinlichkeitsamplituden - und ermöglichen einige ansonsten verbotene Prozesse.
Lieber Lubos, meine Sichtweise ist rein mathematisch (in Anbetracht der Wohlgestelltheit des Problems), ich stimme Ihnen völlig zu, was die physikalische Interpretation und die Verwendung des Variationsprinzips durch Physiker betrifft ...
Ich möchte eine Frage stellen: Was ist die Definition von Randbedingungen, die ausreichend nahe beieinander liegen? Und was ist die Definition von L ist regulär. Sie können mir die Referenz direkt mitteilen, wenn Sie der Meinung sind, dass dies nicht bequem ist. Danke.
Soweit es um die Regelmäßigkeit geht, reicht es aus L ( T , Q , Q ˙ ) Ist C 2 gemeinsam in allen Variablen. Eine genauere Aussage ist, dass bei der Reduktion von EL-Gleichungen in Normalform die rechte Seite gemeinsam stetig und gemeinsam lokal Lipschitz in der Variablen sein muss ( Q , Q ˙ ) .
Zur anderen Frage findet sich die Aussage in Arnolds Lehrbuch. Ich habe nie einen Beweis für diese Tatsache gesehen (und Arnold hat keine Referenzen zitiert!), außer für den Fall einer streng positiv definierten quadratischen Lagrange-Funktion H Q A H k ( Q ) Q ˙ H Q ˙ k wobei das Problem das gleiche ist wie das bezüglich der Existenz geodätisch konvexer Nachbarschaften für die Metrik A H k , die in der Literatur gut untersucht ist.

Das Problem ist, dass die zugrunde liegende klassische Physik durch Bewegungsgleichungen (EOMs) (dh Newtons 2. Gesetz) bestimmt wird, die für Anfangswertprobleme (IVPs) und Randwertprobleme (BVPs) üblich sind. Für BVPs können die EOMs oft alternativ als Euler-Lagrange (EL)-Gleichungen eines stationären Wirkungsprinzips formuliert werden . Der letztere Ansatz funktioniert für IVPs nie, da man nicht die richtigen Randbedingungen hat, um EL-Gleichungen durch partielle Integration abzuleiten. Siehe auch diesen verwandten Phys.SE-Beitrag und die darin enthaltenen Links.

In dieser Antwort möchte ich die Gewohnheit diskutieren, zwischen „Anfangswertproblem“ und „Grenzwertproblem“ zu unterscheiden. Diese Diskussion bezieht sich auf den Kontext der klassischen Mechanik. Ich gehe davon aus, dass sich die Argumentation auf andere Bereiche der Physik übertragen lässt.

Ich werde zuerst das Anfangs-/Grenzthema diskutieren und anschließend, wie diese Diskussion mit der Euler-Lagrange-Gleichung zusammenhängt.

Diese Antwort wurde von einem Blogbeitrag von Chad Orzel inspiriert .
(Am Ende dieser Antwort zitiere ich die Schlüsselbemerkung von Chad Orzel.)


Der Vollständigkeit halber beginne ich mit dem trivialen Fall eines Objekts, das sich mit gleichförmiger Geschwindigkeit bewegt, mit einem räumlichen Freiheitsgrad:

Anfangswertproblem:
Ein Zug fährt um X / T Kilometer pro Stunde. Wie lange dauert es, ein Ziel zu erreichen X Kilometer entfernt?

Grenzwertproblem:
Ein Zug fährt zu einem Bahnhof X Kilometer entfernt. Mit welcher Geschwindigkeit muss der Zug fahren, damit er danach am Ziel ankommt T Std?

Es gilt:
Wenn das Problem als Anfangswertproblem angegeben wird, lösen wir es durch Extrapolation , wenn das Problem als Randwertproblem angegeben wird, lösen wir es durch Interpolation . Die '-polation' von 'extrapolation' und 'interpolation' ist mit dem Verb 'polieren' verwandt; Sie erhalten ein glattes Ergebnis.

Der Unterschied zwischen der Angabe eines Problems als Anfangswertproblem oder als Randwertproblem besteht darin, dass die Reihenfolge der Operationen zur Lösung des Problems unterschiedlich ist, das ist alles.


Für die nächsthöhere Ebene erlauben wir eine bekannte gleichmäßige Beschleunigung und zwei räumliche Freiheitsgrade.

Sie haben eine Kanone, die Geschosse verschießen kann. Das Abfeuern eines Projektils erfolgt von einer ebenen Fläche aus, so dass das auf den Boden auftreffende Projektil sich in derselben Höhe befindet, in der es abgefeuert wurde. Nehmen Sie die Standard-Erdgravitation an.

Anfangswertproblem:
Bei gegebener Düsengeschwindigkeit und Winkel des Laufs in Bezug auf die Horizontale, wie groß ist die horizontale Entfernung, die das Projektil zurücklegt, und wie lange wird die Flugdauer sein?

Grenzwertproblem:
Wie groß muss die horizontale Geschwindigkeitskomponente und wie groß die vertikale Geschwindigkeitskomponente sein, damit die horizontal zurückgelegte Strecke x Meter und die Flugdauer t Sekunden beträgt?

Der Punkt ist:
Genau wie im einfacheren Fall der gleichförmigen Geschwindigkeit: Der einzige Unterschied zwischen der Angabe des Problems als Anfangswertproblem oder als Randwertproblem ist die Reihenfolge der Operationen, die zur Lösung des Problems erforderlich sind.



Die Unterscheidung zwischen „Anfangswertproblem“ und „Grenzwertproblem“ läuft auf die Unterscheidung zwischen Extrapolation und Interpolation hinaus , und diese Unterscheidung ist strittig.

Der gemeinsame Faktor von Interpolation und Extrapolation ist, dass Sie Kontinuität und Glätte sicherstellen. Es ist die Bedingung der Aufrechterhaltung der Kontinuität , die dafür sorgt, dass es funktioniert.

Insbesondere: Für eine Differentialgleichung ist die Unterscheidung zwischen Interpolation und Extrapolation strittig. (In beiden Fällen hängt es davon ab, sicherzustellen, dass die Kontinuität erfüllt ist.)



Der Prozess der Ableitung der Euler-Lagrange-Gleichung

Bei der Ableitung der Euler-Lagrange-Gleichung werden alle unnötigen Elemente entfernt.

Ich wiederhole es mit anderen Worten:
Im Zuge der Ableitung der Euler-Lagrange-Gleichung werden verschiedene Elemente entfernt. Die entfernten Elemente sind für die Lösung des physikalischen Problems überflüssig .

(Im Folgenden werde ich die Euler-Lagrange-Gleichung abkürzen zu: EL-eq.)

Wenn Sie mit der Ableitung des EL-eq. die Randbedingungen werden in dem Sinne als Variablen behandelt , dass die Randbedingungen nicht als Zahlenwerte angegeben werden; die Randbedingungen bleiben unspezifiziert. Indem Sie zulassen, dass die Randbedingungen variabel sind, erhalten Sie ein sehr allgemeines Ergebnis. Was Sie erhalten, ist nicht an bestimmte Randbedingungen gebunden, und das bedeutet, dass die Anwendung von Randbedingungen verzögert wird .

Im Zuge der Ableitung des EL-Gl. Sie führen eine Möglichkeit zur Darstellung von Variationen ein. (Meistens ein Symbol wie z ϵ wird verwendet, um die Variation zu manipulieren.) In der letzten Phase der Ableitung des EL-eq. die Schwankung wird eliminiert . In gewissem Sinne ist die Variation wie ein Katalysator; es ist an der Ableitung beteiligt, aber im Endergebnis nicht vorhanden.

Was ebenfalls wegfällt: Zu Beginn der Ableitung des EL-eq. eine Integration ist angegeben. In der letzten Stufe wird diese Integration eliminiert. Sie können diese Integration nicht eliminieren. Die einzige Möglichkeit zur Ableitung des EL-eq. überhaupt ist, durchzuziehen und die Integration zu eliminieren .



Wir haben, dass die Euler-Lagrange-Gleichung eine Differentialgleichung ist.

Wie wir wissen: Eine Differentialgleichung ist eine mathematische Einheit, die inhärent eine lokale Eigenschaft beschreibt. Dagegen: Integration ist Bewertung einer globalen Eigenschaft.

Die Tatsache, dass die Euler-Lagrange-Gleichung eine Differentialgleichung ist , macht sie so mächtig.

Die Herleitung der Euler-Lagrange-Gleichung ist so aufgebaut, dass die Randbedingungen als Variablen behandelt werden. Das bewirkt, dass die Anwendung der Randbedingungen verschoben wird .

Die Stärke der Euler-Lagrange-Gleichung liegt darin, dass sie eine Differentialgleichung ist; Die Unterscheidung zwischen Randwertproblem und Anfangswertproblem ist strittig.


Siehe auch:
Eine Antwort von mir vom Oktober 2021 mit einer Diskussion über Hamiltons stationäre Aktion









Über diesen Blogbeitrag von Chad Orzel:

Chad Orzel wirft die Frage auf:

ist [...] die teleologische Interpretation der Prinzipien der kleinsten Wirkung ein genaues Abbild der tatsächlichen Physik?

Chad Orzel weist darauf hin:

[...] es läuft darauf hinaus, eine Startposition und eine Endposition anzugeben und sich zu wundern, dass der Pfad festgelegt ist, aber wenn Sie stattdessen eine Startposition und eine Startgeschwindigkeit angeben, ist der Pfad ebenso unvermeidlich, aber irgendwie fühlt sich das weniger magisch an.