Verwirrung um das Prinzip der kleinsten Wirkung in Landau & Lifshitz "The Classical Theory of Fields"

Bearbeiten: Der vorherige Titel hat nicht wirklich dasselbe wie die Frage gestellt (sorry), also habe ich es geändert. Zur Verdeutlichung verstehe ich, dass die Aktion nicht immer ein Minimum ist. Meine Fragen stehen in den Punkten 1. und 2. unten.


Ich verstehe, dass "Prinzip der geringsten Wirkung" etwas irreführend ist, da wir feststellen, dass wir zur Bestimmung des von einem System eingeschlagenen Pfades nur die Bedingung aufstellen müssen, dass die Aktion stationär ist, dh dass δ S sollte für kleine Variationen des Pfades in erster Ordnung verschwinden, und dies führt zu den Euler-Lagrange-Gleichungen.

In The Classical Theory of Fields diskutieren Landau & Lifshitz die relativistische Aktion für ein freies Teilchen:

Für ein freies Teilchen muss die Aktion also die Form haben

S = a a b d s

(...) Das ist leicht zu sehen a muss für alle Teilchen eine positive Größe sein. Wie wir [vorher] gesehen haben, a b d s hat seinen maximalen Wert entlang einer geraden Weltlinie; durch Integration entlang einer gekrümmten Weltlinie können wir das Integral beliebig klein machen. Also das Integral a b d s mit positivem Vorzeichen kann kein Minimum haben; mit dem entgegengesetzten Vorzeichen hat es entlang der geraden Weltlinie eindeutig ein Minimum.

Es gibt auch eine Fußnote, die ein paar Absätze früher angesprochen wurde, aber relevant ist:

Genau genommen besagt das Prinzip der kleinsten Wirkung, dass das Integral S muss nur für infinitesimale Längen des Integrationsweges ein Minimum sein. Für Pfade beliebiger Länge können wir nur das sagen S muss ein Extremum sein, nicht unbedingt ein Minimum.

Dazu habe ich zwei Fragen:

  1. Wie wird die Bedingung „Die Wirkung muss bei infinitesimalen Verschiebungen minimal sein“ formuliert? Ich habe außerhalb der Bücher von Landau & Lifshitz noch nie davon gehört, und in Mechanics erwähnen sie es auch, gehen aber nicht ins Detail. Wird das irgendwo ausführlicher diskutiert?

  2. Wenn die Wirkung für den gesamten Pfad nur stationär sein muss, wie können wir das Argument für das negative Vorzeichen aufstellen? Wenn die Aktion ein Minimum sein müsste, dann würde es Sinn machen, aber sicherlich die Tatsache, dass δ S = 0 ist nicht von einem Gesamtzeichen betroffen?

Es ist auch möglich, Beispiele anzugeben, bei denen der wahre Pfad mit minimaler Entfernung das Euler-Lagrange-Problem nicht löst. Nehmen Sie zum Beispiel R 2 mit dem Einheitskreis und seinem Inneren entfernt, und versuchen Sie, den Pfad zu extremisieren ( 2 , 0 ) zu ( 2 , 0 )
Für die Nachwelt hinterlasse ich hier einen Link zu einer numerischen Demonstration der beiden besten Antworten unten (von Qmechanic und auxsvr). Ich löse die Bewegung eines einfachen harmonischen Oszillators auf zwei Arten auf: durch Integrieren der Euler-Lagrange-ODE (typisch) und durch Diskretisieren des Aktionsfunktionals selbst, damit es numerisch minimiert werden kann (denken Sie an Gradientenabstieg, obwohl ich SQP verwendet habe).
^ Diese führen zu identischen Ergebnissen, wenn die Simulationsdauer kürzer als die von Qmechanic erklärte "charakteristische Zeit" ist. Darüber hinaus liefert der Minimierungsansatz Unsinn, der darauf hindeutet, dass die physikalische Lösung immer eine stationäre Wirkung hat, aber nicht immer eine minimale Wirkung, selbst für sehr einfache / fundamentale Systeme. Der (konjugierte) Punkt, an dem die Minimierung bricht, ist genau der, der theoretisch in der Antwort von auxsvr berechnet wurde.

Antworten (4)

Vielleicht ist ein einfaches Beispiel angebracht. Betrachten Sie einen einfachen harmonischen Oszillator (SHO)

(1) S   =   t ich t f d t   L , L   =   m 2 x ˙ 2 k 2 x 2 ,

mit charakteristischer Frequenz

(2) 2 π T   =   ω   =   k m ,

und Dirichlet-Randbedingungen

(3) x ( t ich )   =   x ich und x ( t f )   =   x f .

Es kann gezeigt werden, dass der klassische Weg nur ein Minimum für die Wirkung (1) ist, wenn die Zeitspanne

(4) Δ t   :=   t f t ich     T 2

kleiner als eine charakteristische Zeitskala ist T 2 von dem Problem. (Wenn Δ t = T 2 es gibt einen Nullmodus.) Für Δ t > T 2 der klassische Weg ist für die Wirkung (1) kein Minimum mehr, sondern nur noch ein Sattelpunkt. Wenn wir größer und größer betrachten Δ t , entwickelt/erscheint jedes Mal ein neuer negativer Modus/Richtung Δ t kreuzt ein Vielfaches von T 2 .

Es sind solche Beispiele, die Ref. 1. denkt daran, dass das Prinzip der kleinsten Wirkung eigentlich ein Prinzip der stationären Wirkung ist. Das obige Phänomen ist ziemlich allgemein und bezieht sich auf konjugierte Punkte /Wendepunkte und die Morse-Theorie . In der semiklassischen Erweiterung der Quantenmechanik wirkt sich dieses Verhalten auf die metaplektische Korrektur / den Maslov-Index aus . Siehe z. B. Ref.-Nr. 2 für weitere Details.

Ein ähnliches Phänomen tritt in der geometrischen Optik auf, wo es einfach ist, Beispiele für Lichtwege zu konstruieren, die die Zeit nicht minimieren, vgl. Fermats Prinzip der kürzesten Zeit.

Verweise:

  1. Landau und Lifshitz, Vol.2, The Classical Theory of Fields, p. 24.

  2. W. Dittrich und M. Reuter, Classical and Quantum Dynamics , 1992, Kapitel 3.

Zur zweiten Frage von OP (v2): In der Quantenmechanik das Gesamtzeichen der Aktion S im Pfadintegral ist an Unitarität gebunden , dh dass der Hamiltonoperator von unten beschränkt sein soll. Für nicht standardmäßige Vorzeichenkonventionen siehe zB diesen Phys.SE-Beitrag.
Siehe auch diesen verwandten Phys.SE-Beitrag.

Ihre Fragen werden beantwortet in Variationsrechnung , Gelfand, 2000, Abschnitt 36.2. Zuerst brauchen wir einen Satz:

Das Funktionale S [ x ] = a b L ( t , x , x ˙ ) d t , x ( a ) = EIN , x ( b ) = B muss die folgenden Bedingungen erfüllen, um ein schwaches Minimum für zu haben x = x ( t ) :

  1. Die Kurve x ( t ) die Euler-Lagrange-Gleichung erfüllt, nämlich eine Extremale,
  2. x ˙ x ˙ L | x ( t ) > 0 ,
  3. Das Intervall [ a , b ] enthält keine zu konjugierten Punkte a .

Die Definition konjugierter Punkte befindet sich auf S.114.

  1. Ein Beispiel, das dies verdeutlicht, ist der harmonische Oszillator,
    m x ¨ + k x = 0 , x ( 0 ) = 0 , x ˙ ( 0 ) = 1
    mit Lösung x ( t ) = 1 ω Sünde ( ω t ) , ω k m und Aktion
    S [ x ] = 1 2 a b m x ˙ 2 k x 2 d t .
    Punkte ( t = π / ω , x = 0 ) und ( t = 0 , x = 0 ) sind konjugiert, weil jedes Extremal ab x ( 0 ) = 0 schneidet die vorgenannte Lösung bei ( π / ω , 0 ) . Die Bedingungen des vorigen Theorems für ein Minimum sind erfüllt für 0 a t < π / ω und nicht für vergrößerte Intervalle.
  2. Auf Seite 161 zeigt Gelfand, dass es für eine schwingende Saite mit festen Enden kein Zeitintervall ohne ein Paar konjugierter Punkte gibt, daher können wir nicht garantieren, dass die Lösung der Wellengleichung die Wirkung überhaupt minimiert. Dann stellt er fest, dass dies der Grund dafür ist, dass wir das Prinzip der kleinsten Wirkung durch das Prinzip der stationären Wirkung für mechanische Systeme ersetzen.

Ich denke, das könnte eine blöde Landau-Zeichenkonvention sein, weil wir im Prinzip Folgendes festlegen können:

a b d s = a b d s d p d p = a b ± ± η μ v d x μ d p d x v d p d p

Da wir uns mit dem Zeichen innerhalb der Quadratwurzel einmischen, basierend darauf, ob wir raumähnliche/zeitähnliche Kurven untersuchen x μ ( p ) , können wir auch ein Minus voranstellen, um anzuzeigen, dass wir mit einer anderen Art von "Länge" arbeiten als im normalen Raum. In diesem Fall würden wir mit dem Faktor wirklich ein Minimum bekommen a .

Diese ganze "Minimum of Action"-Sache ist eher ein historisches Relikt aus der Naturphilosophie und gilt nur für spezielle Lagrangianer. Beispielsweise werden beim Gravitationslinseneffekt (dh Null-Geodäten in der Relativitätstheorie) mehrere Bilder durch mehrere Extremalpfade erhalten, von denen mindestens einer ein Maximum ist (im Fall von mehreren Bildern ist es für ein einzelnes Bild ein Minimum).

Um das Minimum jedoch praktisch zu untersuchen, kann man die Lagrange -Funktion wie bei der üblichen Herleitung von Euler-Lagrange-Gleichungen erweitern , jedoch in zweiter Ordnung in der Variation der Trajektorie δ x μ . Nach erster Ordnung erhalten Sie die Euler-Lagrange-Gleichungen, die Sie im Allgemeinen lösen müssen. Die Lösung wird dann in die Entwicklung zweiter Ordnung eingesetzt, wodurch die erste Ordnung verschwindet, und Sie müssen dann das Vorzeichen des resultierenden Ausdrucks untersuchen.

Ich glaube, dass es mehr als ein historisches Relikt ist, weil es das Zeichen der Masse auf dem nicht-relativistischen Lagrangian der freien Teilchen festlegte und damit die Zeichen von allem, was danach kommt, festlegte.
Jede Art von Zeichen oder tatsächlich jede Art von Konstante , sei es positiv, negativ oder komplex, die die Lagrange-Funktion multipliziert, ändert nichts an der tatsächlichen Physik, die sie vorhersagt. Schreiben Sie einfach die Euler-Lagrange-Gleichungen auf - die Konstante lässt sich immer kürzen. Wie ich bereits für die Linsenbildung erwähnt habe, gibt es möglicherweise nicht einmal streng genommen nur eine Art von Extremum für eine bestimmte Lagrange-Funktion, sodass der Versuch, die Konvention entweder auf ein Minimum oder ein Maximum festzulegen, einfach sinnlos ist.

Ich bin mir bewusst, dass diese Frage 2014 gestellt wurde, daher ist es sehr wahrscheinlich, dass Sie in den vergangenen Jahren die Antwort darauf gefunden haben.

Aber nur für den Fall, dass ich diese Antwort trotzdem einreiche.

Der Hintergrund der Antwort, die ich hier einreiche, ist die Darstellung von Hamiltons stationärer Aktion , die ich im Oktober 2021 auf Physics.SE eingereicht habe.

In dieser Antwort werde ich diskutieren, in welchen Fällen die wahre Trajektorie einem Minimum von Hamiltons Aktion entspricht und in welchen Fällen die wahre Trajektorie einem Maximum von Hamiltons Aktion entspricht. Ich werde auch diskutieren, welcher Fall der kritische Fall ist, der sich an der Spitze des Flips vom Minimum zum Maximum befindet


Ich werde den vereinfachten Fall der Bewegung in einer räumlichen Dimension diskutieren; eine Verallgemeinerung auf 3 räumliche Dimensionen ist einfach.

Ich werde der Reihe nach die folgenden drei Fälle diskutieren:

  • Die Bewegung unterliegt einer gleichmäßigen Kraft, daher steigt das Potential linear mit der Verschiebung
  • Die Bewegung unterliegt einer Kraft, die linear mit der Verschiebung zunimmt, daher steigt das Potential mit dem Quadrat der Verschiebung
  • Die Bewegung unterliegt einer Kraft, die mit der Verschiebung quadratisch zunimmt, daher steigt das Potenzial mit dem Würfel der Verschiebung

Die Variation der Versuchsbahn ist eine Variation der Positionskoordinate.

Wenn eine Variation der Versuchsbahn angewendet wird, vergleicht die Bewertung die Reaktion der kinetischen Energie mit der Reaktion der potentiellen Energie.

Die Änderungsrate der Versuchsbahn breitet sich auf die Geschwindigkeit entlang der Versuchsbahn aus. Wie wir wissen: der Ausdruck für kinetische Energie proportional zum Quadrat der Geschwindigkeit. Daher ist die Reaktion der kinetischen Energie auf Variation in allen Fällen eine quadratische Funktion.


Das Potenzial steigt linear mit der Verschiebung

Wenn die potentielle Energie linear mit der Verschiebung ansteigt, haben wir, dass die Reaktion der potentiellen Energie auf die Variation der Versuchsbahn linear ist .

Aus diesem Grund: Wenn die potentielle Energie linear mit der Verschiebung zunimmt, entspricht die wahre Flugbahn einem Minimum der Hamilton-Wirkung.


Das Potential steigt quadratisch mit der Verschiebung

Bekanntlich ist die Lösung der Bewegungsgleichung im idealisierten Fall einer Kraft, die genau proportional zur Verschiebung ansteigt (perfektes Hookesches Gesetz), eine harmonische Schwingung.

Bekanntlich hat die idealisierte harmonische Schwingung folgende Eigenschaft: Die Schwingungsdauer ist unabhängig von der Amplitude. Anders ausgedrückt: Bei einem bestimmten quadratischen Potential hat jede Schwingungsamplitude die gleiche Schwingungsdauer .

Hamiltons stationäre Aktion reproduziert die obige Amplitudeneigenschaft.

Bewerten Sie ein quadratisches Potential über ein Zeitintervall, das gleich einer halben Periode einer vollen Schwingung ist. Also: wenn die Schwingungsdauer ist 2 π Sekunden, dann auswerten t = 0 zu t = π In diesem Fall, bei dem das Zeitintervall gleich einer halben Periode ist, bedeutet das Setzen der Startpositionskoordinate auf Null, dass die Endpositionskoordinate Null sein wird.

Die Auswertung ergibt sich dann wie folgt: Für jede Amplitude der Schwingung wird die Wirkung von Hamilton zu Null ausgewertet .

Die Aktion von Hamilton wird zu Null bewertet, da im Fall einer harmonischen Schwingung sowohl die kinetische Energie als auch die potentielle Energie quadratisch auf die Variation der Versuchsbahn reagieren; die Antworten sind gleich.

Zusammenfassung:
Im Fall des Hookeschen Gesetzes, das für ein Zeitintervall ausgewertet wird, das einer halben Schwingungsperiode (oder einem beliebigen ganzzahligen Vielfachen davon) entspricht, haben wir, dass Hamiltons Aktion für jede Schwingungsamplitude zu Null bewertet wird.


Es ist eine grundlegende Eigenschaft der idealisierten harmonischen Schwingung, dass die Schwingungsdauer unabhängig von der Amplitude ist. Die Wirkung von Hamilton entspricht dem: Für jede Amplitude der Schwingung wird die Wirkung von Hamilton zu Null ausgewertet

Deshalb:
Um eine tatsächliche Schwingungsamplitude für einen bestimmten Fall zu berechnen, muss eine zusätzliche Anfangsbedingung geliefert werden. Allein mit den Randbedingungen ist das Problem unterbestimmt.


Potentielle Zunahmen proportional zum Verschiebungswürfel

Lassen Sie mich einen Vergleich anstellen. In der Physik der Dämpfung gibt es eine natürliche Unterteilung in Unterdämpfung, kritische Dämpfung und Überdämpfung. Die Fälle von linearem Potential, quadratischem Potential und Potential proportional zum Verschiebungswürfel fallen in eine analoge Unterteilung.

Kritischer Fall:
Sowohl die kinetische Energie als auch die potentielle Energie reagieren quadratisch auf die Variation der Versuchsbahn

Unterkritisch:
Immer wenn die Reaktion der potentiellen Energie auf die Variation der Versuchsbahn von niedrigerer Ordnung als quadratisch ist, entspricht die wahre Bahn einem Minimum der Hamilton-Wirkung.

Überkritisch:
Immer wenn die Reaktion der potentiellen Energie auf die Variation der Versuchsbahn von höherer Ordnung als quadratisch ist, entspricht die wahre Bahn einem Maximum der Hamilton-Wirkung.

Lassen Sie mich das zur Betonung wiederholen:
Es gibt Klassen von Fällen, in denen die wahre Trajektorie einem Maximum von Hamiltons Wirkung entspricht.


Beachten Sie zum Beispiel, dass die Euler-Lagrange-Gleichung agnostisch ist, ob die Trajektorie, die sie identifiziert, einem Minimum oder Maximum von Hamiltons Aktion entspricht. Ob Hamiltons Wirkung ein Minimum oder ein Maximum ist, ist nicht relevant. Die einzige relevante Eigenschaft ist, dass Sie den Punkt identifizieren, an dem Hamiltons Aktion stationär ist .



Es gibt jedoch eine Wendung im überkritischen Fall.
Wenn die potentielle Energie als Funktion der Position proportional zum Würfel ist (oder höher), muss die Auswertung der Hamilton-Wirkung über ein ausreichend langes Zeitintervall durchgeführt werden .

Um zu sehen, warum, zeichnen Sie in dasselbe Diagramm eine quadratische Funktion f ( x ) = x 2 und eine kubische Funktion g ( x ) = x 3 . Bei genügend Abstand entlang der horizontalen Achse läuft die kubische Funktion der quadratischen Funktion immer voraus, aber die kubische Funktion ist am Anfang langsamer.

Es gibt also ein Skalierungsproblem . Unterhalb einer gewissen Skala ist die quadratische Funktion steiler als die kubische Funktion; Damit sich die kubische Funktion durchsetzt, muss sich die Auswertung über eine ausreichend lange Skala erstrecken.

Aufgrund dieses Skalierungsproblems: Wenn die Wirkung von Hamilton auf ein ausreichend enges spezifisches Zeitintervall eingeengt wird, ist sie minimal, selbst bei einem Potenzial, das höher als quadratisch ist.

Meiner Einschätzung nach ist Landau dieses Verhalten in der Mathematik aufgefallen und er hat sich daraufhin entschieden, es als Eigenschaft zu behaupten, allerdings ohne eine Erklärung zu liefern. Ich nehme an, wenn Landau die Erklärung gekannt hätte, hätte er die Erklärung gegeben.



„Stationäre Aktion“ versus „geringste Aktion“

Wie wir wissen, ist in einer großen Mehrheit praktischer Fälle die Reaktion der potentiellen Energie auf die Variation der Versuchsbahn von niedrigerer Ordnung als quadratisch. Die beiden Biggies, die Schwerkraft und die Coulomb-Kraft sind umgekehrte quadratische Kraftgesetze.

Auch der kritische Fall, die harmonische Schwingung, ist natürlich allgegenwärtig. (Andererseits ist der idealisierte Fall entscheidend, und ich bin mir nicht sicher, ob es in der klassischen Mechanik Fälle gibt, in denen eine Schwingung physikalisch die idealisierte harmonische Schwingung ist.)

Fälle, in denen das Potential mit dem Verschiebungswürfel (oder höherer Ordnung) zunimmt, sind selten, aber es gibt sie.

Der Wechsel vom Minimum zum Maximum, wenn Sie sich von unterkritisch zu überkritisch bewegen, zeigt, dass das Kriterium im Wesentlichen darin besteht, den Punkt der stationären Aktion zu identifizieren .