Die dynamischen Variablen im Lagrange-Formalismus

In Goldsteins klassischer Mechanik wurde geschrieben, dass im Lagrange-Formalismus die unabhängigen dynamischen Variablen sind q q und t t . Deshalb repräsentieren wir den Zustand eines Systems im Lagrange-Formalismus anhand eines Punktes im Konfigurationsraum. Aber während der Berechnungen behandeln wir q ˙ q ˙ auch als unabhängige Variable, wie für Berechnungen aus der Euler-Lagrange-Gleichung. Goldstein erwähnt auch, dass wir mathematisch behandeln q ˙ q ˙ als unabhängige Variable, aber anders ist es nicht. Wie kann eine mathematisch unabhängige Größe nicht berücksichtigt werden, während die Dynamik des Systems wie bei der Angabe seines Zustands verstanden wird?

Antworten (3)

Wir behandeln nicht q ˙ q ˙ als unabhängige Variable bei der Ableitung der Euler-Lagrange-Gleichungen. Die grobe Antwort lautet: q q und q ˙ q ˙ sind als Eingaben in den Lagrange unabhängig, werden jedoch verknüpft, sobald wir einen Pfad durch den Konfigurationsraum angeben - ich werde dies in den Punkten 5 und 6 näher erläutern.


Ich werde im Folgenden ziemlich formal sein, aber vielleicht wird die Formalität etwas aufschlussreich sein. Zunächst einige Vorbereitungen:

1: Der Zustand eines N. N. -dimensionales System besteht aus einem Punkt

q ( q 1 q 2 , , Q. N. ) Q. q ( q 1 , q 2 , , q N. ) Q.
wo Q. Q. wird der dem System entsprechende Konfigurationsraum genannt , und q ich q ich ist der ich t h ich t h verallgemeinerte Koordinate .

2: Eine Kurve γ γ Durch den Konfigurationsraum ist eine Karte

γ : R Q. γ :: R. Q.
t γ ( t ) = ( q 1 ( t ) , q 2 ( t ) , , q N. ( t ) ) q γ ( t ) t γ ( t ) = ( q 1 ( t ) , q 2 ( t ) , , q N. ( t ) ) q γ ( t )
Die Kurve wird daher durch parametriert t t , die wir die Zeit nennen. Dies beschreibt, wie sich der Status des Systems entwickelt. Beachten Sie, dass wir das verlangen werden γ γ mindestens zweimal differenzierbar sein.

3: An jedem Punkt entlang γ γ gibt es einen eindeutigen Tangentenvektor V. γ ( t ) V. γ ( t ) wie folgt angegeben:

V. γ : R T. q Q. V. γ :: R. T. q Q.
t V. γ ( t ) = ( q ˙ 1 ( t ) , q ˙ 2 ( t ) , , q ˙ N. ( t ) ) q ˙ γ ( t ) t V. γ ( t ) = ( q ˙ 1 ( t ) , q ˙ 2 ( t ) , , q ˙ N. ( t ) ) q ˙ γ ( t )
T. q Q. T. q Q. heißt der Tangentenraum zu Q. Q. am Punkt q q . Ich werde mich nicht darum kümmern, dies rigoros zu definieren, aber die intuitive Vorstellung eines Tangentenraums sollte bekannt sein, wenn Sie Goldstein aufgreifen.

4: Die disjunkte Vereinigung aller Tangentenräume von Q. Q. heißt das Tangentenbündel zu Q. Q. und wird bezeichnet T Q. T. Q. ::

T Q = q Q. T. q Q. T. Q. = q Q. T. q Q.
Wenn ( q , v ) ( q , v ) ist ein Element des Tangentenbündels T Q. T. Q. , das heißt dann das v v ist ein Tangentenvektor zu einer Kurve, die durch den Punkt verläuft q q .

5: Der Lagrange ist eine Funktion, die drei (oder zwei, je nach Ihrer Sichtweise) Eingaben benötigt - einen Punkt ( q , v ) T Q. ( q , v ) T. Q. und eine reelle Zahl t R. t R. - und ordnet sie einer reellen Zahl zu:

L : T Q × R R. L. :: T. Q. × R. R.
( q , v , t ) L ( q , v , t ) ( q , v , t ) L. ( q , v , t )
Ein entscheidender Punkt ist das q q bestimmt nicht v v - so weit wie L. L. ist besorgt, q q ist nur ein Punkt in Q. Q. und v v ist der Tangentenvektor zu einer der unendlichen Kurven, die durchlaufen werden q q .

6: Die Aktion funktioniert S. S. bildet eine Kurve ab γ γ auf folgende Weise zu einer reellen Zahl:

S. [ γ ] = L ( q γ ( t ) , q ˙ γ ( t ) , t ) d t S. [ γ ]] = L. ( q γ ( t ) , q ˙ γ ( t ) , t ) d t
Um den obigen Punkt noch einmal zu wiederholen, hat der Lagrange drei Schlitze - einen für einen Punkt im Konfigurationsraum, einen für einen Tangentenvektor und einen für eine reelle Zahl. So weit wie L. L. Betroffen sind diese drei Slots unabhängig voneinander, so dass wir nach Belieben partielle Ableitungen vornehmen können.

Wenn wir die Aktionsfunktion ausführen, gehen wir entlang der Kurve γ γ . Bei jedem t t , wir füttern γ ( t ) q γ ( t ) γ ( t ) q γ ( t ) in den ersten Steckplatz, V. γ ( t ) q ˙ γ ( t ) V. γ ( t ) q ˙ γ ( t ) in den zweiten Steckplatz und t t in den dritten Steckplatz. Es kann jedoch nicht genug betont werden, dass der Lagrange selbst keine Ahnung hat, dass die drei Eingänge überhaupt etwas miteinander zu tun haben.


Jetzt, da das nicht im Weg ist, können wir zur Sache kommen. Wir suchen welche γ γ für die die Aktionsfunktion stationär ist. Intuitiv denken wir, "nimm die Ableitung und setze sie auf Null", aber zu diesem Zeitpunkt ist nicht wirklich klar, wie man eine Ableitung in Bezug auf eine Kurve nimmt.

Stattdessen machen wir Folgendes. Bezeichnen Sie die richtige (aber unbekannte) Kurve γ c γ c . Dann eine allgemeine Kurve γ γ kann als "Summe" von geschrieben werden γ c γ c und einige "Fehler" η η die an den Endpunkten des Integrals verschwindet und wo die Summe komponentenweise definiert ist. Mit anderen Worten, irgendwann t t ,

q γ ( t ) = q c ( t ) + ϵ η ( t ) ( q c 1 ( t ) + ϵ η 1 ( t ) , q c 2 ( t ) + ϵ η 2 ( t ) , , q c N. ( t ) + ϵ η N. ( t ) ) q γ ( t ) = q c ( t ) + ϵ η ( t ) ( q c 1 ( t ) + ϵ η 1 ( t ) , q c 2 ( t ) + ϵ η 2 ( t ) , , q c N. ( t ) + ϵ η N. ( t ) )

während der Tangentenvektor (auch als verallgemeinerte Geschwindigkeit bezeichnet) wird

q ˙ γ ( t ) = q ˙ c ( t ) + ϵ η ' ( t ) ( q ˙ c 1 ( t ) + ϵ η ' 1 ( t ) , q ˙ c 2 ( t ) + ϵ η ' 2 ( t ) , , q ˙ c N. ( t ) + ϵ η ' N. ( t ) ) q ˙ γ ( t ) = q ˙ c ( t ) + ϵ η ' ( t ) ( q ˙ c 1 ( t ) + ϵ η 1 ' ( t ) , q ˙ c 2 ( t ) + ϵ η 2 ' ( t ) , , q ˙ c N. ( t ) + ϵ η N. ' ( t ) )

wo ϵ R. ϵ R. . Anstatt uns um die Details funktionaler Derivate zu kümmern, können wir einen Weg suchen γ γ Dies macht die Aktion in Bezug auf Änderungen in ϵ ϵ ::

d S. [ γ ]] d ϵ = 0 d S. [ γ ]] d ϵ = 0

Die Aktion wird funktionsfähig

S. [ γ ] = B. EIN L ( q γ ( t ) , q ˙ γ ( t ) , t ) d t = B. EIN L ( q c ( t ) + ϵ η ( t ) , q ˙ γ ( t ) + ϵ η ' ( t ) , t ) d t S. [ γ ]] = EIN B. L. ( q γ ( t ) , q ˙ γ ( t ) , t ) d t = EIN B. L. ( q c ( t ) + ϵ η ( t ) , q ˙ γ ( t ) + ϵ η ' ( t ) , t ) d t

Differenzieren in Bezug auf ϵ ϵ gibt

d S. [ γ ]] d ϵ = B. EIN i = 1 N. [ L. q γ ich η ich ( t ) + L. q ˙ γ ich η ' ich ( t ) ] d t d S. [ γ ]] d ϵ = EIN B. ich = 1 N. [ L. q γ ich η ich ( t ) + L. q ˙ γ ich η ich ' ( t ) ]] d t

Das erkennen wir jetzt

L. q ˙ γ ich η ' ich ( t ) = [ L. q ˙ γ ich η ich ( t ) ] ' - ( d d t L. q ˙ γ ich ) η ich ( t ) L. q ˙ γ ich η ich ' ( t ) = [ L. q ˙ γ ich η ich ( t ) ]] ' - - ( d d t L. q ˙ γ ich ) η ich ( t )

und da der Grenzterm an den Endpunkten verschwindet, finden wir das

d S. [ γ ]] d ϵ = B. EIN i = 1 N. [ L. q γ ich - d d t L. q ˙ γ ich ] η ich ( t ) d t d S. [ γ ]] d ϵ = EIN B. ich = 1 N. [ L. q γ ich - - d d t L. q ˙ γ ich ]] η ich ( t ) d t

Weil diese Menge für jede unabhängige Auswahl von verschwinden muss η ich η ich Daraus folgt, dass der Integrand überall verschwinden muss, und so

d d t L. q ˙ γ ich = L. q γ ich d d t L. q ˙ γ ich = L. q γ ich

Dies gibt uns die Euler-Lagrange-Gleichungen, die es uns ermöglichen, den richtigen Pfad in Bezug auf die verallgemeinerten Koordinaten zu finden q γ ich q γ ich .


Die Angabe einer Kurve, die die verallgemeinerten Koordinaten mit den verallgemeinerten Geschwindigkeiten verknüpft, erfolgt auf der Ebene der Aktion , nicht auf der Ebene des Lagrange . So weit wie L. L. ist besorgt, q ( t ) q ( t ) und q ˙ ( t ) q ˙ ( t ) haben nichts miteinander zu tun und können völlig unabhängig gewählt werden. Das ist der Unterschied zwischen Füttern L. L. die Nummer q ( t ) q ( t ) im Gegensatz zur Funktion q q .

Danke für die Antwort. Können Sie ein Buch vorschlagen, aus dem Sie all dieses Material lesen können?
Es ist ein bisschen schwierig, da ich die Idee von Tangentenräumen wirklich abgeschlachtet habe, um nicht zu tief in die Differentialgeometrie einzudringen. Ich hüpfte mehr oder weniger zwischen der Standard-Grundbehandlung der Lagrange-Mechanik und dem vielfältigen Standpunkt hin und her, während so ziemlich alles, was Sie finden, entweder das eine oder das andere sein wird. Das nächste, was ich finden kann, sind "Globale Formulierungen der Lagrange- und Hamilton-Dynamik auf Mannigfaltigkeiten" von Lee, Leok und McClamroch. Eine Kopie ist möglicherweise online verfügbar, wenn Sie den allmächtigen Google fragen.
+1 Wenn wir formal sein wollen, denke ich das "Wenn η η ist klein, wir können linearisieren "ist ein bisschen unpraktisch. Aber es kann strenger gemacht werden, ohne viel Lesbarkeit durch Überlegung zu beeinträchtigen γ = γ c + ϵ η γ = γ c + ϵ η wo ϵ ϵ ist eine reelle Zahl und Entdeckung d S. [ γ ] / d ϵ = 0 d S. [ γ ]] /. d ϵ = 0 .
@JiK Du hast absolut Recht - ich habe einige Notationen aufgeräumt und diese Bearbeitung vorgenommen. Vielen Dank.

Der allgemeine Lagrange-Formalismus ist vielfältig entwickelt j 1 ( E. ) j 1 ( E. ) mit der Struktur eines aus einem Faserbündel aufgebauten Strahlbündels E. R. E. R. .

Mit anderen Worten E. E. ist lokal das Produkt von Q. Q. und R. R. , wo Q. Q. ist eine Mannigfaltigkeit, in der Konfigurationen des Systems zu jeder Zeit beschrieben werden t R. t R. .

E. E. wird durch lokale Koordinatenfelder abgedeckt t , q 1 , , Q. n t , q 1 , , q n wo t t ist die zeitliche Koordinate über der Basis R. R. des Faserbündels E. R. E. R. und q 1 , , Q. n q 1 , , q n bedecke die Fasern Q. t Q. t (diffeomorph zu Q. Q. ).

Die erste Jet-Erweiterung j 1 ( E. ) j 1 ( E. ) Über R. R. vergrößert jede Faser Q. t Q. t durch Hinzufügen eines weiteren Faktors R. n R. n abgedeckt durch Jet-Koordinaten , q ˙ 1 , , Q. ˙ n q ˙ 1 , , q ˙ n unabhängig von der q 1 , , Q. n q 1 , , q n aber so, dass sie sich identifizieren d q 1 d t , , d q n d t d q 1 d t , , d q n d t sobald eine Bewegung t ( t , q 1 ( t ) , , q n ( t ) ) t ( t , q 1 ( t ) , , q n ( t ) ) gegeben ist. Mit anderen Worten ( t , q 1 , , Q. n q ˙ 1 , , Q. ˙ n ) ( t , q 1 , , q n , q ˙ 1 , , q ˙ n ) Korrigieren Sie den kinetischen Zustand des Systems zu einem bestimmten Zeitpunkt t t . Hier sind die Konfiguration und der kinetische Zustand völlig unabhängig. Die Fasern von j 1 ( E. ) j 1 ( E. ) sind daher 2 n 2 n -dimensionale Verteiler EIN t EIN t , der Raum der kinetischen Zustände zur Zeit t t , diffeomorph zu einer kanonischen Faser EIN EIN abgedeckt durch lokale Koordinaten q 1 , , Q. n q ˙ 1 , , Q. ˙ n q 1 , , q n , q ˙ 1 , , q ˙ n

In Anbetracht dieser Struktur werden lokale Koordinaten geändert und an übergeben t ' q ' 1 , , Q. ' n q ˙ ' 1 , , Q. ˙ ' n t ' , q ' 1 , , q ' n , q ˙ ' 1 , , q ˙ ' n Die Beziehungen sind

t ' = t + c (1) (1) t ' = t + c
q ' K = q ' K ( t , q 1 , , Q. n ) (2) (2) q ' k = q ' k ( t , q 1 , , q n )
q ˙ ' k = q ' k t + j = 1 n q ' k q j q ˙ j (3) (3) q ˙ ' k = q ' k t + j = 1 n q ' k q j q ˙ j
und die inversen Beziehungen haben die gleiche Struktur.

Sie sehen, dass die dritte Gleichung mit der Interpretation von kompatibel ist q ˙ q ˙ als zeitliche Ableitung von q q . Diese Interpretation ist nur formal, weil diese Ableitung nicht berechnet werden kann, wenn ein Punkt a A. t ein EIN t ist gegeben: Um die Ableitung zu berechnen, müssten wir eine Kurve (einen Abschnitt) durchlaufen ein ein , nicht nur ein ein selbst.

Euler-Lagrange-Gleichungen sind Gleichungen erster Ordnung , die durch eine Skalarfunktion induziert werden L : j 1 ( E. ) R. L. :: j 1 ( E. ) R. dass in jedem lokalen Diagramm ein Abschnitt bestimmt t γ ( t ) j 1 ( E. ) t γ ( t ) j 1 ( E. ) in Koordinaten

t ( t , q ( t ) , q ˙ ( t ) ) , t ( t , q ( t ) , q ˙ ( t ) ) ,
Lösung von, z k = 1 , , n k = 1 , , n ,
d d t L. q ˙ k - L. q k = 0 . d d t L. q ˙ k - - L. q k = 0 .
d q k d t = q ˙ k ( t ) . d q k d t = q ˙ k ( t ) .
Siehst du das q ˙ q ˙ ergibt die zeitliche Ableitung von q q sonst nur entlang der Lösungen der EL-Gleichungen q q und q ˙ q ˙ sind unabhängige Variablen.

HINZUGEFÜGTER KOMMENTAR . Warum Jet Bundles?

Die Gesamtidee besteht darin, eine mathematische Struktur zu finden, die die Idee codiert, dass

q q und q ˙ q ˙ sind unabhängige Variablen und werden abhängig ( q ˙ q ˙ ist die Zeitableitung von q q ) entlang jeder Lösung von Bewegungsgleichungen.

Die erste Idee ist die Modellierung des Raums kinetischer Statistiken auf dem Tangentenbündel des Konfigurationsraums T. Q. T. Q. wo Q. Q. wird durch Lagrange-Koordinatenfelder abgedeckt q 1 , Q. n q 1 , q n . Hier q ˙ 1 , , Q. ˙ n q ˙ 1 , , q ˙ n sind die Komponenten von Tangentenvektoren bei q 1 , Q. n q 1 , q n (interpretiert als Tangentenvektoren zu Kurven durch diesen Punkt, die mittels der Zeitkoordinate parametrisiert werden).

Das ist schön, aber auf diese Weise sind Transformationen von Koordinaten, die explizit von der Zeit abhängen, mathematisch unnatürlich, aber physikalisch notwendig (denken Sie an Lagrange-Koordinaten in Ruhe mit zwei verschiedenen Referenzrahmen, von denen einer träge und der andere nicht träge ist).

Ein Ausweg besteht darin, das kartesische Produkt als Raumzeit kinetischer Zustände zu verwenden A = R × T. Q. EIN = R. × T. Q. , wo R. R. ist die Zeitachse und betrachtet zulässige Koordinaten auf EIN EIN als Koordinaten ( t , q 1 , , Q. n q ˙ 1 , , Q. ˙ n ) ( t , q 1 , , q n , q ˙ 1 , , q ˙ n ) wo t R. t R. und q 1 , , Q. n q 1 , , q n sind Koordinaten auf Q. Q. und q ˙ 1 , , Q. ˙ n q ˙ 1 , , q ˙ n sind Koordinaten auf jeder Faser von T. Q. T. Q. . Die Koordinate t t In der klassischen Physik muss sie mit der absoluten Zeit zusammenfallen und ist daher nur bis zu einer additiven Konstante festgelegt. Dies erklärt, warum wir die möglichen Änderungen der zeitlichen Koordinate auf das Element (1) beschränkt haben.

Dieses Bild kann bereits auf der Ebene des Konfigurationsraums implementiert werden, wobei die Raumzeit der Konfigurationen als definiert wird E. : = R × Q. E. : = R. × Q. .

In der Praxis ist diese Konstruktion effektiv, leidet jedoch unter dem ideologischen Nachteil, dass jede Koordinatenänderung (1) - (3) eine andere Realisierung von verwenden kann E. E. (und EIN EIN ) als kartesisches Produkt, wie aus den Transformationsregeln (2) (und (3)) hervorgeht, während im Allgemeinen keine natürliche Wahl besteht.

Wir sollten also nach einer Struktur suchen, die (zumindest lokal) wie ein kartesisches Produkt aussieht , deren kartesische Zerlegung jedoch nicht kanonisch ist und die einen angepassten Atlas lokaler Diagramme zulässt, deren Transformationsregeln in (1) - (3) angegeben sind.

Der erste Schritt zum Entfernen einer festen kartesischen Produktstruktur besteht darin, sich nur auf (1) und (2) zu beschränken, wobei von Grund auf davon ausgegangen wird, dass die Raumzeit von Konfigurationen nicht gleich ist R × Q. R. × Q. aber eine Mannigfaltigkeit, die lokal wie dieses Produkt aussieht, ohne eine bestimmte Wahl dieser Zersetzung festzulegen.

Diese Struktur existiert und ist in der Mathematik bekannt: Es ist ein Faserbündel E. R. E. R. mit kanonischer Faser diffeomorph zu Q. Q. . Der Atlas der lokalen Koordinaten, angepasst an die Bündelstruktur (wobei die bevorzugte globale Koordinate eine additive Konstante auf der Basis definiert R. R. ) besteht aus lokalen Charts t , q 1 , , Q. n t , q 1 , , q n Transformation genau wie in (1) - (2).

Diese Struktur muss noch weiter ausgebaut werden, um die kinetischen Informationen zu erfassen. Der Verteiler A = j 1 ( E. ) EIN = j 1 ( E. ) ist ein sehr guter Kandidat. Es ist nichts anderes als E. E. mit dem Zusatz von n = dim ( Q ) n = dim ( Q. ) Koordinaten q ˙ 1 , Q. ˙ n q ˙ 1 , q ˙ n zu jeder Faser für jedes natürliche Koordinatenfeld t , q 1 , , Q. n t , q 1 , , q n mit der Anforderung, dass das Ändern der Koordinaten (3) gilt. Dies liegt daran, dass bei der Definition des Strahlbündels die hinzugefügten Punktkoordinaten als Komponenten von Tangentenvektoren von Abschnitten in interpretiert werden müssen E. E. dh die Komponenten aller möglichen Tangentenvektoren zu Kurven R t ( q 1 ( t ) , , q n ( t ) ) R. t ( q 1 ( t ) , , q n ( t ) ) durch jeden Punkt von E. E. .

Können Sie mir bitte erklären, warum Strahlbündel in der Geometrisierung der klassischen Feldtheorie unvermeidlich sind, aber im Prinzip kann man in der Teilchenmechanik auf sie verzichten? Zumindest weiß ich das. Vielleicht irre ich mich.
@ DanielC Sie sind nicht unvermeidlich! Sie sind nur nützliche Werkzeuge, um eine grundlegende physikalische Idee zu modellieren. Ich habe versucht, Ihre Frage innerhalb der letzten Notiz zu beantworten, die ich meiner Antwort hinzugefügt habe.
  1. Ein Teil der Frage von OP scheint eine Frage der Semantik zu sein: Wenn ein Lagrange

    L ( q 1 , , Q. n , v 1 , , V. n , t ) (1) (1) L. ( q 1 , , q n , v 1 , , v n , t )
    hat n n unabhängige verallgemeinerte Positionsvariablen q 1 , , Q. n q 1 , , q n dh der Konfigurationsraum ist n n -dimensional, dann soll das System haben n n Freiheitsgrade (DOF), vgl. zB dieser Phys.SE Beitrag.

    Diese Definition von DOF wird trotz der Tatsache verwendet, dass die Lagrange-Gleichungen sind n n Gekoppelte ODEs 2. Ordnung und damit die vollständige Lösung haben 2 n 2 n Integrationskonstanten, dh die Zahl n n von DOF ist definiert als die Hälfte der Integrationskonstanten!

  2. Ein weiteres Problem sind die verallgemeinerten Geschwindigkeiten v 1 , , V. n , v 1 , , v n , sind unabhängige Variablen im Lagrange (1), aber sie sind abhängige Variablen in der Aktion

    S. [ q 1 , , Q. n ;; t ich , t f ]]   : =   t f t ich d t   L ( q 1 , , Q. n q ˙ 1 , , Q. ˙ n , t ) , (2) (2) S. [ q 1 , , q n ;; t ich , t f ]] : = t ich t f d t L. ( q 1 , , q n , q ˙ 1 , , q ˙ n , t ) ,
    Dies wird zB in diesem Phys.SE-Beitrag erklärt.