Der Hamiltonian und der Lagrangeian sind durch eine Legendre-Transformation verwandt:
Dies gilt natürlich für einfache Beispiele wie ein Teilchen in einem Potentialtopf oder ein relativistisches Teilchen, das sich träge bewegt. Es ist mir jedoch nicht klar, dass dies für ein beliebiges Mehrkomponentensystem mit einem komplizierten Satz verallgemeinerter Koordinaten immer der Fall sein wird.
Ist das immer so? Wenn ja, gibt es ein physikalisches Argument, mit dem dies gezeigt werden kann? Oder gibt es alternativ Fälle, in denen diese Konvexitätsbeschränkungen nicht gelten, und wenn ja, was passiert dann?
I) Auf der klassischen Ebene gibt es keine Konvexitätsbedingung. Wenn eine Aktion funktioniert ergibt ein stationäres Wirkungsprinzip , ebenso die negative Wirkung . (Unter Vorzeichenwechsel wird aus einer konvexen Funktion eine konkave Funktion und umgekehrt.) Oder man könnte sich eine Theorie vorstellen, die in einem Abschnitt konvex und in einem anderen Sektor konkav ist.
II) Auf der Lagrange-Seite , lässt sich leicht ein Gegenbeispiel finden, das zeigt, dass man bei den Positionsvariablen keine Konvexität verlangen kann ; oder die Zeitvariable , übrigens. (Denken Sie für Ersteres zB an das Potenzial eines mexikanischen Hutes.) Wie OP schreibt, kann die Konvexität also höchstens die Geschwindigkeitsvariablen betreffen im Lagrange; oder die Impulsvariablen im Hamiltonian .
III) In der Hamiltonschen Formulierung ist es möglich, eine kanonische Transformation durchzuführen
die Positions- und Impulsvariablen mischt. Aus einer Hamiltonschen Perspektive ist es unnatürlich, der Hälfte der kanonischen Variablen Konvexität aufzuerlegen, aber nicht der anderen Hälfte.
IV) Die Lagrange-Funktion (Dichte) kann mit Termen der totalen Divergenz modifiziert werden, die die Euler-Lagrange-Gleichungen nicht ändern. Diese Terme der totalen Divergenz könnten im Prinzip die Konvexität verletzen.
V) Die Legendre-Transformation könnte singulär sein. Tatsächlich ist dies der Ausgangspunkt der Beschränkungsdynamik. Dies geschieht zB für die Maxwell-Lagrange-Dichte
VI) Quantenmechanisch müssen wir fordern, dass der Hamilton-Operator selbstadjungiert und nach unten beschränkt ist, dh die Theorie sollte Unitarität sein .
Perturbativ bedeutet dies, dass der freie/quadratische kinetische Term eine (semi)positive Form (und daher eine konvexe Funktion) sein sollte. Null-Modi sollten messgerätefest sein. Interaktionsterme werden normalerweise perturbativ behandelt.
Zusammenfassend scheint Konvexität per se kein erstes Prinzip zu sein, sondern eher eine Folge der Art von QFTs, die wir normalerweise verstehen können. Es könnte möglich sein, eine nicht-störungsfreie Definition einer nicht-konvexen (aber einheitlichen) Theorie zu geben.
Es gibt in der Tat nichtkonvexe Lagrange-Operatoren, und sie stellen ein Problem für die Legendre-Transformation dar, indem sie sie mehrfach wertig machen (in der Tat wird ein konvexer, aber nicht streng konvexer Lagrange-Operator dieses Problem aufwerfen). Wenn man diese Mehrfachwertigkeit nicht beseitigen kann, indem man das Problem in konvexe und konkave "Sektoren" aufteilt (stückweise Analyse, bei der der Interessensbereich eingeschränkt ist, wie im ersten Absatz der Antwort von Qmecahnics ) oder indem man Einschränkungen auferlegt, dann ist das Spiel vorbei für der Hamiltonsche Ansatz. Tatsächlich impliziert die Mehrfachwertigkeit der Legendre-Transformation die Nichteindeutigkeit der Lösung für die Euler-Lagrange-Gleichung. Ich möchte über eine berühmte Konvexität sprechen, aber nicht streng konvexBeispiel aus meinem eigenen Bereich und was die Leute gegen die Probleme tun, die es aufwirft. Es bietet eine interessante Veranschaulichung der Schwierigkeiten mit der Konvexität und ihrer Entstehung ( dh wie vom OP festgestellt, sind sie gleichbedeutend mit der Mehrfachwertigkeit der Legendre-Transformation), und es gibt auch mindestens zwei gemeinsame Lösungen für dieses spezielle Problem, deren Angemessenheit für verschiedene unterschiedlich ist Bereiche der Physik! Ihre Lösung hängt davon ab, was Sie mit Ihrem Hamiltonoperator erreichen möchten.
Dies ist die Berechnung der Geodäten in einer (semi) Riemannschen Mannigfaltigkeit, sodass:
Dies ist auch das gleiche Problem wie die Berechnung von Strahlen nach dem Prinzip der kleinsten Zeit von Fermat, wenn Sie Informationen zur optischen Dichte (Brechungsindex) in den metrischen Tensor aufnehmen. Strahlenoptik in einem isotropen Medium ist also die Geometrie einer konform flachen Mannigfaltigkeit (da 's Matrix in kartesischen Koordinaten ist das Quadrat des Brechungsindex mal der Identität); aniosotrope Medien ergeben eine allgemeinere Geometrie.
Dieses Beispiel ist historisch wichtig, nicht nur für die Allgemeine Relativitätstheorie, sondern auch, weil die Strahlenoptik – genau dieses Problem – das Gebiet war, das Hamiltons Interesse an diesen Themen geweckt hat.
Das Böse und das Hässliche
Die Lagrange-Funktion ist konvex, aber nicht unbedingt . Betrachten Sie den linearen Pfad:
im Tangentenraum, dh wo man sich bewegt, indem man den Tangentenvektor skaliert . Als Reaktion darauf skaliert auch der Lagrange-Operator in (1) linear, sodass der lineare Pfad genau innerhalb des Graphen / am Rand des Epigraphs des Lagrange-Operators liegt. Also der konjugierte Impuls , wobei es sich um die Eins-Form handelt:
ist unabhängig von da sich unser Punkt gemäß (2) bewegt. Daher ist an jedem Punkt eine sehr viele-zu-eins-Funktion im Tangentialraum: an jedem Punkt im Tangentialraum der Form zum hat in (3) den gleichen Wert. Die Legendre-Transformation kann kein Einzigartiges auswählen für ein jedes . Daher ist es nicht überraschend, wenn man die Legendre-Transformation durchführt, erhält man:
Die Legendre-Transformation ist in diesem Fall eindeutig viele zu eins (versuchen Sie, das laut und mit ernstem Gesicht zu sagen).
Sehen wir uns das mal anders an. Sogar die Lösung der Euler-Lagrange-Gleichung für die Lagrange-Funktion ist - ganz abgesehen vom Wunsch nach einem hamitonischen Gegenstück - in diesem Problem behaftet (aber mit einiger Sorgfalt machbar). Die hessische Matrix der Abbildung ist:
Für unsere Zwecke ist (5) transparenter, wenn wir es in Matrixnotation schreiben (hier ist die Matrix des metrischen Tensors):
Der Begriff ganz rechts in Klammern als parallel zum Projektor auf den Einheitslängenvektor erkannt wird , also ist die Hesse-Matrix singulär auf jedem Tangentialraum zum Konfigurationsraum mit durch die Gerade gegebenem Kern . Ein skaliertes Vielfaches der Hesse-Matrix ist der Koeffizient von in der Euler-Lagrange-Gleichung, was zeigt, dass die Euler-Lagrange-Gleichung eine ganze Familie von Lösungen hat. Schließlich können wir uns das Aktionsintegral selbst ansehen und was damit passiert, wenn wir den Pfadparameter skalieren . Angenommen, die Aktion wird über das Intervall berechnet , und wir führen eine Transformation ein wo ist jede glatte Funktion mit und schreibe , dann:
Also wenn ein extremaler Pfad ist, dann ist es auch für jede glatte, monotone Funktion mit . Wenn wir auf der kürzesten (oder längsten) Straße von A nach B fahren, können wir sie intuitiv mit jedem von uns gewählten Geschwindigkeits-Zeit-Diagramm fahren, aber wir sind immer noch die extreme Straße gefahren.
Der geodätische Fluss im Tangentialraum hat mehrere Flusslinien, tatsächlich ein ganzes Blatt von Flusslinien, zwischen zwei beliebigen Punkten im Konfigurationsraum; Die Urbilder der Projektion auf Geodäten durch den Konfigurationsraum an jedem gegebenen Punkt sind Strahlen von Tangentenvektoren, wobei das Urbild über jedem Punkt in der Geodäte Tangentenvektoren enthält, die alle maßstäbliche Vielfache voneinander sind.
Der gute
Schauen wir uns die Lösung dieses Problems in der Semi-Riemannschen Geometrie an. Hier schummeln wir ein wenig und extremisieren das Aktionsintegral:
dh wir vergessen einfach die Quadratwurzel! (Ich vermute, diese verrückte Idee wurde ursprünglich aus purer Verzweiflung versucht). Nun betrachten wir die Cauchy-Schwarz-Ungleichung für eine Beziehung zwischen den "echten" und "betrügerischen" Lagrange-Funktionalitäten:
mit Gleichheit genau dann ist konstant. Das haben wir ja schon gesehen das ganz linke Integral in (9) minimiert, dann auch wo . Damit finden wir dann die Funktion das macht konstant und gleich der Durchschnittsgeschwindigkeit von zum Minimieren . Cauchy Schwarz sättigt für diesen Fall, so dass wir das Minimum von sehen ist genau das gleiche wie das Minimum von , da der Integrand positiv ist. Wenn wir andererseits versuchen, die Aktion (8) zu maximieren, was bei Geodäten in einer Lorentz-Mannigfaltigkeit der Fall ist, dann gehen wir einfach vor und maximieren (9). Durch "Zufall" stellen wir fest, dass die Maximierung wann erfolgt konstant ist, so dass die durch (9) dargestellte Obergrenze in diesem Fall gesättigt ist, sodass wir eine der maximierenden Lösungen gefunden haben Auch. Nachdem wir die eine Lösung gefunden haben, die die linke Seite von (1) minimiert, können wir alle anderen durch eine Transformation charakterisieren mit . Oder wir ignorieren in der Allgemeinen Relativitätstheorie alle anderen Lösungen, weil wir postulieren, dass die physikalische eine ist, bei der die Eigenzeit eines Beobachters ist gleichmäßig fortschreitet, die Vierergeschwindigkeit also konstant ist, die Beschleunigung Minkowski-orthogonal zur Geschwindigkeit und ist ist also affin. Mit diesem Ansatz erhalten wir also tatsächlich mehr als die Form des geodätischen Pfads; wir erhalten auch eine affine Pfadparametrisierung .
So erhalten wir jetzt leicht unsere Hamiltonsche Formulierung; wenn wir setzen dann bekommen wir ist einfach der Covektor von gefunden, indem der Index des letzteren gesenkt wird, und so haben wir:
Wir sehen nun einen weiteren Grund, warum diese verrückte Lösung bei Physikern so beliebt ist: Der Lagrange- und der Hamilton-Operator in (11) sind die entsprechenden Formulierungen der Newtonschen Mechanik für ein freies Teilchen. Dies ist daher eine sehr angenehme, natürliche Analogie, wenn wir an ein Teilchen denken, das in einem Trägheitssystem "ausrollt". Die Euler-Lagrange-Gleichung für (11) ist leicht zu zeigen ; die Analogie mit einem freien Teilchen macht es sehr befriedigend zu sehen, dass Newtons zweites Gesetz gilt wenn man ein Potential setzt in die Mischung. Es ist eine durch und durch schöne physikalische Analogie. Hamiltons Gleichungen für die Geodäten sind:
Meistens ist diese Lösung auch optisch durchaus akzeptabel. Natürlich wird es alle Berechnungen von Strahlen in glatt inhomogenen Medien handhaben. In der Optik ist der affine Parameter, der der Eigenzeit in GR entspricht, die optische Weglänge oder die Gesamtphasenverzögerung entlang des Wegs.
Was auf den ersten Blick wie ein Betrug erscheint, führt zu einer Lösung, die sehr elegant, glatt und einfach und für die Allgemeine Relativitätstheorie und tatsächlich für die meisten Geometrien vollkommen vollständig ist.
Diese elegante Lösung hat jedoch eine unangenehme Eigenschaft in der Optik, wenn wir auf abrupte Grenzflächen zwischen dielektrischen Medien stoßen, was eine wesentliche Situation ist, die analysiert werden muss, wenn wir beispielsweise über Linsen und Spiegel sprechen. Der Hamilton-Ansatz erfordert einen Lagrange-Operator, der mindestens a ist Die Funktion von , welche Annahme an solch einer abrupten Schnittstelle zusammenbricht. OK, also verwenden wir den Hamilton-Ansatz abgesehen von der Grenzfläche und arbeiten aus, welche Transformation die Grenzfläche auf den Strahlzustand ausübt . Aber es stellt sich heraus, dass, wenn wir dies tun, uns das Snellsche Gesetz Folgendes zeigt:
Die transversalen Komponenten der optischen Impulse sind über die Grenzfläche hinweg kontinuierlich, während die normale Komponente dies nicht unbedingt ist .
Das heißt, die Transformation des optischen Zustands die durch den Durchgang des Strahls über die abrupte Grenzfläche hervorgebracht wird, ist kein Symplektomorphismus. Das Gleiche gilt für Spiegel mit diesem Ansatz: ist kontinuierlich über die Schnittstelle, wohingegen , also ist die Determinante dieser linearen Transformation -1 in drei Dimensionen. Der einfachste Weg, all dies zu verstehen, ist zu beachten, dass der Hamilton-Operator in (12) gleich der konstanten Geschwindigkeit des Punktes in ist ; wir können dies beliebig einstellen Einheiten - wir können jede Konstante wählen, solange wir konsistent sind (skalierte und verschobene affine Parameter sind immer noch affin). Nimmt man diese Konvention an und verwendet man lokal kartesische Koordinaten an der Schnittstelle mit der Ebene parallel zu und die Richtung normal zur Grenzfläche, dann können die optischen Impulse gezeigt werden , wo ist der Brechungsindex an dem Punkt, an dem der Strahl auf die Grenzfläche trifft und sind die Richtungskosinusse, die die Richtung des Strahls mit den orthonormalen Achsen bildet. Von hier aus kann man leicht die obige Behauptung über das Snellsche Gesetz beweisen.
Diese Situation bringt uns zu der gebräuchlicheren Methode zum Umgang mit singulären Legendre-Transformationen – der Verwendung von Einschränkungen, um die Redundanz von „The Bad and The Ugly“ zu beseitigen, die wir oben besprochen haben. Die Verwendung von kann als zu dieser Idee gehörig angesehen werden, wenn wir uns das als Finden der Geodätischen zusammen mit der Einschränkung vorstellen, dass unser Pfadparameter so affin sein sollte . Wenn in der Optik Linsen und Spiegel beteiligt sind, besteht die übliche Lösung darin, die Geschwindigkeit entlang des Pfades so zu beschränken, dass sie eine der Koordinaten ist , sagen ist selbst der Pfadparameter damit . Die offensichtlichste Veranschaulichung dieser Idee ist, wo das optische System eine optische Achse hat, die wir messen entlang dieser Achse koordinieren und so -co-ordinate ist der Pfadparameter. Das keucht und von Lagrange und Hamilton, und jetzt ist der Phasenraum vier statt sechsdimensional. Allgemeiner verwenden wir verallgemeinerte Koordinaten, damit und sind orthogonal zu und dass Oberflächen konstant mit den dielektrischen Grenzflächen ausgerichtet sind. Natürlich können wir dies tun: Wir können "Spannungs" -Koordinaten (mein Name, in der Literatur nicht verwendet) verwenden, bei denen die Linsenoberflächen Äquipotentialflächen und Konstantflächen sind in einem elektrostatischen Problem, und dann die Richtungen der Zunahme und liegen in den Äquipotentialflächen. Die dritte Koordinate ist dann die Spannung an einem beliebigen Punkt. Wenn wir dies tun, sind die transversalen Komponenten des optischen Impulses immer noch kontinuierlich über jede Grenzfläche. Seit der und Da die Koordinaten ebenfalls kontinuierlich sind, verleiht die dielektrische Grenzfläche dem optischen Zustand in diesem vierdimensionalen Ansatz nun einen Symplektomorphismus – tatsächlich den Identitätsoperator. In kartesischen Koordinaten, mit als Pfadparameter sieht dieser Ansatz so aus:
und die Inschriften von beiden und sind beide perfekt erzogene, konvexe / konkave Hyperboloide. Der Pfadparameter ist jedoch nicht affin, sodass Sie diesen Ansatz nicht einfach verwenden können, um zu berechnen, wo sich die Phasenfronten befinden.
In der Optik verwenden wir manchmal beide Ansätze: Wenn Sie berechnen möchten, wo sich die Wellenfronten eines von einer Quelle divergierenden Feldes befinden, benötigen Sie eindeutig die affinen Pfadparameter, um zu wissen, wo die Oberfläche jeder konstanten Phase die Geodäten und die kreuzt sechsdimensional, sich nähern. Um eine Strahlenübertragungsanalyse durchzuführen oder wenn Sie sich die leistungsstarke optische Invariante oder die étendue -Begriffe zunutze machen müssen (beide sind invariante Differentialformen im symplektischen optischen Phasenraum), benötigen Sie alle Schnittstellen im System, um dem Symplektomorphismus zu verleihen optischen Zustand und man wird den vierdimensionalen Ansatz verwenden.
Wenn Sie ein klassisches einfaches, physikalisch signifikantes und berühmtes Beispiel für ein Spielzeugmodell in der Strömungsmechanik suchen, können Sie schwere Partikel in einer Zellströmung betrachten:
wo die Stokes-Zeit der Widerstandskraft der Partikel ist. Die Sinus stellen den Trägerstrom dar, der aus Zellen besteht. In manchen Situationen erweist es sich zur Untersuchung des asymptotischen Verhaltens als interessant, den Widerstand proportional zur Geschwindigkeit zu vernachlässigen und man erhält:
Sie können dieses System in den Phasenraum schreiben:
Dieses System stammt vom Hamiltonian
die weder konvex noch beschränkt ist. Die Lagrange-Funktion folgt unmittelbar.
Was passiert dann? Für die vorstehenden Systeme haben Sie numerische Beweise für Chaos, asymptotische stabile und instabile Punkte und kohärente Superdiffusion ... Die dynamische Erklärung der letzteren ist immer noch ein offenes Problem für Zellflüsse.
Valter Moretti
Jinawee
Alexander Nelson
Jinawee
Alexander Nelson
QMechaniker
N. Jungfrau
wunderbar