Sind die Hamilton- und die Lagrange-Funktion immer konvex?

Question

Sind die Hamilton- und die Lagrange-Funktion immer konvex?

N. Jungfrau

Der Hamiltonian und der Lagrangeian sind durch eine Legendre-Transformation verwandt:

H (q, p, t) = \sum_{ich} {\dot{q}}_{ich} p_{ich} - L (q, \dot{q}, t) .

$H(\mathbf{q}, \mathbf{p}, t) = \sum_i \dot q_i p_i - \mathcal{L}(\mathbf{q}, \mathbf{\dot q}, t).$ Damit dies eine Legendre-Transformation ist,

H

$H$ müssen jeweils konvex sein

p_{i}

$p_i$ und

L

$\mathcal{L}$ müssen jeweils konvex sein

{\dot{q}}_{i}

$\dot q_i$ .

Dies gilt natürlich für einfache Beispiele wie ein Teilchen in einem Potentialtopf oder ein relativistisches Teilchen, das sich träge bewegt. Es ist mir jedoch nicht klar, dass dies für ein beliebiges Mehrkomponentensystem mit einem komplizierten Satz verallgemeinerter Koordinaten immer der Fall sein wird.

Ist das immer so? Wenn ja, gibt es ein physikalisches Argument, mit dem dies gezeigt werden kann? Oder gibt es alternativ Fälle, in denen diese Konvexitätsbeschränkungen nicht gelten, und wenn ja, was passiert dann?

Valter Moretti

Für ein System von (im Allgemeinen eingeschränkten) Materiepunkten, die mit konservativen Kräften (oder verallgemeinerten konservativen Kräften, die ein verallgemeinertes Potenzial zulassen) interagieren

U (t, q, \dot{q})

$U(t,{\bf q},\dot{{\bf q}})$ höchstens linear in der

\dot{q}

$\dot{\bf q}$ wie für die EM-Wechselwirkung), nimmt die Lagrange-Funktion immer die Form an

\sum_{h k} A (t, q)_{h k} {\dot{q}}^{h} {\dot{q}}^{k} + \sum_{h k} B (t, q)_{h} {\dot{q}}^{h} + C (t, q)

$\sum_{hk}A(t, {\bf q})_{hk}\dot{q}^h\dot{q}^k + \sum_{hk}B(t, {\bf q})_{h}\dot{q}^h + C(t, {\bf q})$ . Über

A

$A$ ist eine streng positive symmetrische Matrix. Diese Funktion ist konvex. Die resultierende Hamilton-Funktion ist ebenfalls konvex.

Jinawee

Ein Beispiel für einen nicht-konvexen Lagrange ist:

L = \frac{1}{3} T^{2} + 2 T V - V^{2}

$L=\frac{1}{3}T^2+2TV-V^2$ . Ich konnte den zugehörigen Hamiltonoperator nicht berechnen. Aber da es äquivalent ist zu:

L = T - V

$L=T-V$ , es ist nicht wirklich relevant. Und eine verwandte Frage ohne Antworten: math.stackexchange.com/q/482553

Alexander Nelson

@jinawee, für

L = T^{2} / 3 + 2 T V - V^{2}

$L=T^{2}/3 + 2TV - V^{2}$ , wären die kanonischen Impulse

p_{k} = 2 (T / 3 + V) \partial T / \partial {\dot{q}}^{k}

$p_{k}=2(T/3 + V)\partial T/\partial\dot{q}^{k}$ und der Hamiltonian wäre daher

H = T^{2} + 2 T V + V^{2} = (T + V)^{2}

$H=T^{2}+2TV+V^{2}=(T+V)^{2}$ .

Jinawee

@AlexNelson Wie kommst du von

H = 2 (T / 3 + V) \partial T / \partial {\dot{q}}^{k} {\dot{q}}_{k} - T^{2} / 3 - 2 T V + V^{2}

$H=2(T/3 + V)\partial T/\partial\dot{q}^{k}\dot{q}_k-T^{2}/3 - 2TV + V^{2}$ zu Ihrem letzten Hamiltonian?

Alexander Nelson

@jinawee, ich muss zugeben, dass ich angenommen habe

{\dot{q}}^{k} \partial T / \partial {\dot{q}}^{k} = 2 T

$\dot{q}^{k}\partial T/\partial\dot{q}^{k}=2T$ wie gewohnt (zusammenfassend

k

$k$ , a la Einstein Summationskonvention). Dies funktioniert in der Newtonschen Umgebung, aber wenn man versucht, in (sagen wir) der Speziellen Relativitätstheorie zu arbeiten, bin ich nicht so zuversichtlich, dass es das gleiche Ergebnis erzielen würde ...

QMechaniker

Verwandte math.SE-Frage: math.stackexchange.com/q/212120/11127

N. Jungfrau

@Qmechanic beachten Sie, dass eine der Antworten auf diese verwandte Frage von mir stammt. Ein nicht-konvexer Lagrange-Operator würde einen mehrwertigen Hamilton-Operator implizieren und umgekehrt, daher bin ich immer noch etwas verwirrt. (Im klassischen Kontext.)

wunderbar

Versuchen Sie, Ihre Terminologie zu verstehen. Implizieren Sie konvex: konkav ~ Minimierung: Maximierung der Funktionsdichte?

Antworten (3)

Sind die Hamilton- und die Lagrange-Funktion immer konvex?

Für ein System von (im Allgemeinen eingeschränkten) Materiepunkten, die mit konservativen Kräften (oder verallgemeinerten konservativen Kräften, die ein verallgemeinertes Potenzial zulassen) interagieren $U(t,{\bf q},\dot{{\bf q}})$ höchstens linear in der $\dot{\bf q}$ wie für die EM-Wechselwirkung), nimmt die Lagrange-Funktion immer die Form an $\sum_{hk}A(t, {\bf q})_{hk}\dot{q}^h\dot{q}^k + \sum_{hk}B(t, {\bf q})_{h}\dot{q}^h + C(t, {\bf q})$ . Über $A$ ist eine streng positive symmetrische Matrix. Diese Funktion ist konvex. Die resultierende Hamilton-Funktion ist ebenfalls konvex.
Ein Beispiel für einen nicht-konvexen Lagrange ist: $L=\frac{1}{3}T^2+2TV-V^2$ . Ich konnte den zugehörigen Hamiltonoperator nicht berechnen. Aber da es äquivalent ist zu: $L=T-V$ , es ist nicht wirklich relevant. Und eine verwandte Frage ohne Antworten: math.stackexchange.com/q/482553
@jinawee, für $L=T^{2}/3 + 2TV - V^{2}$ , wären die kanonischen Impulse $p_{k}=2(T/3 + V)\partial T/\partial\dot{q}^{k}$ und der Hamiltonian wäre daher $H=T^{2}+2TV+V^{2}=(T+V)^{2}$ .
@AlexNelson Wie kommst du von $H=2(T/3 + V)\partial T/\partial\dot{q}^{k}\dot{q}_k-T^{2}/3 - 2TV + V^{2}$ zu Ihrem letzten Hamiltonian?
@jinawee, ich muss zugeben, dass ich angenommen habe $\dot{q}^{k}\partial T/\partial\dot{q}^{k}=2T$ wie gewohnt (zusammenfassend $k$ , a la Einstein Summationskonvention). Dies funktioniert in der Newtonschen Umgebung, aber wenn man versucht, in (sagen wir) der Speziellen Relativitätstheorie zu arbeiten, bin ich nicht so zuversichtlich, dass es das gleiche Ergebnis erzielen würde ...
Verwandte math.SE-Frage: math.stackexchange.com/q/212120/11127
@Qmechanic beachten Sie, dass eine der Antworten auf diese verwandte Frage von mir stammt. Ein nicht-konvexer Lagrange-Operator würde einen mehrwertigen Hamilton-Operator implizieren und umgekehrt, daher bin ich immer noch etwas verwirrt. (Im klassischen Kontext.)
Versuchen Sie, Ihre Terminologie zu verstehen. Implizieren Sie konvex: konkav ~ Minimierung: Maximierung der Funktionsdichte?

QMechaniker · Answer 1

I) Auf der klassischen Ebene gibt es keine Konvexitätsbedingung. Wenn eine Aktion funktioniert $S$ ergibt ein stationäres Wirkungsprinzip , ebenso die negative Wirkung $-S$ . (Unter Vorzeichenwechsel wird aus einer konvexen Funktion eine konkave Funktion und umgekehrt.) Oder man könnte sich eine Theorie vorstellen, die in einem Abschnitt konvex und in einem anderen Sektor konkav ist.

II) Auf der Lagrange-Seite $L(q,v,t)$ , lässt sich leicht ein Gegenbeispiel finden, das zeigt, dass man bei den Positionsvariablen keine Konvexität verlangen kann $q^i$ ; oder die Zeitvariable $t$ , übrigens. (Denken Sie für Ersteres zB an das Potenzial eines mexikanischen Hutes.) Wie OP schreibt, kann die Konvexität also höchstens die Geschwindigkeitsvariablen betreffen $v^i$ im Lagrange; oder die Impulsvariablen $p_i$ im Hamiltonian $H(q,p,t)$ .

III) In der Hamiltonschen Formulierung ist es möglich, eine kanonische Transformation durchzuführen

(q^{ich}, p^{j}) ⟶ (Q^{ich}, P^{j}) = (- p^{ich}, q^{j})

$(q^i,p^j)~\longrightarrow~(Q^i,P^j)~=~(-p^i,q^j)$

die Positions- und Impulsvariablen mischt. Aus einer Hamiltonschen Perspektive ist es unnatürlich, der Hälfte der kanonischen Variablen Konvexität aufzuerlegen, aber nicht der anderen Hälfte.

IV) Die Lagrange-Funktion (Dichte) kann mit Termen der totalen Divergenz modifiziert werden, die die Euler-Lagrange-Gleichungen nicht ändern. Diese Terme der totalen Divergenz könnten im Prinzip die Konvexität verletzen.

V) Die Legendre-Transformation könnte singulär sein. Tatsächlich ist dies der Ausgangspunkt der Beschränkungsdynamik. Dies geschieht zB für die Maxwell-Lagrange-Dichte

L = - \frac{1}{4} F_{μ v} F^{μ v} .

${\cal L}~=~-\frac{1}{4}F_{\mu\nu}F^{\mu\nu}.$ Siehe zB diesen Phys.SE Beitrag.

VI) Quantenmechanisch müssen wir fordern, dass der Hamilton-Operator selbstadjungiert und nach unten beschränkt ist, dh die Theorie sollte Unitarität sein .

Perturbativ bedeutet dies, dass der freie/quadratische kinetische Term eine (semi)positive Form (und daher eine konvexe Funktion) sein sollte. Null-Modi sollten messgerätefest sein. Interaktionsterme werden normalerweise perturbativ behandelt.

Zusammenfassend scheint Konvexität per se kein erstes Prinzip zu sein, sondern eher eine Folge der Art von QFTs, die wir normalerweise verstehen können. Es könnte möglich sein, eine nicht-störungsfreie Definition einer nicht-konvexen (aber einheitlichen) Theorie zu geben.

Danke, das kann ich größtenteils nachvollziehen. Ich weiter, wenn es der Fall sein könnte, dass es für jeden Hamilton-Operator eine kanonische Transformation gibt, die ihn (positiv oder negativ) in den Impulsen konvex macht. Das würde garantieren, dass eine Kombination aus kanonischer Transformation und Legendre-Transformation es immer in Lagrange-Form bringen könnte.

Selene Rouley · Answer 2

Es gibt in der Tat nichtkonvexe Lagrange-Operatoren, und sie stellen ein Problem für die Legendre-Transformation dar, indem sie sie mehrfach wertig machen (in der Tat wird ein konvexer, aber nicht streng konvexer Lagrange-Operator dieses Problem aufwerfen). Wenn man diese Mehrfachwertigkeit nicht beseitigen kann, indem man das Problem in konvexe und konkave "Sektoren" aufteilt (stückweise Analyse, bei der der Interessensbereich eingeschränkt ist, wie im ersten Absatz der Antwort von Qmecahnics ) oder indem man Einschränkungen auferlegt, dann ist das Spiel vorbei für der Hamiltonsche Ansatz. Tatsächlich impliziert die Mehrfachwertigkeit der Legendre-Transformation die Nichteindeutigkeit der Lösung für die Euler-Lagrange-Gleichung. Ich möchte über eine berühmte Konvexität sprechen, aber nicht streng konvexBeispiel aus meinem eigenen Bereich und was die Leute gegen die Probleme tun, die es aufwirft. Es bietet eine interessante Veranschaulichung der Schwierigkeiten mit der Konvexität und ihrer Entstehung ( dh wie vom OP festgestellt, sind sie gleichbedeutend mit der Mehrfachwertigkeit der Legendre-Transformation), und es gibt auch mindestens zwei gemeinsame Lösungen für dieses spezielle Problem, deren Angemessenheit für verschiedene unterschiedlich ist Bereiche der Physik! Ihre Lösung hängt davon ab, was Sie mit Ihrem Hamiltonoperator erreichen möchten.

Dies ist die Berechnung der Geodäten in einer (semi) Riemannschen Mannigfaltigkeit, sodass:

\begin{matrix} (1) & L = \sqrt{g (X) (\dot{X}, \dot{X})} = \sqrt{g_{ich j} (X) {\dot{x}}^{ich} {\dot{x}}^{j}} \end{matrix}

$\mathcal{L} = \sqrt{g(X)(\dot{X},\,\dot{X})} = \sqrt{g_{ij}(X)\,\dot{x}^i\,\dot{x}^j}\tag{1}$

Dies ist auch das gleiche Problem wie die Berechnung von Strahlen nach dem Prinzip der kleinsten Zeit von Fermat, wenn Sie Informationen zur optischen Dichte (Brechungsindex) in den metrischen Tensor aufnehmen. Strahlenoptik in einem isotropen Medium ist also die Geometrie einer konform flachen Mannigfaltigkeit (da $g$ 's Matrix in kartesischen Koordinaten ist das Quadrat des Brechungsindex mal der Identität); aniosotrope Medien ergeben eine allgemeinere Geometrie.

Dieses Beispiel ist historisch wichtig, nicht nur für die Allgemeine Relativitätstheorie, sondern auch, weil die Strahlenoptik – genau dieses Problem – das Gebiet war, das Hamiltons Interesse an diesen Themen geweckt hat.

Das Böse und das Hässliche

Die Lagrange-Funktion ist konvex, aber nicht unbedingt . Betrachten Sie den linearen Pfad:

\begin{matrix} (2) & σ (t) = t {\dot{X}}_{0} \end{matrix}

$\sigma(t) = t\,\dot{X}_0\tag{2}$

im Tangentenraum, dh wo man sich bewegt, indem man den Tangentenvektor skaliert $\dot{X}_0$ . Als Reaktion darauf skaliert auch der Lagrange-Operator in (1) linear, sodass der lineare Pfad genau innerhalb des Graphen / am Rand des Epigraphs des Lagrange-Operators liegt. Also der konjugierte Impuls $\partial_\dot{X}\,\mathcal{L}$ , wobei es sich um die Eins-Form handelt:

\begin{matrix} (3) & P (_) = \frac{g (\dot{X},_)}{\sqrt{g (\dot{X}, \dot{X})}} \end{matrix}

$P(\text{_}) = \frac{g(\dot{X},\,\text{_})}{\sqrt{g(\dot{X},\,\dot{X})}}\tag{3}$

ist unabhängig von $t$ da sich unser Punkt gemäß (2) bewegt. Daher $P$ ist an jedem Punkt eine sehr viele-zu-eins-Funktion im Tangentialraum: an jedem Punkt im Tangentialraum der Form $t\,X_0$ zum $t\in\mathbb{R}$ hat in (3) den gleichen Wert. Die Legendre-Transformation kann kein Einzigartiges auswählen $P$ für ein jedes $\dot{X}$ . Daher ist es nicht überraschend, wenn man die Legendre-Transformation durchführt, erhält man:

\begin{matrix} (4) & H = P (\dot{X}) - L = \frac{g (\dot{X}, \dot{X})}{\sqrt{g (\dot{X}, \dot{X})}} - L = 0 OMG!! \end{matrix}

$\mathcal{H} = P(\dot{X}) - \mathcal{L}=\frac{g(\dot{X},\,\dot{X})}{\sqrt{g(\dot{X},\,\dot{X})}}-\mathcal{L}=0\quad\quad \text{OMG!!}\tag{4}$

Die Legendre-Transformation ist in diesem Fall eindeutig viele zu eins (versuchen Sie, das laut und mit ernstem Gesicht zu sagen).

Sehen wir uns das mal anders an. Sogar die Lösung der Euler-Lagrange-Gleichung für die Lagrange-Funktion ist - ganz abgesehen vom Wunsch nach einem hamitonischen Gegenstück - in diesem Problem behaftet (aber mit einiger Sorgfalt machbar). Die hessische Matrix der Abbildung $\dot{X} \mapsto P = \partial_{\dot{X}} \mathcal{L}$ ist:

\begin{matrix} (5) & h_{ich j} = \partial_{{\dot{x}}^{ich}} \partial_{{\dot{x}}^{j}} L = (g (\dot{X}, \dot{X}) g_{ich j} - g_{ich k} {\dot{x}}^{k} g_{j ℓ} {\dot{x}}^{ℓ}) L^{- 3} \end{matrix}

$h_{ij} = \partial_{\dot{x}^i} \partial_{\dot{x}^j} \mathcal{L} = \left(g(\dot{X},\,\dot{X})\,g_{ij} - g_{i k}\,\dot{x}^k\,g_{j \ell}\,\dot{x}^\ell\right)\,\mathcal{L}^{-3}\tag{5}$

Für unsere Zwecke ist (5) transparenter, wenn wir es in Matrixnotation schreiben (hier $G$ ist die Matrix des metrischen Tensors):

\begin{matrix} (6) & H = \frac{G}{(X^{T} G X)^{\frac{3}{2}}} (ich d - \frac{\dot{X} {\dot{X}}^{T} G}{{\dot{X}}^{T} G \dot{X}}) \end{matrix}

$H = \frac{G}{(X^T\,G\,X)^\frac{3}{2}}\,\left(\mathrm{id} - \frac{\dot{X}\,\dot{X}^T\,G}{\dot{X}^T\,G\,\dot{X}}\right)\tag{6}$

Der Begriff ganz rechts in Klammern $\dot{X}\,\dot{X}^T\,G/(\dot{X}^T\,G\,\dot{X})$ als parallel zum Projektor auf den Einheitslängenvektor erkannt wird $\dot{X}$ , also ist die Hesse-Matrix singulär auf jedem Tangentialraum zum Konfigurationsraum mit durch die Gerade gegebenem Kern $\{t\,\dot{X}:\,t\in\mathbb{R}\}$ . Ein skaliertes Vielfaches der Hesse-Matrix ist der Koeffizient von $\ddot{X}$ in der Euler-Lagrange-Gleichung, was zeigt, dass die Euler-Lagrange-Gleichung eine ganze Familie von Lösungen hat. Schließlich können wir uns das Aktionsintegral selbst ansehen und was damit passiert, wenn wir den Pfadparameter skalieren $\tau$ . Angenommen, die Aktion wird über das Intervall berechnet $\tau\in[0,\,1]$ , und wir führen eine Transformation ein $\tau=\zeta(\sigma)$ wo $\sigma$ ist jede glatte Funktion mit $\zeta(0)=0;\,\zeta(1) = 1$ und schreibe $Y(\sigma) = X(\zeta(\sigma))$ , $\dot{Y}(\sigma) = \mathrm{d}_\sigma X(\zeta(\sigma))$ dann:

\begin{matrix} (7) & S = \int_{τ = 0}^{1} \sqrt{g (\dot{X} (τ), \dot{X} (τ))} d τ = \int_{σ = 0}^{1} \sqrt{g (\frac{\dot{Y} (σ)}{\frac{d ζ}{d σ}}, \frac{\dot{Y} (σ)}{\frac{d ζ}{d σ}})} \frac{d ζ}{d σ} d σ = \int_{τ = 0}^{1} \sqrt{g (\dot{Y} (τ), \dot{Y} (τ))} d τ \end{matrix}

$\mathcal{S} = \int_{\tau=0}^1\,\sqrt{g(\dot{X}(\tau),\,\dot{X}(\tau))}\,\mathrm{d}\tau = \int_{\sigma=0}^1\,\sqrt{g\left(\frac{\dot{Y}(\sigma)}{\frac{\mathrm{d}\zeta}{\mathrm{d}\sigma}},\,\frac{\dot{Y}(\sigma)}{\frac{\mathrm{d}\zeta}{\mathrm{d}\sigma}}\right)}\,\frac{\mathrm{d}\zeta}{\mathrm{d}\sigma}\,\mathrm{d}\sigma \\= \int_{\tau=0}^1\,\sqrt{g(\dot{Y}(\tau),\,\dot{Y}(\tau))}\,\mathrm{d}\tau\tag{7}$

Also wenn $X(\tau)$ ein extremaler Pfad ist, dann ist es auch $X(\zeta(\tau))$ für jede glatte, monotone Funktion mit $\zeta(0)=0;\,\zeta(1)=1$ . Wenn wir auf der kürzesten (oder längsten) Straße von A nach B fahren, können wir sie intuitiv mit jedem von uns gewählten Geschwindigkeits-Zeit-Diagramm fahren, aber wir sind immer noch die extreme Straße gefahren.

Der geodätische Fluss im Tangentialraum hat mehrere Flusslinien, tatsächlich ein ganzes Blatt von Flusslinien, zwischen zwei beliebigen Punkten im Konfigurationsraum; Die Urbilder der Projektion auf Geodäten durch den Konfigurationsraum an jedem gegebenen Punkt sind Strahlen von Tangentenvektoren, wobei das Urbild über jedem Punkt in der Geodäte Tangentenvektoren enthält, die alle maßstäbliche Vielfache voneinander sind.

Der gute

Schauen wir uns die Lösung dieses Problems in der Semi-Riemannschen Geometrie an. Hier schummeln wir ein wenig und extremisieren das Aktionsintegral:

\begin{matrix} (9) & L = \int_{0}^{1} g (\dot{X}, \dot{X}) d τ \end{matrix}

$\mathcal{L} = \int_0^1 g(\dot{X},\,\dot{X})\,\mathrm{d}\tau\tag{9}$

dh wir vergessen einfach die Quadratwurzel! (Ich vermute, diese verrückte Idee wurde ursprünglich aus purer Verzweiflung versucht). Nun betrachten wir die Cauchy-Schwarz-Ungleichung für eine Beziehung zwischen den "echten" und "betrügerischen" Lagrange-Funktionalitäten:

\begin{matrix} (10) & \int_{0}^{1} \sqrt{g (\dot{X}, \dot{X})} \cdot 1 d τ \leq \sqrt{\int_{0}^{1} g (\dot{X}, \dot{X}) d τ} \sqrt{\int_{0}^{1} 1 d τ} = \sqrt{\int_{0}^{1} g (\dot{X}, \dot{X}), d τ} \end{matrix}

$\int_0^1\,\sqrt{g(\dot{X},\,\dot{X})}\,\cdot 1\,\mathrm{d}\tau \leq \sqrt{\int_0^1\,g(\dot{X},\,\dot{X})\,\mathrm{d}\tau}\sqrt{\int_0^1\,1\,\mathrm{d}\tau} = \sqrt{\int_0^1\,g(\dot{X},\,\dot{X}),\mathrm{d}\tau}\tag{10}$

mit Gleichheit genau dann $\sqrt{g(\dot{X},\,\dot{X})}$ ist konstant. Das haben wir ja schon gesehen $X(\tau)$ das ganz linke Integral in (9) minimiert, dann auch $X(\zeta(\tau))$ wo $\zeta(0)=0;\,\zeta(1)=1$ . Damit finden wir dann die Funktion $\zeta(\tau)$ das macht $\sqrt{g(\dot{Y},\,\dot{Y})}$ konstant und gleich der Durchschnittsgeschwindigkeit von $X$ zum Minimieren $X$ . Cauchy Schwarz sättigt für diesen Fall, so dass wir das Minimum von sehen $\int_0^1\,\sqrt{g(\dot{X},\,\dot{X})}\cdot 1\,\mathrm{d}\tau$ ist genau das gleiche wie das Minimum von $\int_0^1\,g(\dot{X},\,\dot{X})\cdot 1\,\mathrm{d}\tau$ , da der Integrand positiv ist. Wenn wir andererseits versuchen, die Aktion (8) zu maximieren, was bei Geodäten in einer Lorentz-Mannigfaltigkeit der Fall ist, dann gehen wir einfach vor und maximieren (9). Durch "Zufall" stellen wir fest, dass die Maximierung wann erfolgt $g(\dot{X},\,\dot{X})$ konstant ist, so dass die durch (9) dargestellte Obergrenze in diesem Fall gesättigt ist, sodass wir eine der maximierenden Lösungen gefunden haben $\int_0^1\,\sqrt{g(\dot{X},\,\dot{X})}\cdot 1\,\mathrm{d}\tau$ Auch. Nachdem wir die eine Lösung gefunden haben, die die linke Seite von (1) minimiert, können wir alle anderen durch eine Transformation charakterisieren $\tau=\zeta(\sigma)$ mit $\zeta(0)=0;\,\zeta(1)=1$ . Oder wir ignorieren in der Allgemeinen Relativitätstheorie alle anderen Lösungen, weil wir postulieren, dass die physikalische eine ist, bei der die Eigenzeit eines Beobachters ist $\tau$ gleichmäßig fortschreitet, die Vierergeschwindigkeit also konstant ist, die Beschleunigung Minkowski-orthogonal zur Geschwindigkeit und ist $\tau$ ist also affin. Mit diesem Ansatz erhalten wir also tatsächlich mehr als die Form des geodätischen Pfads; wir erhalten auch eine affine Pfadparametrisierung .

So erhalten wir jetzt leicht unsere Hamiltonsche Formulierung; wenn wir setzen $\mathcal{L}=\frac{1}{2}\,g(\dot{X},\,\dot{X})$ dann bekommen wir $P=\dot{X} _\flat;\,p_k = g_{kj} \dot{x}^j$ ist einfach der Covektor von $\dot{X}$ gefunden, indem der Index des letzteren gesenkt wird, und so haben wir:

\begin{matrix} (11) & L = H = \frac{1}{2} g (\dot{X}, \dot{X}) = \frac{1}{2} g_{ich j} {\dot{x}}^{ich} {\dot{x}}^{j} = \frac{1}{2} g^{♯ ♯} (P, P) = \frac{1}{2} g^{ich j} p_{ich} p_{j} \end{matrix}

$\mathcal{L} = \mathcal{H} = \frac{1}{2} g(\dot{X},\,\dot{X}) = \frac{1}{2}\,g_{ij}\dot{x}^i\,\dot{x}^j = \frac{1}{2} g^{\sharp\kern+1.4pt\sharp}(P,\,P)=\frac{1}{2}\,g^{ij}\,p_i\,p_j\tag{11}$

Wir sehen nun einen weiteren Grund, warum diese verrückte Lösung bei Physikern so beliebt ist: Der Lagrange- und der Hamilton-Operator in (11) sind die entsprechenden Formulierungen der Newtonschen Mechanik für ein freies Teilchen. Dies ist daher eine sehr angenehme, natürliche Analogie, wenn wir an ein Teilchen denken, das in einem Trägheitssystem "ausrollt". Die Euler-Lagrange-Gleichung für (11) ist leicht zu zeigen $\ddot{X}^k + \Gamma^k_{ij}\,\dot{X}^i\,\dot{X}^j=0$ ; die Analogie mit einem freien Teilchen macht es sehr befriedigend zu sehen, dass Newtons zweites Gesetz gilt $-g^{kj} \partial_{x^j} V = F^k = m\left(\ddot{X}^k + \Gamma^k_{ij}\,\dot{X}^i\,\dot{X}^j\right)$ wenn man ein Potential setzt $V(x)$ in die Mischung. Es ist eine durch und durch schöne physikalische Analogie. Hamiltons Gleichungen für die Geodäten sind:

\begin{matrix} (12) & {\dot{x}}^{k} = g^{k j} p_{j}; {\dot{p}}_{k} = - \frac{1}{2} (\partial_{x^{k}} g^{ich j}) p_{ich} p_{j} \end{matrix}

$\dot{x}^k = g^{kj}\,p_j;\quad \dot{p}_k = -\frac{1}{2}\,\left(\partial_{x^k}\,g^{ij}\right)\,p_i\,p_j\tag{12}$

Meistens ist diese Lösung auch optisch durchaus akzeptabel. Natürlich wird es alle Berechnungen von Strahlen in glatt inhomogenen Medien handhaben. In der Optik ist der affine Parameter, der der Eigenzeit in GR entspricht, die optische Weglänge oder die Gesamtphasenverzögerung entlang des Wegs.

Was auf den ersten Blick wie ein Betrug erscheint, führt zu einer Lösung, die sehr elegant, glatt und einfach und für die Allgemeine Relativitätstheorie und tatsächlich für die meisten Geometrien vollkommen vollständig ist.

Diese elegante Lösung hat jedoch eine unangenehme Eigenschaft in der Optik, wenn wir auf abrupte Grenzflächen zwischen dielektrischen Medien stoßen, was eine wesentliche Situation ist, die analysiert werden muss, wenn wir beispielsweise über Linsen und Spiegel sprechen. Der Hamilton-Ansatz erfordert einen Lagrange-Operator, der mindestens a ist $C^2$ Die Funktion von $\dot{X}$ , welche Annahme an solch einer abrupten Schnittstelle zusammenbricht. OK, also verwenden wir den Hamilton-Ansatz abgesehen von der Grenzfläche und arbeiten aus, welche Transformation die Grenzfläche auf den Strahlzustand ausübt $(X,\,P)$ . Aber es stellt sich heraus, dass, wenn wir dies tun, uns das Snellsche Gesetz Folgendes zeigt:

Die transversalen Komponenten der optischen Impulse sind über die Grenzfläche hinweg kontinuierlich, während die normale Komponente dies nicht unbedingt ist .

Das heißt, die Transformation des optischen Zustands $(X,\,P)$ die durch den Durchgang des Strahls über die abrupte Grenzfläche hervorgebracht wird, ist kein Symplektomorphismus. Das Gleiche gilt für Spiegel mit diesem Ansatz: $X$ ist kontinuierlich über die Schnittstelle, wohingegen $P\mapsto -P$ , also ist die Determinante dieser linearen Transformation -1 in drei Dimensionen. Der einfachste Weg, all dies zu verstehen, ist zu beachten, dass der Hamilton-Operator in (12) gleich der konstanten Geschwindigkeit des Punktes in ist $(\text{optical phase per unit time})^2$ ; wir können dies beliebig einstellen $1/2$ Einheiten - wir können jede Konstante wählen, solange wir konsistent sind (skalierte und verschobene affine Parameter sind immer noch affin). Nimmt man diese Konvention an und verwendet man lokal kartesische Koordinaten an der Schnittstelle mit der $x-y$ Ebene parallel zu und die $z$ Richtung normal zur Grenzfläche, dann können die optischen Impulse gezeigt werden $p_k = n\,\gamma_k$ , wo $n$ ist der Brechungsindex an dem Punkt, an dem der Strahl auf die Grenzfläche trifft und $\gamma_k$ sind die Richtungskosinusse, die die Richtung des Strahls mit den orthonormalen Achsen bildet. Von hier aus kann man leicht die obige Behauptung über das Snellsche Gesetz beweisen.

Diese Situation bringt uns zu der gebräuchlicheren Methode zum Umgang mit singulären Legendre-Transformationen – der Verwendung von Einschränkungen, um die Redundanz von „The Bad and The Ugly“ zu beseitigen, die wir oben besprochen haben. Die Verwendung von $\mathcal{L} =\frac{1}{2} g(\dot{X},\,\dot{X})$ kann als zu dieser Idee gehörig angesehen werden, wenn wir uns das als Finden der Geodätischen zusammen mit der Einschränkung vorstellen, dass unser Pfadparameter so affin sein sollte $\mathcal{L}=const$ . Wenn in der Optik Linsen und Spiegel beteiligt sind, besteht die übliche Lösung darin, die Geschwindigkeit entlang des Pfades so zu beschränken, dass sie eine der Koordinaten ist $x^i$ , sagen $x^3$ ist selbst der Pfadparameter damit $\dot{x}^3=1$ . Die offensichtlichste Veranschaulichung dieser Idee ist, wo das optische System eine optische Achse hat, die wir messen $z$ entlang dieser Achse koordinieren und so $z$ -co-ordinate ist der Pfadparameter. Das keucht $x^3$ und $p^3$ von Lagrange und Hamilton, und jetzt ist der Phasenraum vier statt sechsdimensional. Allgemeiner verwenden wir verallgemeinerte Koordinaten, damit $\partial_1$ und $\partial_2$ sind orthogonal zu $\partial_3$ und dass Oberflächen konstant $x^3$ mit den dielektrischen Grenzflächen ausgerichtet sind. Natürlich können wir dies tun: Wir können "Spannungs" -Koordinaten (mein Name, in der Literatur nicht verwendet) verwenden, bei denen die Linsenoberflächen Äquipotentialflächen und Konstantflächen sind $x^3$ in einem elektrostatischen Problem, und dann die Richtungen der Zunahme $x^1$ und $x^2$ liegen in den Äquipotentialflächen. Die dritte Koordinate ist dann die Spannung an einem beliebigen Punkt. Wenn wir dies tun, sind die transversalen Komponenten des optischen Impulses immer noch kontinuierlich über jede Grenzfläche. Seit der $x^1$ und $x^2$ Da die Koordinaten ebenfalls kontinuierlich sind, verleiht die dielektrische Grenzfläche dem optischen Zustand in diesem vierdimensionalen Ansatz nun einen Symplektomorphismus – tatsächlich den Identitätsoperator. In kartesischen Koordinaten, mit $z$ als Pfadparameter sieht dieser Ansatz so aus:

\begin{matrix} (13) & \begin{array}{ll} L = n \sqrt{1 + {\dot{x}}^{2} + {\dot{j}}^{2}} & H = - \sqrt{n^{2} - p_{x}^{2} - p_{j}^{2}} \\ p_{x} = n \frac{\dot{x}}{1 + {\dot{x}}^{2} + {\dot{j}}^{2}} & p_{j} = n \frac{\dot{j}}{1 + {\dot{x}}^{2} + {\dot{j}}^{2}}; \end{array} \end{matrix}

$\begin{array}{ll}\mathcal{L} = n\,\sqrt{1+\dot{x}^2+\dot{y}^2} & \mathcal{H}=-\sqrt{n^2-p_x^2-p_y^2}\\ p_x = n\frac{\dot{x}}{1+\dot{x}^2+\dot{y}^2} & p_y = n\frac{\dot{y}}{1+\dot{x}^2+\dot{y}^2};\;\end{array}\tag{13}$

und die Inschriften von beiden $\mathcal{L}$ und $\mathcal{H}$ sind beide perfekt erzogene, konvexe / konkave Hyperboloide. Der Pfadparameter ist jedoch nicht affin, sodass Sie diesen Ansatz nicht einfach verwenden können, um zu berechnen, wo sich die Phasenfronten befinden.

In der Optik verwenden wir manchmal beide Ansätze: Wenn Sie berechnen möchten, wo sich die Wellenfronten eines von einer Quelle divergierenden Feldes befinden, benötigen Sie eindeutig die affinen Pfadparameter, um zu wissen, wo die Oberfläche jeder konstanten Phase die Geodäten und die kreuzt sechsdimensional, $\mathscr{L} = g(\dot{X},\,\dot{X})$ sich nähern. Um eine Strahlenübertragungsanalyse durchzuführen oder wenn Sie sich die leistungsstarke optische Invariante oder die étendue -Begriffe zunutze machen müssen (beide sind invariante Differentialformen im symplektischen optischen Phasenraum), benötigen Sie alle Schnittstellen im System, um dem Symplektomorphismus zu verleihen optischen Zustand und man wird den vierdimensionalen Ansatz verwenden.

Jungs · Answer 3

Wenn Sie ein klassisches einfaches, physikalisch signifikantes und berühmtes Beispiel für ein Spielzeugmodell in der Strömungsmechanik suchen, können Sie schwere Partikel in einer Zellströmung betrachten:

\begin{array}{rcl} \ddot{x} & = & - \frac{\dot{x} - U s ich n (j)}{τ} \\ \ddot{j} & = & - \frac{\dot{j} - U s ich n (x)}{τ} \end{array}

$\begin{eqnarray} \ddot x&=& -\frac{\dot x- U sin(y)}{\tau}\nonumber\\ \ddot y&=& -\frac{\dot y- U sin(x)}{\tau}\nonumber\\ \end{eqnarray}$

wo $\tau$ die Stokes-Zeit der Widerstandskraft der Partikel ist. Die Sinus stellen den Trägerstrom dar, der aus Zellen besteht. In manchen Situationen erweist es sich zur Untersuchung des asymptotischen Verhaltens als interessant, den Widerstand proportional zur Geschwindigkeit zu vernachlässigen und man erhält:

\begin{array}{rcl} \ddot{x} & = & - \frac{U s ich n (j)}{τ} \\ \ddot{j} & = & - \frac{U s ich n (x)}{τ} \end{array}

$\begin{eqnarray} \ddot x&=& -\frac{ U sin(y)}{\tau}\nonumber\\ \ddot y&=& -\frac{U sin(x)}{\tau}\nonumber\\ \end{eqnarray}$

Sie können dieses System in den Phasenraum schreiben:

\begin{array}{rcl} \dot{x} & = & u \\ \dot{u} & = & \frac{U s ich n (j)}{τ} \\ \dot{j} & = & v \\ \ddot{v} & = & \frac{U s ich n (x)}{τ} \end{array}

$\begin{eqnarray} \dot x&=& u\nonumber\\ \dot u&=& \frac{U sin(y)}{\tau}\nonumber\\ \dot y&=& v\nonumber\\ \ddot v&=& \frac{ U sin(x)}{\tau}\nonumber\\ \end{eqnarray}$

Dieses System stammt vom Hamiltonian

H (x, j, u, v) = u v + U \frac{c Ö s x + c Ö s j}{τ}

$H(x,y,u,v)=uv+U\frac{cos x+ cos y}{\tau}$

die weder konvex noch beschränkt ist. Die Lagrange-Funktion folgt unmittelbar.

Was passiert dann? Für die vorstehenden Systeme haben Sie numerische Beweise für Chaos, asymptotische stabile und instabile Punkte und kohärente Superdiffusion ... Die dynamische Erklärung der letzteren ist immer noch ein offenes Problem für Zellflüsse.

$H$ ist aber nicht besonders pathologisch. Die Inschrift von $H = u\,v$ ist ein Hyperboloid mit zwei Blättern, wobei jedes Blatt konvex ist. Drehen Sie Ihre Koordinaten um $u=\tilde{u}+\tilde{v}$ , $v=\tilde{u}-\tilde{v}$ bekommen $H=\tilde{u}^2-\tilde{v}ˆ2$ um dies klarer zu sehen. Deshalb funktioniert die Legendre-Transformation hier reibungslos, die hessische Matrix {{0,1},{1,0}} ist niemals singulär. Die Funktion ist nicht global konvex in $x$ und $y$ , ist aber lokal konkav / konvex und die hessische Matrix weist nur vereinzelte Singularitäten auf. Wie in der Antwort von Qmechanic können Sie hier das Problem in "Sektoren" analysieren.

Sind die Hamilton- und die Lagrange-Funktion immer konvex?

N. Jungfrau

Valter Moretti

Jinawee

Alexander Nelson

Jinawee

Alexander Nelson

QMechaniker

N. Jungfrau

wunderbar

Antworten (3)

QMechaniker

N. Jungfrau

Selene Rouley

Jungs

Selene Rouley

Die Lagrange-Gleichung ist unter JEDER Koordinatentransformation forminvariant. Hamiltons Gleichungen unterliegen nicht JEDER Phasenraumtransformation. Warum?

Kann ich auf die übliche Weise eine Potentialfunktion finden, wenn das zentrale Feld ttt in seiner Größe enthält?

Definieren zeitinvariante Hamiltonoperatoren geschlossene Systeme?

Unabhängigkeit von verallgemeinerten Koordinaten und Impulsen in der Hamiltonschen Mechanik [Duplikat]

Wozu ist das Maupertuis-Prinzip gut?

Wie allgemein ist der Satz von Noether in der klassischen Mechanik?

Warum können wir keinen Hamiltonoperator durch Einsetzen erhalten?

Irgendwelche guten Ressourcen für Lagrange- und Hamilton-Dynamik?

Buch über klassische Mechanik

Hamiltonsche Systeme ohne entsprechendes Lagrange-System