Der Lagrangian in der Skalarfeldtheorie

Dies ist vielleicht eine naive Frage, aber warum schreiben wir die Lagrange-Funktion auf?

L = 1 2 η μ v μ ϕ v ϕ 1 2 m 2 ϕ 2

als einfachste Lagrangedichte für ein reelles Skalarfeld? Das ist für mich nicht selbstverständlich! Schließlich führt dies zu einem kinetischen Energieterm (fein), einer bestimmten unmotivierten potentiellen Energie (weniger fein) und einer Gradientenenergie (noch weniger offensichtlich).

Gibt es ein Prinzip, nach dem wir diese Lagrange-Funktion studieren können? Ist es nur das L ergibt sich eine schöne Gleichung (die Klein-Gordon-Gleichung), die wir ansprechend interpretieren können? Dieser Grund wirkt irgendwie hohl!

Ich habe gehört, dass Leute Kausalität als Motivation erwähnt haben, aber ich kann nicht sehen, wie das zusammenhängt. Könnte mir jemand etwas Intuition geben?

Vielen Dank im Voraus!

Antworten (5)

Ich habe eine etwas andere Perspektive als die beiden anderen Antworten, die eine elementarere Motivation liefert. Angenommen, Sie wissen nichts über Renormierbarkeit oder Energie-Impuls-Beziehungen und alles, was Sie wissen, ist, dass eine Lagrange-Dichte eine Funktion von Feldern und ihren Ableitungen ist, die sich unter Poincaré-Transformationen als Skalar transformiert.

Sie können die Klein-Gordon-Gleichung motivieren, indem Sie fragen, was der einfachste Lagrange-Operator ist, den Sie für ein Skalarfeld aufschreiben können, das sich in einen Skalar umwandelt und einen positiv-definiten Hamilton-Operator liefert.

Da wir es mit skalaren Feldern zu tun haben, ist jede Polynomfunktion der Felder ϕ wird die korrekte Lorentz-Transformationseigenschaft erfüllen. Sie könnten also einen Begriff aufschreiben wie a ϕ + b ϕ 2 mit reellen Konstanten a und b . Nun wollen wir auch Derivate einbeziehen μ ϕ . Um die korrekten Lorentz-Transformationseigenschaften zu erfüllen, müssen wir dies mit einem Term kontrahieren μ ϕ .

Die einfachste Lagrange-Funktion, die wir aufschreiben können, ist also L = c μ ϕ μ ϕ + a ϕ + b ϕ 2 woraus wir einen Hamiltonoperator erhalten

H = π 2 4 c + c ich ϕ ich ϕ a ϕ b ϕ 2

Das a ϕ Der Begriff ist nicht schön, da er die positive Bestimmtheit des so festgelegten Hamilton-Operators ruiniert a = 0 . Ein skalares Feld und die Ableitungen haben beide die Dimension von [ m a s s ] 2 und die Lagrange-Dichte hat eine Dimension [ m a s s ] 4 , Also c sollte dimensionslos sein und b sollte sein b = m 2 wo m hat Masseneinheiten und das Minuszeichen dient dazu, den Hamiltonoperator positiv-definit zu machen.

Also haben wir unseren Hamiltonian auf reduziert

H = π 2 4 c + c ich ϕ ich ϕ + m 2 ϕ 2

Einstellung c = 1 / 2 und Neuskalierung m 2 m 2 / 2 bedeutet, dass die Koeffizienten aller Terme gleich sind.

Daher ist die Lagrange-Dichte L = 1 2 μ ϕ μ ϕ 1 2 m 2 ϕ 2

*Dinge, die Sie ausprobieren und dagegen argumentieren könnten, dass dies der einfachste Skalarfeld-Lagrangian ist;

  1. Wenn es um Einfachheit geht, warum ignorieren Sie nicht einfach die abgeleiteten Terme und schreiben eine Lagrange-Funktion für ein Skalarfeld als L = m 2 ϕ 2 ? Denn wenn Sie die Ableitungsterme ignorieren, ist die Feldgleichung ϕ = 0 , und wen interessiert das? Das Ignorieren der Ableitungen führt zu einem nicht dynamischen Feld. Der Klein-Gordon-Lagrange-Operator ist also der einfachste, den man aufschreiben kann, wo tatsächlich etwas passiert.

Natürlich erhält man per Einstellung einen einfacheren gültigen Lagrange-Operator m = 0 , aber dies wird nicht getan, da Bücher die Energie-Impuls-Beziehung in einer allgemeinen Umgebung zeigen möchten, wenn Sie das Feld quantisieren. Sie können jedoch mit dem masselosen Fall in 5 Dimensionen beginnen und eine Dimensionsreduktion durchführen, um den massiven Fall in 4 Dimensionen zu erhalten.

  1. Warum die Möglichkeit feldabgeleiteter Wechselwirkungsterme ignorieren? Sie können dies tun, aber das Ziel ist Einfachheit, und der einfachste Term besteht darin, das Feld mit seinen Ableitungen zu koppeln, korrekt zu transformieren und einen positiv bestimmten Hamilton-Operator zu ergeben ϕ ϕ μ ϕ μ ϕ , was viel komplizierter ist als unsere anderen Begriffe.
Bezüglich der a ϕ Term: Solange der Hamilton-Operator nach unten begrenzt ist (was er so lange ist b < 0 ), können Sie einfach eine Konstante hinzufügen H (oder L ), um den Hamilton-Operator positiv definit zu machen, egal was a ist. Das kann man also nicht bestreiten a ist Null von positiver Bestimmtheit. Ein besseres Argument ist, dass die Polynomterme in diesem Fall umgeschrieben werden können als b ( ϕ d ) 2 , wo d ist eine Konstante, und wir können dann die Lagrange-Funktion in Bezug auf umschreiben ϕ ~ = ϕ d um das Standardformular zu erhalten.
Kannst du erklären warum 1 / 2 η μ v μ ϕ v ϕ Maße hat M 4 und nicht M 2 . Seit ϕ Einheiten hat M , was Einheiten tut ϕ hat - ist es nicht dasselbe wie ϕ ?
Partielle Ableitungen x μ haben Abmessungen der umgekehrten Länge = [M]

Eine vernünftige Motivation für diese Lagrange-Funktion kann in einer klassischen Analogie gefunden werden. Die kinetische Energie in der klassischen Physik ist proportional zum Quadrat der Änderungsrate der Position mit der Zeit, also:

T = 1 2 ( 0 ϕ ) 2
Aber um eine Lorentz-invariante Lagrange-Funktion zu erhalten, müssen wir hinzufügen:
1 2 ich ( ich ϕ ) 2
Hinzufügen und Verwenden der Minkowsi-Metrik:
1 2 η μ v μ ϕ v ϕ

Nehmen wir nun an, dass der Gleichgewichtswert des Feldes ist ϕ = 0 . Für einen einfachen harmonischen Oszillator mit Gleichgewichtslage x = 0 die potentielle Energie geht wie x 2 . Wenn wir wollen, dass das Feld seinen Gleichgewichtszustand bevorzugt, dann muss dies im Potential codiert werden, und der einfachste, der dies tut, ist harmonisch:

v = 1 2 m 2 ϕ 2

Wenn wir beide Begriffe kombinieren, haben wir:

L = 1 2 η μ v μ ϕ v ϕ 1 2 m 2 ϕ 2

Quelle: B. Zwiebach, „Ein erster Kurs in der Stringtheorie“, Kapitel 10.2

Ich habe das Gefühl, dass dieser ansonsten guten Antwort eine Erklärung fehlt, warum wir die Verhältnismäßigkeit nennen würden m im harmonischen Potential "Masse", während es in der Analogie Steifheit wäre und die Masse den kinetischen Term skalieren sollte?

Die Standardmotivation, wie QuantumDot erklärte, besteht darin, die Energie-Impuls-Beziehung der Relativitätstheorie aus dem Skalarfeld zu reproduzieren. Aber dafür gibt es ein unabhängiges Argument, das aus der statistischen Mechanik stammt.

Betrachten Sie eine statistisch-mechanische Partitionsfunktion für ein Feld, das auf einem sehr feinen Gitter definiert ist. Im Allgemeinen wird das Gleichgewicht nur lokale Fluktuationen zulassen, so dass das Feld an jedem Gitterpunkt eine Wahrscheinlichkeitsverteilung haben wird, die lokal unabhängig von den Fluktuationen an jedem anderen entfernten Gitterpunkt ist. In diesem Fall können Sie das Gitter auf groben Entfernungsskalen betrachten und ein mittleres Feld definieren ϕ über viele Gitterabstände und schreiben Sie die Zustandssumme als Produkt unabhängiger Zustandssummen an jedem Punkt des groben Gitters:

Z = e v ( ϕ ) d ϕ

Und da das grobe Gitterfeld der Mittelwert des feinen Gitterfelds ist, wissen Sie aus dem zentralen Grenzwertsatz, dass die Verteilung Gauß sein wird:

Z = e 1 2 m 2 ϕ 2 D ϕ

Die letzte Zeile ist ein Pfadintegral, eine Partitionsfunktions-ähnliche Summe über alle Konfigurationen, und die Identität, die garantiert, dass sie unabhängige lokale Fluktuationen reproduziert, ist genau das Gleiche, was Ihnen sagt, dass zwei unabhängige Systeme eine Partitionsfunktion haben, die sich multipliziert (oder eine freie Energie, die sich summiert).

So etwas ist sehr langweilig, und es ist die typische Situation in statistischen oder Quantenfeldern – völlig lokal unabhängige Fluktuationen, was oft als ultralokales Feld bezeichnet wird. Dies ist nichts, was wir als dynamische Sache beobachten würden, da wir auf Skalen leben, die viel größer sind als jede Körnigkeitsskala.

Überlegen Sie also, was passieren würde, wenn wir die Schwankungen auf groß einstellen würden. Dies erfordert eine Feinabstimmung des effektiven Gaußschen Schwankungsparameters m 2 auf 0. Dies ist nicht besonders schwer vorstellbar, weil Sie den zentralen Grenzwertsatz verwenden, um die zu erhalten m 2 Verhalten --- Sie können sich vorstellen, dass das mikroskopische Potenzial wirklich von der Form ist m 2 ϕ 2 + λ ϕ 4 , und dann, wenn Sie die Feinabstimmung vornehmen m 2 Um ein besonderer Wert zu sein, ändern Sie die Stabilität des ϕ = 0 Punkt. Dies ist ein kritischer Punkt in der statistischen Mechanik.

Wenn Sie sich nun lange Entfernungen ansehen, erwarten Sie, dass die freie Energie von Feldkonfigurationen auf einem grobkörnigen Gitter wie folgt aussehen sollte:

F ( ϕ , ϕ )

Wobei du nur die wichtigsten abgeleiteten Begriffe ausbaust. Wenn Sie es als Serie schreiben, vorausgesetzt ϕ ϕ Symmetrie:

| ϕ | 2 + t ϕ 2 + λ ϕ 4 + g ϕ 6 + h | 2 ϕ | 2

Dann können Sie sich davon überzeugen, dass bei einer Neuskalierung, bei der der Koeffizient des ersten Terms fest bleibt, nur die ersten 3 Terme in Dimension 4 oder weniger von Bedeutung sind. Das heißt, wenn Sie die Feldfluktuationen so normalisieren, dass der Korrelationskoeffizient der führenden Ableitung die Skala des Felds bestimmt, sind nur der quadratische und der quartische Term renormierbar, nur diese tragen zu Fernkorrelationen bei.

Das Feynman-Pfadintegral rechtfertigt, warum diese Art von Argumentation irgendetwas mit Quantenmechanik zu tun hat. Jede bosonische Feldtheorie mit einer invarianten Zeitumkehraktion setzt sich analytisch zu einem statistischen Feld fort, und dieses statistische Feld ist eine langwellige Grenze von etwas Nahem. Die Klassifizierung der möglichen Theorien erfolgt dann durch die Verallgemeinerung des zentralen Grenzwertsatzes, der besagt, dass das ultralokale Feld der häufigste Fall ist.

Bei chiralen Fermionen und Eichfeldern ist nicht einmal eine Feinabstimmung eines Parameters erforderlich, um eine schwankende Grenze zu haben. Die Eichfelder halten eine schwankende Grenze durch Eichinvarianz und die chiralen Fermionen durch die Tatsache, dass sie ohne Paarung keine Masse bilden können. Das sind die Zutaten des Standardmodells.

Die Rechtfertigung für die Lagrangianer in der Feldtheorie ergibt sich letztendlich aus der Renormierbarkeit, was jedoch schwierig ist, da eine strenge Theorie fehlt. Man kann sie auch rechtfertigen, indem man nach einer Theorie fragt, in der man eine endliche Anzahl von Fundamentalteilchen mit gegebenem Spin und gegebener Masse hat, die für Spin 0 die nicht wechselwirkenden ( λ = 0 ) Version dieses Arguments. Dies ist ein etwas komplementäres Argument, da die Unitarität der Form des Quanten-Lagranges stärkere Einschränkungen auferlegt als nur die Renormierbarkeit, daher ist es gut, beide Argumentationsketten zu kennen.

Dies ist das kanonische Beispiel einer relativistischen Feldtheorie, die verwendet wird, um Studenten in das Thema einzuführen. Eines der Merkmale, die Sie aus diesem Modell mitnehmen sollten, ist Folgendes: Schreiben Sie die Euler-Lagrange-Bewegungsgleichung auf

L ϕ μ L ( μ ϕ ) = 0
geben
m 2 ϕ μ μ ϕ = 0
was geschrieben werden kann:
( 2 t 2 2 + m 2 ) ϕ = 0
Wenn Sie sich nun in den Fourier-Raum bewegen, ϕ ( d k ) ϕ k e ich ω t ich k . x + c . c . , du wirst finden
( d k ) ( ω 2 + k 2 + m 2 ) ϕ k e ich ω t ich k . x + c . c . = 0 ,
oder äquivalent, jeder Modus erfüllt die folgende Beziehung zwischen der Frequenz und der Wellenzahl:
ω 2 = k 2 + m 2 .
Bei der Identifizierung der Frequenz mit Energie ω E und Wellenzahl mit Impuls k p , stellen Sie fest, dass jeder Modus die relativistische kinematische Energie-Impuls-Beziehung erfüllt:
E 2 = p 2 + m 2 .
Dies ist der Ausgangspunkt für den Aufbau einer relativistischen Theorie der Quantenfelder.

In Leonard Susskinds Special Relativity and Classical Field Theory bietet er einen viel intuitiveren, aber informelleren Weg.

Stellen Sie sich vor, wir nehmen ein Scaler-Feld, das zeitabhängig ist. Dieses Feld bezeichne die Position eines imaginären Teilchens. Nennen wir es ϕ ( t ) . Nun beschreibt dieses Feld die Position eines imaginären Massenteilchens 1 .

Die klassische Mechanik sagt uns, dass die Lagrange-Funktion in diesem Fall die kinetische Energie minus einer Art Potential wäre.

L = ϕ ˙ 2 v ( ϕ )

seit wir genommen haben m = 1 . Wenn wir nun das Skalarfeld nehmen und es sowohl vom Raum als auch von der Zeit abhängig machen, ist die natürliche Wahl:

L = 1 2 ϕ ˙ 1 2 . ϕ v ( ϕ )

wobei die Raumableitungen gemäß der metrischen Konvention das Minuszeichen haben. Wir können dies umschreiben als:

L = 1 2 μ ϕ μ ϕ v ( ϕ )

Normalerweise schreiben wir

v ( ϕ ) = 1 2 μ 2 ϕ

Leider geht das Buch nicht darauf ein, warum das Potenzial so gewählt wird m 2 ϕ 2 . Es gibt an, dass jedes Potenzial in Ordnung wäre und dass die Wahl nur eine Bequemlichkeit ist. Trotzdem eine gute Erklärung.