Maxwell-Boltzmann-Verteilung (Geschwindigkeit) als maximale Entropieverteilung und ihre Interpretation

Ich kenne die typische "Physik" -Methode, um die Maxwell-Boltzmann-Verteilung für die Geschwindigkeit abzuleiten v :

P ( v ) = ( M 2 π k B T ) 3 4 π v 2 exp ( M v 2 2 k B T )

aus Isotropie von v , integrieren Sie über Anweisungen, um eine Funktion von zu erhalten v nur Partitionsfunktion und so weiter.

Ich weiß auch, dass die Maxwell-Boltzmann-Verteilung als Ergebnis der Maximierung der (differentiellen Shannon-) Entropie entstehen kann H = P ln P D v unter bestimmten Einschränkungen. Insbesondere gelten die Auflagen E ( v 2 ) Und E ( ln ( v ) ) . ( https://en.wikipedia.org/wiki/Maximum_entropy_probability_distribution#Other_examples )

Ich verstehe, warum dies mathematisch "funktioniert".

Meine Frage ist jedoch: Gibt es eine "physikalische" Interpretation der zweiten Einschränkung, dh des erwarteten Werts von ln ( v ) ? Die erste Einschränkung ist lediglich die der erwarteten kinetischen Energie, die eine Konstante ist (ihre physikalische Bedeutung hängt mit der Temperatur zusammen), aber ich habe keine Ahnung, was das ist ln ( v ) impliziert.

Ich denke, es ist eine sehr seltsame Art, die Einschränkung zu schreiben, dass sich Wahrscheinlichkeiten zu 1 summieren müssen. Ich sehe jedoch keine offensichtliche Möglichkeit, dies zu zeigen, ohne mit der Boltzmann-Verteilung zu beginnen. In jedem Fall sind die angegebenen normalen Einschränkungen, dass sich die Wahrscheinlichkeiten zu 1 summieren und die mittlere Energie fest ist.
@BySymmetry Nein, es ist nicht die Normalisierungsbeschränkung. Die Normalisierungsbeschränkung wird lediglich geschrieben als 0 P ( v ) D v = 1 , und dies mit einem Lagrange-Multiplikator passt lediglich den konstanten Skalierungsfaktor im Voraus an. Der ln v Einschränkung fügt die hinzu v 2 Abhängigkeit außerhalb des Exponentials, wenn Sie einen Lagrange-Multiplikator zum Maximieren verwenden H .
Wenn Sie nur die Normalisierung und die mittleren Einschränkungen für nicht negative Realwerte verwenden v , erhält man eine Exponentialverteilung P ( v ) = λ exp ( λ X ) (Mittelwert = 1 / λ ) als MaxEnt-Verteilung.
In diesem Fall klingt es so, als würde es die Geschwindigkeitsabhängigkeit der kinetischen Energie bestimmen.
@BySymmetry Ich glaube auch nicht, dass das der Fall ist. Wie in der ursprünglichen Frage geschrieben, die Einschränkung E ( v 2 ) ist die mittlere Energiebeschränkung. Es ist eine Beschränkung nicht auf die mittlere Geschwindigkeit, sondern auf den Mittelwert der Geschwindigkeit im Quadrat (dh die kinetische Energie bis zu einer Konstante).
Was ich meine ist, dass ich denke, dass die erste Einschränkung die mittlere Energie festlegt, während die zweite Ihnen sagt, dass die kinetische Energie ist 1 2 M v 2 . Die erste Einschränkung sagt Ihnen dies nicht; es ist nur eine Einschränkung | v | und gibt Ihnen die Exponentialverteilung wieder.
Eine andere Möglichkeit, dasselbe auszudrücken, ist, dass die zweite Einschränkung die Zustandsdichte bestimmt
Ich denke, es fixiert nur die Skala der Entropie.

Antworten (1)

Kurze Antwort.

Das Einbeziehen der Beschränkung auf die Erwartung des Logarithmus der Geschwindigkeit ist gleichbedeutend mit der Annahme einer einheitlichen Quantisierung des klassischen Phasenraums, von der wir aus Erfahrung wissen, dass sie die richtige Vorschrift für die Anwendung von MaxEnt auf die klassische statistische Mechanik ist.

Einzelheiten.

Jaynes hat gezeigt, dass die differentielle Entropie nur dann eine geeignete Kontinuumsverallgemeinerung der diskreten Shannon-Entropie ist, wenn die gewählte Diskretisierung einheitlich ist. Für eine nette Diskussion darüber würde ich empfehlen, zuerst Abschnitt 4b zu lesen. von Jaynes' Vorlesungen über Informationstheorie und statistische Mechanik , da dies die ursprüngliche Quelle dieser Beobachtung zu sein scheint. Ich habe auch einen netten Wikipedia-Artikel gefunden, der diesen Punkt diskutiert:

Begrenzung der Dichte diskreter Punkte

Jaynes zeigte, dass, wenn man die Informationsentropie von einer Wahrscheinlichkeitsmassenfunktion auf einem endlichen Zustandsraum zu einer kontinuierlichen Wahrscheinlichkeitsverteilung auf einer Teilmenge von verallgemeinern möchte R N , wie wenn wir uns mit dem klassischen Phasenraum befassen, dann, obwohl die von Ihnen niedergeschriebene differentielle Entropie wie die offensichtliche Verallgemeinerung erscheint, die man durch Diskretisieren des Raums und Anwenden der diskreten Version der Entropie erhalten würde, nimmt sie tatsächlich implizit eine einheitliche Diskretisierung an, wie die Aufspaltung den Raum in Würfel gleichen Volumens. Der allgemeinere Ausdruck, der eine Diskretisierung ermöglicht, in der die Dichte der Zustände M ( X ) Auf dem Platz muss das nicht unbedingt einheitlich sein

H [ ρ ] = ρ ( X ) ln ρ ( X ) M ( X ) D N X .
Jaynes räumt ein, dass es im Kontext der klassischen Mechanik nicht klar ist, was die Auswahl eines bestimmten Elements rechtfertigt M übereinander, aber er argumentiert, dass wir, motiviert durch die Quantenmechanik, den üblichen "Quantisierungs"-Trick anwenden, den Phasenraum in Zellen gleichen Volumens aufzuteilen D 3 P D 3 Q / H 3 , dann sollten wir entsprechend wählen M ( X ) = C Ö N S T . . Wenn wir dies tun und eine unwichtige Gesamtkonstante weglassen, die sich ergibt, können wir den naiven Ausdruck der differentiellen Entropie verwenden
H [ ρ ] = ρ ( P , Q ) ln ρ ( P , Q ) D 3 P D 3 Q
Beachten Sie andererseits, dass, wenn Sie die Statistik eines klassischen Systems mithilfe einer Wahrscheinlichkeitsverteilung im Raum der Impulsgröße beschreiben möchten P = | P | (oder äquivalent Geschwindigkeit), dann verwandelt sich die gleichmäßige Zustandsdichte im Impulsraum in eine zunehmende Zustandsdichte im Raum P -Raum, der von der Dimension des Raums abhängt Um dies zu sehen, beachten Sie, dass eine gleichmäßige Zustandsdichte im Phasenraum der Tatsache entspricht, dass die Anzahl der Zustände in einem bestimmten Bereich proportional zu seinem Volumen ist. In D -Dimensionen, die Anzahl der Zustände mit Impulsen dazwischen P Und P + D P ist also proportional zu P D 1 D P . Daraus folgt, dass wir nehmen sollten
M ( P ) = ( konst. ) P D 1
Vernachlässigung unwichtiger additiver Gesamtkonstanten, die sich aus der Normierung von ergeben M und dann inkl M P D 1 bei der Berechnung von H entspricht dem Hinzufügen eines Lagrange-Multiplikatorterms, in dem der Lagrange-Multiplikator einen Wert hat D 1 . Um dies zu sehen, beachten Sie einerseits, dass einschließlich M und die allgemeinere Version von verwenden H veranlasst uns, kritische Punkte der folgenden Funktion zu finden:
J [ ρ ] = ρ ( P ) ln ρ ( P ) D P + λ 0 ( ρ ( P ) D P 1 ) + λ 1 ( ρ ( P ) P 2 D P C ) + ( D 1 ) ρ ( P ) ln ( P ) D P
Andererseits führt die Verwendung der differentiellen Entropie und das Hinzufügen eines Lagrange-Multiplikatorterms dazu, dass wir kritische Punkte des Funktionals finden
G [ ρ ] = ρ ( P ) ln ρ ( P ) D P + λ 0 ( ρ ( P ) D P 1 ) + λ 1 ( ρ ( P ) P 2 D P C ) + λ 2 ( ρ ( P ) ln ( P ) D P K )
Wenn wir kritische Punkte von finden G , wir glauben, dass
ρ ( P ) = C e λ 1 P 2 e λ 2 ln P = C P λ 2 e λ 1 P 2
Wenn wir richtig wählen K so dass λ 2 = D 1 , dann erhalten wir
ρ ( P ) = C P D 1 e λ 1 P 2
Für D = 3 wir erhalten a P 2 Faktor ein ρ , das ist genau das, was wir für die haben 3 -dimensionale Maxwell-Geschwindigkeitsverteilung.

Vielen Dank für diese ausführliche Erklärung. Könnten Sie bitte erläutern, wie diese Überlegungen als Einschränkung ausgedrückt werden können < Protokoll v > , und insbesondere woher der auf der Wikipedia-Seite aufgeführte Einschränkungswert stammt?
@ user8153 Ich würde empfehlen, Folgendes zu lesen, in dem Ihre Fragen in einem allgemeinen Rahmen erörtert werden: en.wikipedia.org/wiki/… Ich habe die algebraischen Details der Beziehungen zwischen den Lagrange-Multiplikatoren und den Ausdrücken, die die Erwartung einschränken, nicht selbst ausgearbeitet Werte in diesem speziellen Fall, aber wenn ich Zeit/Energie habe, diesbezüglich einen Nachtrag zu posten, werde ich das tun.
Danke schön! Ich dachte ungefähr, woher es kommt, aber das hilft sicherlich. @ user8153 Die Antwort auf die zweite Frage ergibt sich aus der Tatsache, dass im dreidimensionalen Raum die "Entartung" von v ist über eine Kugelschale, deren Volumen geht als v N 1 ( 2 π ) N / 2 / Γ ( N / 2 ) D v . Der Term der Gamma-Funktion im Nenner führt zu dem „nicht so offensichtlichen“ Erscheinungsbild der Euler-Gamma-Konstante.
Ist dies genauso wie die Ausführung von maxent mit a v 2 Einschränkung in 3 Dimensionen (Geben e λ v 2 , dann auf Radialkoordinaten umschalten und über die Winkel integrieren? Letzteres sollte ebenfalls einen Faktor ergeben v 2 aus Variablenänderung