Warum ist die Entropie von Gas nicht unendlich, wenn unendlich viele Mikrozustände verfügbar sind?

Wie kann es sein, dass die Entropie von Gas nicht unendlich ist? Wenn wir die Formel verwenden S = k ln ( Ω ) wir erhalten unendlich, weil es unendlich viele mögliche Situationen gibt (weil es unendlich viele Möglichkeiten für Ort und Impuls für jedes Molekül gibt).

Wenn eine Menge Gas vorhanden ist 10 25 Moleküle, wie schließen Sie, dass w unendlich ist?
Damit die Entropie wohldefiniert ist, muss der Raum auf irgendeine Weise quantisiert werden.
@DanielC w in dieser Formel ist "die Anzahl der möglichen Zustände des Systems". Aus Sicht der klassischen Mechanik kann sogar ein einzelnes Molekül in einer Kiste unendlich viele Zustände annehmen.
@probably_someone Entropie kann in der klassischen Mechanik gut definiert werden, ohne dass etwas quantisiert wird; Alles, was Sie brauchen, ist ein Maß für den Phasenraum des Systems (das Sie aus der symplektischen Form praktisch kostenlos erhalten). Sie müssen durch eine geeignete Potenz von dividieren 2 π um das Argument des Logarithmus dimensionslos zu halten, aber wenn Sie ersetzen 2 π mit jeder anderen positiven Zahl mit Wirkungseinheiten würde man eine Entropie bekommen, die sich nur um eine Gesamtkonstante unterscheidet und alles funktioniert genauso gut (auf dem Niveau der klassischen Mechanik).

Antworten (3)

Das Problem, an das Sie denken, ist als Frage der thermodynamischen Grobkörnung bekannt . Dies gibt Ihnen hoffentlich einen Ausdruck, nach dem Sie suchen können, um mehr zu erfahren.

Manchmal sind mögliche Zustände von Ensemblemitgliedern offensichtlich diskret, wie sie es in einer Ansammlung harmonischer Quantenoszillatoren sind. Ein Großteil der Quantenmechanik hängt davon ab, dass der zugrunde liegende Hilbert-Zustandsraum trennbar ist ( dh eine zählbare dichte Teilmenge hat), und für Hilbert-Räume entspricht dies der Behauptung, dass die Vektorbasis selbst zählbar ist. Selbst wenn also eine Observable wie Impuls oder Position ein kontinuierliches Spektrum hat ( dh eine kontinuierliche Zufallsvariable als Maß angeben kann), ist der zugrunde liegende Zustandsraum oft diskret. Im speziellen Beispiel des OPs können Sie das Gas als Partikelsystem in einer 3D-Box modellieren(Hutspitze an Benutzer knzhou für die Erinnerung an diesen Punkt), so dass der Zustandsraum der Ensemblemitglieder eindeutig diskret ist. Wenn wir das Volumen unserer Box erhöhen, steigt die Zustandsdichte (mehr in Chris 'Antwort besprochen ) proportional zum räumlichen Volumen der Box und damit auch die Entropie. Im Grenzfall eines sehr großen Gasvolumens ist die Entropie pro Volumeneinheit eine wohldefinierte, endliche Grenze.

In Fällen, in denen der Zustandsraum nicht offensichtlich diskret ist, muss entweder auf die Verwendung von grober Körnung oder relativer Entropie zurückgegriffen werden.

Grobe Körnung ist die etwas willkürliche Partitionierung des Zustandsraums der Ensemblemitglieder in diskrete Teilmengen, wobei Zustände, die zu einer bestimmten Partition gehören, dann als gleich angesehen werden. Somit wird ein kontinuierlicher Zustandsraum zu einer diskreten Näherung zusammengefasst. Viele Schlussfolgerungen der statistischen Mechanik sind gegenüber einer solchen Verklumpung unempfindlich.

Die relative Entropie im informationstheoretischen Sinne ist für eine kontinuierliche Zufallsvariable ungefähr als die Entropieänderung relativ zu einer "standardmäßigen" kontinuierlichen Zufallsvariablen definiert, z. B. einer solchen, die von einer Gaußschen Verteilung bestimmt wird. Wir sehen das Problem, mit dem Sie es zu tun haben, wenn wir naiv versuchen, die Shannon-Entropie einer kontinuierlichen Zufallsvariablen mit Wahrscheinlichkeitsverteilung zu berechnen p ( x ) als Grenzwert einer diskreten Summe:

(1) S ich p ( x ich ) Δ x Protokoll ( p ( x ich ) Δ x ) = Protokoll ( Δ x ) ich p ( x ich ) Δ x ich p ( x ich ) Δ x Protokoll ( p ( x ich ) )

Die beiden Summen im ganz rechten Ausdruck konvergieren OK, aber wir werden durch den Faktor vereitelt Protokoll ( Δ x ) , was natürlich divergiert. Wenn wir jedoch die Differenz zwischen der Entropie für unsere nehmen p ( x ) und der einer "Standard"-Verteilung ergibt unsere Berechnung:

(2) Δ S Protokoll ( Δ x ) ( ich p ( x ich ) Δ x ich q ( x ich ) Δ x ) ich ( p ( x ich ) Protokoll ( p ( x ich ) ) q ( x ich ) Protokoll ( q ( x ich ) ) ) Δ x

eine Menge, die gegen konvergiert ( p Protokoll p q Protokoll q ) d x . Die übliche relative Entropie ist nicht ganz dieselbe wie diese Definition (siehe Artikel - die Definition wird modifiziert, um das Maß unabhängig von der Neuparametrisierung zu machen), aber dies ist die Grundidee. Oft werden die Konstanten im Grenzwert von (2) weggelassen und man sieht die Menge p Protokoll p d x definiert als die uneingeschränkte (relative) Entropie der Verteilung p ( x ) .

Grobe Körnung, in dieser Berechnung wäre einfach eine Konstante zu wählen Δ x in 1). (1) ist dann näherungsweise die relative Entropie p Protokoll p d x um die Konstante versetzt Protokoll ( Δ x ) . Daher solange:

  1. Wir bleiben bei einer Konstante Δ x in einer bestimmten Diskussion;
  2. Δ x relativ zu den Schwankungen in der Wahrscheinlichkeitsdichte klein genug ist, so dass ich p ( x ich ) Δ x Protokoll ( p ( x ich ) ) p Protokoll p d p ;
  3. Unsere Berechnungen und physikalischen Vorhersagen haben nur mit Unterschieden zwischen Entropien zu tun (wie es meistens der Fall ist)

dann geben die Ansätze der groben Körnung und der relativen Entropie unabhängig von der exakten identische physikalische Vorhersagen Δ x gewählt.

Eine gute Übersicht dieser Ideen mit historischer Diskussion findet sich in:

Katinka Ridderbos, „Der grobkörnige Ansatz zur statistischen Mechanik: Wie glückselig ist unsere Unwissenheit?“, Studies in History and Philosophy of Modern Physics , 33 , S. 65-77, 2002

Ich stimme allem zu, was Sie geschrieben haben, aber sind die Zustände für ein ideales Gas nicht bereits diskret? Es ist nur ein Haufen Teilchen in einer Kiste , also funktioniert die übliche Methode zum Zählen diskreter Mikrozustände.
+1, ich halte das für den richtigen Ansatz. Aber ich bin verwirrt durch die Verwendung eines Unterschieds zwischen zwei Entropien anstelle des Üblichen p Protokoll p q . Es scheint, als ob diese Version nicht unveränderlich gegenüber einer Neuparametrisierung ist (z. B. das Ersetzen von j = x 2 ), während die übliche relative Entropie (auch bekannt als Kullback-Leibler-Divergenz) ist.
@knzhou In der Tat sind sie in diesem speziellen Beispiel. Siehe meine Bearbeitungen.
@Nathaniel Ich habe gesagt, dass die "übliche relative Entropie nicht ganz mit dieser Definition übereinstimmt (siehe Artikel), aber dies ist die Grundidee"; Ich habe diesen Satz auch geändert, um das Problem der Neuparametrisierung anzugeben; Ich wollte die Wahl betonen Δ x als "Hauptproblem". Tatsächlich werden Sie in älteren informationstheoretischen Texten (darunter, glaube ich, Shannon und Weaver) die relative Entropie eines PDFs sehen, die einfach als definiert ist p Protokoll p d p . Ich weiß nicht, ob dies die Verwendung eines Signalverarbeitungs- / Kommunikationstheoretikers im Gegensatz zu der eines Statistikers / statistischen Mechanikers ist.
@WetSavannaAnimalakaRodVance Ich denke, es ist eher eine Frage der historischen Entwicklung des Feldes. Shannon definierte kontinuierliche Entropie als gerecht p ( x ) Protokoll p ( x ) d x aber es hatte immer das Umparametrierungsproblem. Dies wird durch die Kullback-Leibler-Divergenz gelöst, die jedoch einige Jahre später und auf einem anderen Gebiet (Statistik statt Kommunikationstheorie) entwickelt wurde, sodass es ziemlich lange dauerte, bis sie sich in der Literatur durchsetzte. Heutzutage wird die KL-Divergenz eher als die grundlegendste Größe in der Informationstheorie angesehen, noch mehr als die Entropie.
(In einem der Artikel von Edwin Jaynes gibt es einen Kommentar, der besagt, dass er Shannons integrale Definition für einen einfachen Fehler hält – er weist darauf hin, dass Shannon unglaublich vorsichtig ist, wenn es darum geht, die diskrete Entropie als das einzigartige Maß der Unsicherheit unter bestimmten Desiderata abzuleiten, aber dann heißt es einfach p ( x ) Protokoll p ( x ) d x als offensichtliches kontinuierliches Analogon. Wenn man bei der Ableitung der Kontinuumsgrenze sorgfältiger vorgeht, muss man sich stattdessen etwas Analoges zur KL-Divergenz einfallen lassen.)
Der Link zu Ridderbos' Zeitung ist tot, und eine Google-Suche hat nur Dinge hinter einer Paywall ergeben. Kann hier einer helfen?

In einem kontinuierlichen System w wird als Integral über die möglichen Mikrozustände des Systems angenommen. Dies wird typischerweise als Zustandsdichte bezeichnet und ist ziemlich endlich. Genauer gesagt ist es so etwas wie

w ( E ) = N d 3 N x   d 3 N p   δ ( E ϵ ( p , x ) )

wo ϵ ( p , x ) ist die Energie des Systems als Funktion aller Impulse und Positionen, δ ist eine Deltafunktion, die die Energie des Systems festlegt und N ist eine gewisse Normalisierung.

Dies hinterlässt einige Unklarheiten (nämlich bei der Normalisierung), aber das Verhältnis von w zwischen zwei Zuständen ist wohldefiniert, also Δ S = k ln ( w f w ich ) ist wohldefiniert, und die Mehrdeutigkeit wird aufgelöst, indem die Entropie beim absoluten Nullpunkt als Null definiert wird, was die zu verwendende Normalisierung ergibt.

Einige Dinge verstehe ich nicht: 1. Die Epsilon-Funktion sollte immer gleich E sein, weil es die Gesamtenergie des Systems ist 2. Das Ergebnis dieses Integrals ist nicht kompatibel mit dem bekannten Ausdruck der Gasentropie (der davon abhängt Temperatur). Vielleicht habe ich das nicht richtig verstanden. Können Sie das Ergebnis dieses Integrals schreiben?
1. Kennen Sie Deltafunktionen? Der Punkt dabei ist, mathematisch nur über das Volumen im Phasenraum zu integrieren, in dem sich die Energie befindet E . 2. Sie kann ausgewertet und dann mit der Temperatur in Beziehung gesetzt werden. Die Bewertung ist systemabhängig, sie unterscheidet sich zB je nach Freiheitsgraden im System und eventuellen potentiellen Energien. Es stimmt mit der Entropie für ein ideales Gas überein, obwohl es ziemlich viel Arbeit sein kann, das zu zeigen.
Dieser Ausdruck bedeutet also eigentlich, alle Punkte im Phasenraum zu summieren, die der Energie E entsprechen, aber genau das ist mein Problem: Es gibt unendlich viele solcher Punkte und daher ist das Ergebnis des Integrals unendlich
Ein Integral über dem Phasenraum ist jedoch endlich. Zum Beispiel in einer Box mit Volumen v , ergibt sich das Positionsintegral v N , nicht . Auch das Impulsintegral ist endlich.
OK du hast recht. Aber etwas hier macht keinen Sinn, weil wir unendlich viele Möglichkeiten aufsummieren und eine endliche Zahl bekommen. Kannst du mir dafür etwas Intuition geben? (Bei der Berechnung des Integrals einer Fläche summieren wir zum Beispiel eine unendliche Anzahl von Punkten, aber jeder hat ein kleines infinitesimales Gewicht, hier hat jede Option das gleiche Gewicht, dass sie 1 ist.)
Warum nehmen Sie an, dass das "Gewicht" 1 ist? Es ist nicht - es ist das gleiche infinitesimale Gewicht wie in einem normalen Integral.
@Jacob Auf einer noch grundlegenderen Ebene ist dies dieselbe Frage wie "warum tut das n = 1 1 n 2 = π 2 6 Anstatt von ?", und die Antwort ist, dass Sie die Dinge, die Sie summieren, zwingen können, ausreichend schnell klein zu werden, wenn Ihre Terme zunehmen, und als Ergebnis eine endliche Summe erhalten. Integrale stetiger Funktionen tun dies per Definition immer -- sehen Sie sich nur an die eigentliche Definition eines Integrals: en.wikipedia.org/wiki/Darboux_integral .
Alec Rhea. Genau das ist der Punkt, dass wir hier eine Menge Möglichkeiten zusammenfassen, es sind keine unendlich kleinen Dinge, jede Option bekommt die Nummer 1, es ist einfach die Summe von 1 + 1 + 1 .... (Eine Option + eine Option + eine Option ...) Hier erscheint mir also die Idee eines Integrals seltsam und unangemessen.
@Jacob Du verfehlst den Punkt. In einem kontinuierlichen Phasenraum Ω ist nicht einfach die Anzahl der zugänglichen Zustände, die Sie zu Recht als unendlich erkennen. Stattdessen, Ω ist proportional zum "Volumen" des zugänglichen Phasenraums.
Ein alternativer Ansatz, der in den anderen Antworten verfolgt wird, besteht darin, den Phasenraum zu diskretisieren, sodass die Anzahl der zugänglichen Zustände endlich wird. Solange die Diskretisierungsskala ausreichend klein ist, sind diese beiden Ansätze äquivalent, und physikalische Größen hängen ohnehin nie von der Diskretisierungsskala ab.
J. Murray Können Sie in einfachen Worten erklären, was es rechtfertigt, die Anzahl der Zustände nach Volumen im Phasenraum zu messen, anstatt was sie wirklich sind – die Anzahl der Zustände? Wir sind uns einig, dass wir, wenn wir die Anzahl der Zustände auf einfache Weise zählen, unendlich bekommen, was also diesen Trick des Phasenraums rechtfertigt.
@Jacob Es multipliziert effektiv die Anzahl der Zustände mit einer Konstante. Da das Multiplizieren zweier Zustände mit einer Konstanten das Verhältnis zwischen ihnen nicht ändert, ändert es auch nicht den Unterschied in der Entropie, da ln ( C x 1 ) ln ( C x 2 ) = ln ( C x 1 C x 2 ) = ln ( x 1 x 2 ) .
@ Chris Wir sprechen davon, die Anzahl der Zustände zu zählen, nicht davon, das Verhältnis zwischen zwei Zuständen zu finden. Denn die Entropie ist einfach: ln(Anzahl der Zustände)
@Jacob Für eine endliche Anzahl von Staaten ist das wahr. Die Methode, die ich gezeigt habe, ist eine der Möglichkeiten, wie Sie mit einer unendlichen Anzahl von Zuständen umgehen können. Solange man nur von Entropieunterschieden zwischen zwei Zuständen spricht, macht eine solche Gesamtnormierung der Zustandszahl keinen Unterschied .
@ Chris Aber das ist die Definition der Entropie. Ändern wir die Definition für den Fall unendlich vieler Zustände? Ich verstehe die Logik nicht.
@Jacob Beachten Sie, dass die Anzahl der Zustände, wenn sie mit Feldtheorie anstelle einer klassischen Theorie behandelt würde, nicht wirklich unendlich wäre. Dieser Prozess ähnelt der Renormalisierung in QFT oder den Inkonsistenzen, die Sie erhalten, wenn Sie versuchen, klassisches E & M auf ein Punktteilchen anzuwenden. Es ist ein Artefakt des Versuchs, eine Theorie auf eine kleinere Entfernungsskala anzuwenden, als sie gültig ist.
@ Chris Wenn ich verstehe, was Sie meinen, obwohl die Anzahl der Zustände unendlich ist, kann die Theorie nicht damit umgehen, ohne die "echte" Zahl zu "ignorieren", und wir sind gezwungen, nur die quantisierte Anzahl von Zuständen zu zählen. Ich habe recht?
@Jacob Grundsätzlich sagen wir, dass wir wissen, dass die klassische Theorie für beliebige Skalen nicht richtig ist. Da wir es brauchen würden, um die Entropie zu finden, geben wir das auf und sprechen nur über Änderungen der Entropie, was uns die unphysikalische Unendlichkeit ignorieren lässt, die man erhält, wenn man die statistische Mechanik naiv auf eine klassische Theorie anwendet.
@ Jacob Umgekehrt. Die wirkliche Anzahl zugänglicher Zustände ist endlich und durch die Quantenmechanik gegeben. Wir erhalten Unendlichkeit, indem wir eine klassische Theorie anwenden, wo wir wirklich eine Quantentheorie brauchen.
@ Chris Aber laut QM ist die Anzahl der Zustände des Gases in der Box unendlich.
Die Anzahl orthogonaler Zustände für ein gebundenes System ist mit Einschränkungen hinsichtlich der Energie endlich.
@Chris Dies ist die interessanteste Antwort, da keine willkürliche diskrete Annäherung erforderlich ist und erwähnt wird, wie die Normalisierungskonstanten von der absoluten Nullanforderung behandelt werden. Es ist jedoch sehr kurz und ich kann keine Links finden, die diesen Ansatz beschreiben. Können Sie einen Link, eine Literaturreferenz oder ein Buch angeben, das sich damit befasst?
@MikeWise Ich kenne keinen aus dem Kopf, sorry.
Nun, danke trotzdem. Und dieser Kommentar zur Renormierung unter Verwendung der absoluten Nullanforderung war äußerst hilfreich - und gilt anscheinend auch für die diskreten Näherungsableitungen - obwohl ihn anscheinend niemand erwähnte. Und ich denke, das ist der Hauptgrund, warum die Wahl unterschiedlicher Diskretisierungsintervalle zu demselben Wert für die Entropie führen würde. Ich denke, eines der Hauptprobleme hier ist die Verwendung dieses Ausdrucks "Anzahl der Mikrozustände". Es scheint eher "ein Maß für die Vielzahl der Mikrozustände" zu sein.

Ich rate Ihnen, einen Blick in jedes Lehrbuch der statistischen Mechanik zu werfen. Dieser Punkt wird normalerweise in den ersten Kapiteln behandelt. Sie möchten die mikrokanonische Entropie berechnen

S ( E ) = k B ln Ω ( E )
wo Ω ( E ) zählt die Anzahl der Mikrozustände mit Energie E . Wie Sie darauf hingewiesen haben, ist diese Zahl unendlich, wenn die Koordinaten kontinuierlich sind. Der Standardansatz besteht darin, den Phasenraum zu diskretisieren und in Zellen zu unterteilen. Es wird angenommen, dass jede Zelle einem einzelnen Mikrozustand entspricht. Zum N Teilchen in einem 3D-Raum ist die Dimension des Phasenraums 6 N . Die Breite einer Zelle wird so gewählt Δ q in dem 3 N den Koordinaten zugeordnete Richtungen und Δ p in dem 3 N Richtungen, die mit Impulsen verbunden sind. Das wird dann vermutet
Δ q Δ p = h 0
Jetzt die Anzahl der Staaten Ω ( E ) mit Energie E ist endlich und Sie können die mikrokanonische Entropie berechnen. Dies ist ein Sonderfall der in den vorherigen Antworten erwähnten Grobkörnung.

Der Vorteil dieses Ansatzes ist, dass Sie ihn leicht abschätzen können Ω ( E ) , die Anzahl der Energiezellen E , als Volumen v Ö l des Phasenraums entsprechend einer Energie E geteilt durch das Volumen h 0 3 N einer Zelle (ich vereinfache hier etwas: Was zuerst berechnet werden sollte, ist eigentlich das Volumen des Phasenraums, das einer Energie kleiner als entspricht E ). Diese Schätzung ist nur dann genau, wenn h 0 ausreichend klein gewählt wird. Sehen Sie, was mit der Entropie passiert: seit Ω ( E ) = v Ö l / h 0 3 N , Entropie liest

S ( E ) = k B ln v Ö l 3 N k B ln h 0
Der Parameter h 0 tritt nur als additive Konstante auf. Da thermodynamische Mittelwerte durch Ableitungen der Entropie gegeben sind, hängen sie nicht davon ab h 0 (hoffentlich da die Diskretisierung des Phasenraumes nicht physikalisch ist) und man kann jedem beliebigen Wert beimessen h 0 , solange sie hinreichend klein bleibt. Normalerweise wird kein bestimmter Wert angegeben h 0 .