Thermodynamik von Occams Razor

Occam's Razor besagt im Wesentlichen, dass unter Hypothesen mit ähnlicher Erklärungskraft die einfachste Hypothese als die plausibelste bevorzugt werden sollte.

Die Thermodynamik besagt, dass bei Nulltemperatur eine Reaktion abläuft, wenn die Produkte eine niedrigere Energie als die Reaktanten haben, ΔH < 0. Die Analogie ist, dass die günstige Reaktion wie eine günstige Hypothese ist: Niedrigere Energie ist gleichbedeutend mit einfacher (und/oder besser). -passend zu).

Aber bei einer Temperatur ungleich Null ist es nicht so einfach: Zufällige thermische Schwankungen neigen dazu, Arten in verschiedene Zustände zu bringen; Wenn es mehr Möglichkeiten gibt, "zufällig zu sein", wird dies tendenziell bevorzugt. Diese Fähigkeit wird als Entropie quantifiziert, und günstige Reaktionen müssen nun ΔG = ΔH - TΔS < 0 gehorchen, wobei T die absolute Temperatur und ΔS die Änderung der Entropie ist (G ist die freie Gibbs-Energie ). (Um die Komplexität noch weiter zu steigern, sollte man die Boltzmann-Zustandsverteilung berücksichtigen, aber ich höre bei der Entropie auf.)

Es scheint ein Analogon im Hypothesenraum zu geben. Angenommen, es gibt viele nicht ganz einfachste Hypothesen mit ungefähr der gleichen Erklärungskraft wie die einfachste Hypothese. (Zum Beispiel könnten Sie mehr Variablen hinzufügen, als zur Erklärung Ihrer Daten erforderlich sind.) Je nachdem, welcher Mechanismus die Einfachheit fördert (dh wie hoch die "Temperatur" ist), ist es viel wahrscheinlicher, dass Sie die wahre Hypothese im Pool finden von nicht gerade einfachsten Hypothesen, als tatsächlich festzustellen, dass die einfachste Hypothese wahr ist.

Gibt es Literatur, vielleicht in der Wissenschaftsphilosophie, die diesen Punkt vertieft? Es ist von besonderer Bedeutung in Bereichen wie der Biologie, wo die einfachste Hypothese oft nicht zutrifft – und wenn man die Evolution als Temperatur betrachtet (insbesondere beinhaltet eine Komponente davon zufällige Veränderungen), deutet es vage darauf hin, dass eine Gibbs-freie-Energie- Eine solche Modifikation von Occam's Razor ist ratsam.

Benötigen Sie nicht zwei Theorien mit gleich starken Erklärungen für dieselbe Sache, damit Occams Rasiermesser zutrifft?
@Lukas - Ja, ich gehe davon aus, dass alle Theorien ungefähr die gleiche Aussagekraft haben. Ich füge das der Frage hinzu.
"Es ist von besonderer Relevanz in Bereichen wie der Biologie, wo die einfachste Hypothese oft nicht wahr ist" - Wie Sie selbst betonen, geht es nicht um Einfachheit, sondern um die Aufrechterhaltung eines Kompromisses zwischen Einfachheit und Erklärungskraft.
Ich kenne keinen bestimmten philosophischen Hinweis, aber in statistischen Modellen gibt es oft einen Regularisierungsbegriff , der komplizierte Modelle bestraft, was jede Bewertungsfunktion zwingt, zwischen Einfachheit und Erklärungskraft abzuwägen.
Ein weiteres interessantes Thema auf dem Weg, ein philosophisches Thema im Zusammenhang mit Entropie zu erstellen +1
Dann fällt mir immer noch die Perpetual Machine en.wikipedia.org/wiki/Perpetual_motion ein , wenn irgendein reaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa ...
Wenn ich Occams Rasiermesser und Ihre Hypothese verstehe oder was auch immer in Ihrer Frage steckt, selbst wenn das Perpetuum Mobile gegen den ersten und zweiten Hauptsatz der Thermodynamik verstößt, wenn die einfachste Annahme oder Lösung die beste ist, dann tut dies in der unendlichen Welt das Obige System ist das am besten passende Analog? Beharre ich zu sehr darauf oder bin ich völlig verrückt ? -------------
Da die Maschine ihre eigene Energie selbst erzeugen kann, ist analog gesprochen kein zusätzlicher Input erforderlich, daher ist es in der unendlichen Welt die beste Lösung, da es in dieser Welt keine Hypothese oder Annahme - Input geben würde. Oder bin ich zu lahm?
@KentaroTomono - Selbst Perpetuum-Motion-Maschinen haben Grenzen in Bezug auf die Energiedichte, und Energie ist nicht die einzige Einschränkung dessen, was existiert. Also ich glaube nicht, dass es viel Relevanz hat.
Äh, wenn Rex das sagt, dann wird es so sein. Aber ich habe deinen Teil "Energie ist die einzige Begrenzung dessen, was existiert" nicht verstanden. Wenn wir ewig kostenlos Energie haben, wird alles gelöst sein. Obwohl ich glaube, ich verstehe, dass ich zu weit gegangen bin (in das Reich der Welt des Buddha, autsch (aber keine Beleidigung für Buddha))
Wird Occams Rasiermesser in der Post-Popper-Wissenschaft verwendet, um die „beste“ Theorie auszuwählen oder die „am leichtesten zu falsifizierende“ Theorie zu finden? Angesichts der optimalen Strategie zum Eliminieren von Alternativen besteht darin, mit der einfachsten zu beginnen. Aber das wiederum siehe philosophie.stackexchange.com/q/55245/33787

Antworten (4)

In Bezug auf das Testen von Bayes'schen Hypothesen wird Occams Rasiermesser in die vorherigen Wahrscheinlichkeiten der Hypothesen aufgenommen. Oft kann man Unterschiede in den A-priori-Wahrscheinlichkeiten als "entropisch" interpretieren. Stellen Sie sich zB zwei Modelle vor: H1: 0<=x<0.2, H2: 0.2<x<1.0, basierend auf einem Parameter 0<=x<1. Wenn wir die Verteilung der maximalen Entropie (konstante) als vorherige Verteilung für nehmen x, dann ist die a priori Tendenz in Richtung H2auf die Tatsache zurückzuführen, dass es "mehr Zustände", dh höhere Entropie, für dieses Modell gibt. Diese unkomplizierte Verwendung von Bayes'schen Hypothesentests hat nicht die Eigenschaft, energetische gegen entropische Überlegungen abzuwägen; oder äquivalent dazu gibt es kein Analogon der (variablen) Temperatur.

Es gibt Forschung zur statistischen Mechanik von Bayeisan-Netzwerken, zB können Variationsansätze zur Schätzung der freien Energie in physikalischen Systemen als ungefähre Ausbreitungsalgorithmen angewendet werden (Yeddida ist ein relevanter Autor). Am Ende ist die Thermodynamik bei erledigt kT=1, sodass Energie <=> Log-Wahrscheinlichkeit.

Wenn Sie zu maschinellen Lernproblemen kommen, können Sie anfangen, Dinge zu sehen, die wie Temperaturen in den Modellen aussehen; und so erhalten Sie weitere interessante Analogien. Ich habe Artikel gesehen (ich habe keine Referenz zur Hand), in denen sie in den Anfangsphasen des Erlernens von Bayes'schen Netzwerken (effektiv) eine hohe Temperatur verwendet haben, um eine Überanpassung der bedingten Beziehungen zu verhindern, während die Struktur noch unsicher war, und dann die " Temperatur" bis kT=1, und sie fanden das Maximum-Likelihood-Modell für die Daten.

Es gibt eine meiner Meinung nach verwandte Anwendung beim Reinforcement Learning , bei der ein temperaturähnlicher Parameter verwendet werden kann, um zwischen Exploration (entropiegetrieben) und Exploitation (energiegetrieben) zu wechseln.

In Bezug auf die Art von Hypothesentests, auf die im OP angespielt wird, habe ich keine Forschung mit echter Thermodynamik gesehen (Fehlen von Beweisen und allem ...), und ich sehe nicht, auf welches Merkmal dieser Art von Problemen abgebildet wird die Idee einer Temperatur. An verschiedenen Stellen im maschinellen Lernen habe ich jedoch gesehen, was wie relevante Ideen aussah; Dies liegt an der Tatsache, dass diese Art von Problemen die Modellanpassung (Energieanalog) gegen die Verallgemeinerung (Entropieanalog) abwägen müssen. Keiner von ihnen entspricht genau den in der Frage festgelegten Kriterien, liefert aber hoffentlich einige Hinweise darauf, wo verwandte Ideen aufgetaucht sind.

Gute Argumente! Ich bin eigentlich mit der Idee der Temperatur in ML-Systemen vertraut, von explizit (Boltzmann-Maschinen) bis weniger explizit (unterschiedliche Lernraten usw.). Ich werde versuchen, Yeddida zu überprüfen. Aber ich hatte gehofft, dass es eine philosophischere Diskussion zu diesen Themen gibt, wo die Epistemologie der Angelegenheit tiefer nachgedacht wird und wo Sie Ideen haben, wie Sie die Take-Home-Botschaft anwenden können, auch wenn Sie keine Parametrisierung von haben Ihre vorherige Verteilung, wie Sie es beim Bayes'schen Hypothesentest tun.

Occams Rasiermesser sucht nach der „besten“ Antwort und definiert diese als die „plausibelste Antwort“. In der Wissenschaft haben wir nicht den Luxus, nach einer „wahren Hypothese“ zu suchen, weil die Definition einer wahren Hypothese eine ontologische ist, die über den Bereich der Wissenschaft hinausgeht (sie liegt eher im Bereich der Religion). Stattdessen wird Entdeckung als langsame Anhäufung von Verbesserungen behandelt.

Wenn wir die Tore öffnen würden, um eine breitere Palette komplexerer Hypothesen zu berücksichtigen, würden wir theoretisch eher die „wahre“ Hypothese in der ersten Runde berücksichtigen. Bedeutet das jedoch, dass wir eher nach der wahren Hypothese handeln? Das ist eine schwierigere Frage.

Betrachten Sie einen Satz von Hypothesen, die aus einer Kernhypothese H aufgebaut sind. Definieren Sie eine Transformation (H, n) -> H', die eine neue Hypothese erstellt, indem sie die Kernhypothese mit einigen numerisch definierten Änderungen kombiniert, um eine neue Hypothese zu erstellen. Dies könnte leicht die Form des "Hinzufügens zusätzlicher Freiheitsgrade" annehmen, die Sie erwähnen.

Lassen Sie uns nun auch eine "einfachste" Hypothese, S, aufnehmen und einige Hypothesen, H1, H2 und H3 (erzeugt aus (H, 1), (H, 2) bzw. (H, 3)), instanziieren. Es ist klar, dass wir so viele davon definieren könnten, wie wir wollen, und die Wirkung jeder einzelnen Hypothese, einschließlich S.

In vielen Fällen ist es bemerkenswert schwer zu beweisen "Alle Hypothesen, die mit (H, n) -> H' konstruiert wurden, sind mit geringerer Wahrscheinlichkeit 'wahr' als S." Dies schafft ein frustrierendes Dilemma: Allein durch das Zählen von 1 aufwärts könnte eine einzelne Person eine beliebige Anzahl von zu prüfenden Hypothesen aufstellen, von denen eine wahr sein könnte.

In einer idealen Welt, in der die Diskussion von Hypothesen kostenlos ist und keine Zeit in Anspruch nimmt, ist dies kein Problem. Man diskutiert einfach den unendlichen Satz von Hypothesen, zieht eine Schlussfolgerung und geht weiter. In der realen Welt ist das Testen einer Theorie jedoch teuer. Wir wollen es nicht einfach machen, das Wasser zu trüben.

Die Lösung der Wissenschaft ist also Occams Rasiermesser. Anstatt zu versuchen, in einem Sprung zur „wahren“ Hypothese zu springen, versucht die Wissenschaft einfach, „näher“ zu springen. Einfachheit ist etwas, auf das man sich einigermaßen einigen kann (es ist nicht perfekt, aber es ist viel einfacher, als sich auf „Wahrhaftigkeit“ zu einigen). Die Wissenschaft und Occam's Razor erklärt also ein Postulat: "Im Allgemeinen führt uns das Finden einer einfachen und größtenteils richtigen Hypothese zu einer besseren Lösung in der nächsten Iteration, als wir durch die Auswahl einer komplexeren Hypothese erhalten hätten." Wenn also die "wahre" Hypothese, wählen wir H3, eine zusätzliche Variable hätte, behauptet die Wissenschaft, dass sie billiger und schneller zu H3 kommt, wenn sie zuerst durch S geht und diese dann auf H3 ausdehnt. Es behauptet, dass, wenn es zu H3 springen müsste,

Ich lenke die Aufmerksamkeit auf das Wort „Postulat“. Es gibt nichts, was sagt: „Occams Rasiermesser ist der wahre Weg, um Wissen zu finden.“ Es ist nur ein Prinzip, das in der wissenschaftlichen Forschung erfolgreich genug war, um ein hohes Prestigeniveau zu erreichen.

Ich denke, Sie könnten Literatur zu dem Thema im Allgemeinen finden. Die Art des Rasierers von Occam ist in Bezug auf die Optimierung von Systemen gut definiert. In seiner traditionellen Verwendung ist Occams Rasiermesser ein Ansatz, der darauf abzielt, den Wert der generierten Hypothesen gegenüber der für sie aufgewendeten Zeit zu optimieren. Wenn Sie alternative Optimierungen untersuchen möchten, die die "wahre" Hypothese schneller finden, könnten Sie damit beginnen, zu untersuchen, wie man testen würde, ob eine Hypothese "wahr" ist, und dann sehen, ob dies in Richtungen führt, die alternative Optimierungstechniken erfordern.

Ich glaube jedoch nicht, dass Sie in der Literatur viel über die Anwendung von Occams Rasiermesser in der Philosophie finden werden, da Occams Rasiermesser von der Prämisse ausgeht, dass diese beiden Hypothesen die gleiche Beweiskraft haben. Dies ist ein höchst ungewöhnlicher Vorfall in der Philosophie, weil es so wenig Einigkeit über die Definition von „Macht beweisen“ gibt. An den wenigen Stellen, an denen ich damit vertraut bin (Phyiskalismus vs. Dualismus vs. Idealismus ist mein Favorit), sehen wir tatsächlich, was Sie vorschlagen: Anstatt nur von einer Hypothese auszugehen und sich vorwärts zu bewegen, hat die Philosophie mehrere parallel vorangetrieben.

Ich werde zwei Dinge als Antwort vorschlagen.

Erstens ist Occams Razor nicht genau definiert. Auf einer Ebene ist überhaupt nicht klar, was William von Ockham geschrieben hat, außer dass es sich um eine Art Sparsamkeitsprinzip handelt ( Link ). Auf einer anderen Ebene ist es schwierig, jemanden zu finden, der wissentlich eine Erklärung mit überflüssigen Details anbietet. Zumindest ist das meine Meinung dazu.

Zweitens war meine Erfahrung aus meiner Studentenzeit in Chemie, dass Chemiker immer mit Vereinfachungen arbeiten und versuchen, die am wenigsten ausreichende Vereinfachung auszuwählen (womit ich die einfachste Form meine, die zur Lösung des Problems ausreicht).

Zum Beispiel tun wir in vielen elementaren Experimenten so, als ob ΔH = ΔE. Oder wir betrachten Gase gemäß PV=nRT statt der für reale Gase benötigten Virialgleichungen ( http://facstaff.cbu.edu/rprice/lectures/realgas.html ). Ebenso wählen wir Systeme, die einfach zu berechnen sind, gegenüber schwer zu berechnenden (beginnend mit der Verwendung des metrischen Systems über imperiale Einheiten).

Aber in Bezug auf die Literatur zur Wissenschaftsphilosophie kenne ich keinen Ort, der direkt auf Ihre Frage eingeht (was daran liegen könnte, dass meine AOSes und AOC nicht in der Wissenschaftsphilosophie liegen).

Siehe insbesondere SEP .

Die Einsicht, dass Occams Rasiermesser nicht genau definiert ist, ist wichtig. Das Konzept ist sehr beliebt , aber das bedeutet nicht, dass es präzise ist! (Und ich stimme der Wahl der Vereinfachung in Chemie zu; sie stimmt auch mit meiner Erfahrung im Grundstudium und mit einem berühmten Einstein-Zitat überein.)

Die eigentliche Prämisse scheint ein bisschen tot zu sein. Ihr Hypothesenpool enthält die einfachsten. Da es sich also um eine Obermenge handelt, ist die Wahrscheinlichkeit, die beste Antwort im Pool zu finden, größer oder gleich der Wahrscheinlichkeit, dass die einfachste Antwort die beste ist.

Was die Anwendbarkeit der Ideen auf die Philosophie betrifft, hatte ich ein wenig Schwierigkeiten. Theoretisch macht es Sinn, dass Occam's Razor hier etwas bewirken sollte. Die Herausforderung besteht jedoch darin, dass Occam's Razor vorschlägt, dass das "Einfachste" das Beste sein sollte. „Einfach“ ist kein einfacher Begriff in der Philosophie. Menschen kommen mit unterschiedlichen Sätzen von Axiomen, und der Weg von ihnen zu einer Theorie ist nicht immer einfach. Zum Beispiel gibt es viele Theorien, die für Menschen, die an eine wörtliche Wort-für-Wort-Übersetzung der Bibel glauben, am "einfachsten" sind, aber für einen Atheisten nicht "am einfachsten".

Ich denke, Sie könnten eine Theorie in dieser Richtung auf Theorien für Ihren eigenen persönlichen Gebrauch anwenden, aber ich finde, dass der Wert von Occams Rasiermesser durch die Komplexität des Versuchs, Menschen dazu zu bringen, sich auf etwas Einfaches zu einigen, in den Schatten gestellt wird, daher ist es schwieriger, es anzuwenden in einer Gruppeneinstellung.

Ich war wohl nicht klar genug. Hier ist ein typisches Beispiel aus der Biologie: Pause A, und es passiert etwas. Break B, das Gegenteil passiert. Brechen Sie beide, und es sieht aus wie B. Logik ist: A schaltet B aus, B macht Sachen. Einfachste Hypothese. Aber es gibt Familien von Hypothesen, die so aussehen: A schaltet etwas C ein, das etwas D ausschaltet, das etwas E ausschaltet, das B ausschaltet; B macht Sachen. Oder: A signalisiert C. B signalisiert auch C. Aber ohne Signal sieht C aus wie A-on, B-off. Wie auch immer, der Punkt ist, dass der kompliziertere Pool (per Prämisse) nicht die einfachste Antwort enthält.
Hmm, macht Sinn, aber es ist selbst kompliziert. Ich denke, der Grund, warum ich meine Antwort so geschrieben habe, ist die Formulierung "der Pool" im vorletzten Absatz. Möglicherweise möchten Sie diese Formulierung bearbeiten, um sie zu erweitern. Ich nahm automatisch an, dass der Pool im Allgemeinen die einfachste Antwort war. Wenn der Pool die einfachste Antwort ausschließen soll, anstatt sie einzuschließen, schreibe ich eine andere Antwort, denn in diesem Fall ist das Wort „sollte“ in Occams Rasiermesser der Schlüssel. Sollte ist ein sehr philosophisches Wort, das viele Interpretationen über die eigentliche Problemstellung hinaus zulässt.
Ich habe versucht, die Prämisse zu klären. Findest du das übersichtlicher?
Ja, das ist mir viel klarer. Ich sollte in der Lage sein, nach der Klärung eine andere Antwort zu finden, die hoffentlich besser mit dem übereinstimmt, wonach Sie suchen.