Lexikalische/ontologische/semantische Wissensbasis für Physik

  1. Gibt es lexikalische/semantische Wissensdatenbanken für Physik, die für automatisiertes Denken und KI verwendet werden können (wie Princetons Wordnet und MITs Conceptnet für den gesunden englischen Sprachgebrauch)?

  2. Falls nicht vorhanden, gibt es physikspezifische Probleme, die bei der Entwicklung einer solchen Wissensbasis zu berücksichtigen sind? Kann es beispielsweise unter Verwendung vorhandener semantischer Beziehungsklauseln in Conceptnet entwickelt werden? Hinweise auf Rezensionsartikel, Bücher usw. sind ebenfalls gut.

Ich verstehe, dass eine solche Wissensbasis ohne die mit dem Lexikon verbundene Mathematik nicht vollständig sein wird. Aber wenn Sie hier durch die Fragen und Antworten blättern, scheinen viele von ihnen überhaupt keine Mathematik zu beinhalten (nur reine englische Wörter). Auf jeden Fall sollte es nicht unmöglich sein, die Mathematik hinzuzufügen, sobald es ein nicht-mathematisches Lexikon/semantisches Netzwerk gibt (und es scheint einige Initiativen zu geben, Mathematik in das semantische Web aufzunehmen, wie OpenMath, Content-MathML, OMDoc usw.).

PS: Das ist kein verrücktes Geschwafel. Ich bin ein Doktorand in theoretischer Hochenergiephysik. Ich bin zu dieser Frage gekommen, als ich darüber nachdachte, wie viel der aktuellen Physik durch KI automatisiert werden kann.

Bearbeiten 1: Etwas Verwandtes: http://www.cs.utexas.edu/users/novak/physics.html

Bearbeiten 2: Chat-Thread erstellt (Update 2a: Anscheinend wurde der Chat-Thread geschlossen)

Bearbeiten 3: Einige Ressourcen für enthaltene Mathematik in semantischen Diagrammdaten enthalten

Edit 4: Ed Shayas Ontologie der Astrophysik, die auch einige andere Bereiche der Physik umfasst: http://www.astro.umd.edu/~eshaya/astro-onto/

Dies scheint eher eine Frage der Wissenschaftsphilosophie oder der künstlichen Intelligenz als der Physik zu sein.
Die Wissenschaft der Wissensrepräsentation ist sicherlich nicht philosophisch! Meine Frage könnte ebenso zur KI gehören wie zur Physik. Übrigens, AI.SE ist geschlossen.
Ich fürchte, ich verstehe nicht genau, was Sie suchen: Suchen Sie so etwas wie die Grundlage für eine automatische Beweisprüfung, wie sie für bestimmte Mathematik existiert, aber für Physik? Oder möchten Sie eine Zusammenstellung der Begriffe, die Physiker verwenden, wo sie vom allgemeinen englischen Sprachgebrauch abweichen? Oder eine formelle Darstellung (in EBNF oder was auch immer) der "physischen Sprache"?
Was ich suche, ist ein semantischer Hypergraph physikalischer Begriffe und ihrer Beziehungen . Ich habe meine Frage bearbeitet, um eine grundlegende Anwendung hinzuzufügen.
Ich bezweifle, dass so etwas existiert oder überhaupt existieren kann (im Sinne von Erfolg). Die Physik ist in hohem Maße ein Zusammenspiel menschlicher Ideen, die mit experimentellen Daten gekoppelt sind. Die Ideen selbst sind ohne ein tiefes Verständnis ihrer Beziehung zu den Daten völlig bedeutungslos. Wenn also ein Wissensgraph der Physik nicht weiß, wie man einen Beschleuniger baut oder was ein gutes Design für ein Stern-Gerlach-Experiment ist ...
@CuriousOne Nicht wirklich. Wenn Sie die meisten Artikel über Saiten lesen (sogar die String-Phänomenologie), werden Sie feststellen, dass es kaum etwas gibt, das auch nur entfernt mit einem Experiment verbunden ist. Verdammt, selbst eine Reihe von SUSY-Papieren ohne Strings erfordern kein tiefes Verständnis von Experimenten - nur ein rudimentäres Wissen, das leicht kodifiziert werden kann, reicht aus. Es ist eine andere Sache, ob diese Physik genannt werden sollten, aber sie sind es derzeit (und ich bin zufällig in einer davon).
@crackjack: Die Stringtheorie ist noch nicht einmal Physik, und kein ernsthafter Physiker gibt vor, dies zu sein. Es ist schöne Mathematik, die verzweifelt nach einer Anwendung sucht. Wie gesagt, die Schwierigkeit besteht darin, dass die Symbole völlig bedeutungslos sind, wenn man sie nicht auf eine Messung beziehen kann.
@CuriousOne Ich möchte nicht in die Politik/Meinung hineingezogen werden. Es gibt viele SUSY-Theoretiker (die Nicht-Phänomenologen), deren Arbeit, wie Sie zustimmen werden, in die Physik fällt und dennoch kein tiefes Verständnis von Experimenten erfordert. Es gibt sogar viele Arbeiten zur Theorie der kondensierten Materie (insbesondere im topologischen Bereich), die dasselbe tun. Tatsächlich ist sogar das, was ein Elektron ausmacht (es ist sowohl ein Kontinuumsfeld mit einem bestimmten Lagrangian als auch ein Teilchen mit bestimmten diskreten Eigenschaften), reine Tautologie ohne tiefere/höhere Wahrheit.
@crackjack: Es gibt nichts zu diskutieren. Ich zitiere einfach die Definition von Wissenschaft, die diese Angelegenheit sofort regelt.
@CuriousOne Ich bin verwirrt. Was ist hier die Meinungsverschiedenheit (abgesehen von der Stringtheorie, von der ich mich abmelden werde)? Ich habe Beispiele aus CMT- und Nicht-String-SUSY-Theorien zitiert, die keine tiefe Intuition der physikalischen Welt benötigen, die nicht programmatisch kodifiziert werden kann. Jegliche Semantik/Intuition der physischen Welt, die in diesen Bereichen benötigt wird, ist immer noch viel einfacher zu codieren, als maschinelle Lernalgorithmen zu schreiben, um menschliche Gefühle oder Emotionen (eine Anstrengung, die bereits in vollem Gange ist) aus Tweets zu erkennen oder Kommentare zu überprüfen, die in natürlichen Sprachen geschrieben sind!
Ich habe keine Zeit, dies als richtige Antwort aufzuschreiben, also einen Kommentar. Benjamin Kuipers war lange auf dem Gebiet des qualitativen Denkens tätig. Seine Arbeiten reichen von Mitte der 1980er bis Anfang der 2000er Jahre. Seine wegweisende Arbeit Kuipers, B. (1984). Gesunder Menschenverstand über Kausalität: Ableitung des Verhaltens von der Struktur. Artificial Intelligence , 24(1), 169-203 ist ein guter Ausgangspunkt. Eine Reihe weiterer Forscher haben sich seitdem der Sache angenommen.
Chatrooms ohne Aktivität werden automatisch gesperrt und anschließend nach einiger Zeit gelöscht. Ich kann mich jetzt nicht an die Schwellen erinnern.

Antworten (3)

Ich bin der Autor der in der ursprünglichen Frage erwähnten Astronomie- und Physik-Ontologie. Der ursprüngliche Zweck dieser Ontologie bestand darin, die Suche nach Daten und Artikeln in der Astronomie zu verbessern. Die Idee war, Datensatztabellen und einzelne Spalten in Tabellen mit relevanten Schlüsselwörtern zu kennzeichnen.

Die Datenreihen in der Astronomie sind in der Regel verschiedene astronomische Objekte unterschiedlicher Art. Dann könnte eine Suche nach einer Reihe von Werten auf einer Eigenschaft für einen bestimmten Objekttyp durchgeführt werden, und die Rückgabe wären alle relevanten Daten in allen astronomischen Archiven.

Aber im Laufe der Zeit dachten wir an viele weitere Möglichkeiten, wie eine solche Ontologie verwendet werden könnte. Ein Neuling könnte aus der Ontologie schnell alle verschiedenen astronomischen Arten und Unterarten, ihre Eigenschaften und ihre hellsten oder ähnlichsten Beispiele lernen. Man könnte nach den neuesten Papieren fragen, die sich speziell mit einer bestimmten Art der Beobachtung eines bestimmten Objekttyps innerhalb eines Bereichs von Entfernungen oder Himmelsrichtungen befassen.

Ich denke, das meiste davon lässt sich auch in die Physik übertragen. Man könnte nach bestimmten Experimenten oder Artikeln zu einem Thema fragen und dann, je nach Ergebnis, nach Ergebnissen zu weiter gefassten oder engeren Begriffen fragen. Neulinge können lernen, welche Begriffe fast dasselbe bedeuten und wie sie sich unterscheiden, wenn sie sich doch unterscheiden.

Eine Sache, die wir untersucht haben, war, ob ein komplexer langer Artikel auf ein paar einfache ontologische Aussagen reduziert werden kann. Es hilft, dass eine Denkmaschine Ihnen sagen kann, welche Aussagen Wiederholungen von bereits bekannten Dingen sind und welche neu sind. Dann könnte man mit etwas Übung die Ergebnisse eines ganzen Physics Review-Journals in wenigen Minuten lesen. Die Liste geht weiter und weiter.

Die dafür erforderlichen Mittel sind jedoch groß, und im Moment sind die einzigen Gruppen, die ich sehe, die solche Dinge tun, Microsoft, Google und Apple, und all das geschieht hinter verschlossenen Türen.

Vielen Dank, dass Sie meine Anfrage beantwortet und Ihre Gedanken hier geteilt haben! Könnten Sie vielleicht auch Ihre Gedanken zu (1) Crowdsourcing einer solchen Initiative in der Physik-Community (wie Freebase oder OMCS/ConceptNet für die Ontologie des allgemeinen Wissens) (2) Einbindung der Semantik mathematischen Wissens in die Ontologie (vgl kommentieren Sie Ben und beginnen Sie mit "Schauen Sie sich auch die Content-MathML- und OpenMath-Optionen an ...").
Kennen Sie auch andere Projekte, die Ontologie in der Physik gebaut (oder gebaut) haben? Was die Finanzierung anbelangt, könnten wir die Zusammenstellung eines glaubwürdigen und fachlich gut vertretenen Konsortiums von Mitgliedern aus der Physik-Community in Betracht ziehen und eine öffentliche Crowd-Finanzierung (über KickStarter, Experiment/Microryza usw.) anstreben. Die Finanzierung könnte ausreichen, um die Hardwarekosten zu decken, und wenn sie von den Medien aufgegriffen wird, kann sie die Aufmerksamkeit potenzieller Freiwilliger (Studenten, Postdocs usw.) aus der Community auf sich ziehen.
Ich glaube nicht, dass Crowdsourcing gut funktionieren würde, weil nur Physiker das erforderliche Fachwissen haben und es einfach nicht genug gibt. Ich denke jedoch, dass automatisierte Lesegeräte verwendet werden könnten. Es gibt Programme da draußen, die Zeitungen lesen und Geheimdienstinformationen für das Militär sammeln. Einem Physikspezialisten könnte vielleicht beigebracht werden, Physikartikel zu lesen und schnell eine riesige Datenbank mit Physikwissen aufzubauen. Vielleicht würde Crowdfunding dafür funktionieren, wenn wir uns beispielsweise mit einem kleinen Zweig der Physik (wie der Kosmologie) und den entsprechenden Semantik-Ingenieuren zusammenschließen würden.
Auto-Mining ist eine großartige Idee. Wenn ich darüber nachdenke, verwenden sogar Yago und v5 von ConceptNet automatisierte Ontologie-Lerner wie ReVerb, um ihre allgemeine Wissensdatenbank zu füllen. Wir können vielleicht eine kleine Proof-of-Concept-Demo machen (für ein enges Feld, wie Sie vorgeschlagen haben) und damit ein größeres Team zusammenstellen und eine anfängliche Finanzierung suchen!
Die nltk-Diskursverarbeitung sieht auch interessant aus.
Sie könnten diese interessant finden: Suchen Sie nach drei Artikeln (1998, 2000, 2001) von Kocabas, S., & Langley, P. bei Langley's Computational Scientific Discovery
Außerdem: Kapitel-2 von Deyan Ginevs MSc-Thesis zum aktuellen Stand der Technik.

Ich bin der Entwickler eines Projekts namens Physics Derivation Graph , siehe auch auf GitHub .

Meine Absicht ist es, eine Reihe von Ableitungen zu einem Graphen zu entwickeln, der den aktuellen Wissensstand in der Physik erfasst. Obwohl ich automatisches Schließen außerhalb des Rahmens meines Projekts betrachte, können Sie sich gerne die Datenbanken ansehen und darüber nachdenken, was Sie verwenden können.

Ich vermeide absichtlich die Abhängigkeit von Englisch, um die Grafik zu erstellen. Der Graph sollte in der Lage sein, durch ein Computeralgebrasystem analysiert zu werden. Dies bedeutet, dass es Ihren Interessen am automatisierten Denken zugänglich sein könnte, wenn Sie dies mathematisch angehen.

PS: Ich denke auch, dass ich kein Spinner bin, da ich in Computational Physics promoviert habe


Edit 20150708: Link zur Seite und zum Quellcode in GitHub.

Da Ihr ursprünglicher Chatroom verschwunden zu sein scheint, lassen Sie es mich bitte wissen, wenn Sie daran interessiert sind, einen neuen Chatroom zu erstellen. Ich würde gerne diskutieren.
Das ist ein interessantes Projekt! Es wäre sicherlich beim automatisierten Denken nützlich. Haben Sie ein Diskussionsforum, das für Ihre Projektwebsite nativ ist? Auf diese Weise können Sie Gespräche zwischen Mitarbeitern zusammenhalten.
Sehen Sie sich auch die Optionen Content-MathML und OpenMath an. LaTeX ist für die Präsentation gut entwickelt, aber nicht so gut für das Verfassen semantischer Inhalte ( sTeX ist eine dieser seltenen Erweiterungen, wird aber nicht aktiv weiterentwickelt). NIST hat ein LaTeX-to-MathML- Tool geschrieben, um die semantische Webverarbeitung (z. B. mathwebsearch ) seiner digitalen Bibliothek mathematischer Funktionen zu ermöglichen.
Ich habe sowohl Content MathML als auch OpenMath in Betracht gezogen. Ich stimme Ihnen zu, dass Latex auch nicht für semantische Inhalte gedacht ist, aber es wird gut gerendert. Ich kenne die Latex-to-MathML-Projekte; Mein derzeitiger Fokus liegt auf dem Rendern eines visuellen Diagramms.
Ich habe meine Beobachtungen in diesen Bericht geschrieben: github.com/allofphysicsgraph/proofofconcept/blob/gh-pages/doc/…

Dieses Papier könnte Sie interessieren:

Vorhersage von Forschungstrends mit semantischen und neuronalen Netzen mit einer Anwendung in der Quantenphysik. Mario Krenn und Anton Zeilinger. arXiv:1906.06843 (2019).

In ihren eigenen Worten,

Hier demonstrieren wir eine Methode zum Aufbau eines semantischen Netzwerks aus veröffentlichter wissenschaftlicher Literatur, die wir SemNet nennen

wo sie Wikipedia als Quelle für Konzepte verwenden, die Knoten im Wissensnetzwerk bilden, und die veröffentlichte Literatur als Quelle für Kanten, die diese Knoten mit der Stärke dieser Kanten verbinden.

Ich weiß nicht, wie nützlich das am Ende sein wird, aber es ist einen Blick wert, wenn Sie an diesem Genre interessiert sind.