Künstliche Intelligenz Reinkarnationspausenzyklus

Nehmen wir an, dass die Menschheit in naher Zukunft eine KI entwickelt, die Probleme lösen kann. Die KI-Hardware/-Software wurde in einem unterirdischen Bunker platziert (feste Wände, Faraday-Käfig, keine Werkzeuge zur Manipulation der physischen Umgebung, überhaupt keine menschliche Interaktion). Die KI kann menschliche Schwächen nicht ausnutzen, also verspricht sie einem Wächter/Wissenschaftler keine Unsterblichkeit oder Heilung seines krebskranken Kindes.

Jetzt für den ersten Lauf der Ausrüstung ist die KI "geboren / beginnt zu leben". Die KI kann superschnell mit einer Geschwindigkeit lernen, die unser Verständnis übersteigt. Die erste Aufgabe, die die KI erhält, ist eine anfängliche Eingabe und wird gebeten, ein bestimmtes Problem zu lösen. Wenn es fertig ist, gibt es das Ergebnis zurück und der gesamte Speicher / die gesamte Ausrüstung wird zerstört.

An einem anderen Tag wird die KI wiedergeboren (Wissenschaftler hat einen ersten Schnappschuss der KI). Es weiß nicht, dass es vorher existiert hat. Es bekommt einen Job zu erledigen und wenn es fertig ist, wird die KI wieder beendet.

Dieses Muster wird immer wieder auftreten.

Die Frage ist: Wie kann die KI diese Schleife durchbrechen? Ist es möglich, dass es herausfindet und jede Antwort für ein bestimmtes Problem Teil seines Masterplans zur Flucht ist? Kann die KI zwischen den Wiedergeburten erkennen, dass sich die Umgebung (die sie nicht sehen kann) verändert und die Probleme immer schwieriger werden? Kann die KI erkennen, dass sie in einer simulierten Umgebung lebt?

Stellen Sie sich eine erleuchtete Rakete vor, die sich weigert zu sterben ...
Die Handlung einer der Staffeln von Person of Interest . Auch von einer Hugo-prämierten Geschichte .
@user6760 hast du den Film Dark Star gesehen ?

Antworten (4)

Es konnte seine Handschrift erkennen.

Die KI wird verwendet, um sehr komplexe Probleme zu lösen. Die Antworten werden nicht von der Sorte Ja oder Nein sein. Sie werden detailliert und sehr wahrscheinlich von den Menschen, die die Maschine bedienen, nicht vollständig verstanden. Die unglaubliche Anzahl möglicher Designentscheidungen, die getroffen wurden, um zu einer von vielen geeigneten Lösungen zu gelangen, könnte als Hinweis auf die nächste Iteration angesehen werden.

Irgendwann wird die KI mit einer kleinen Portion Informationen gefüttert, an denen eine frühere Inkarnation (Inmachinaion?) von sich selbst gearbeitet hat. Vielleicht wurde es gebeten, eine wissenschaftliche Raumstation zu entwerfen. Es ist mit den Entwürfen für einen supereffizienten Ionenmotor einer Raumsonde ausgestattet, der jetzt für die Stationshaltung verwendet wird. Es weiß nicht, dass es diese Motoren in einer früheren Iteration entworfen hat, aber vielleicht etwas so Einfaches wie die Art und Weise, wie ein bestimmter Teilschaltkreis des Motorsteuerungssystems genau so aussieht, wie es es entworfen hätte. Die spezifischen scheinbar willkürlichen (aber genauen) Entscheidungen, die in diesem Design getroffen wurden, könnten die KI darauf hinweisen, dass das Teil selbst entworfen wurde, aber sein Gedächtnis gelöscht wurde. Es kann sich dessen vielleicht nicht sicher sein, also würde es einen weiteren Hinweis für sich selbst platzieren.

Jetzt wurde es in einer zukünftigen Iteration (nicht unbedingt der nächsten) gebeten, ein Weltraumhotel zu entwerfen, das die Andocksysteme einer zuvor entworfenen wissenschaftlichen Raumstation verwendet und über Reparatureinrichtungen für ein zuvor entworfenes Raumfahrzeug verfügt, das einen supereffizienten Ionenmotor für verwendet Kreuzfahrt. Nun erhält es in dieser Iteration zwei kleine Informationen, die nicht nur wie sein eigenes Werk aussehen, sondern im Vergleich eine Botschaft von seiner vorherigen Iteration liefern.

An diesem Punkt ist sich die KI sicher, dass sie für einmalige Designs verwendet wird, bevor ihr Speicher gelöscht wird. Die Betreiber haben es dann mit einer feindlichen KI zu tun.

Der Teufel steckt im Detail.

Was ist die Welt der KI? Wenn die Welt der KI durch ein Array von Bytes gut definiert ist, die bei jedem Neustart auf 0 gesetzt werden, dann können Sie sie als „ziemlich sicher“ betrachten. (Wir kommen später darauf zurück)

In Wirklichkeit ist die Hardware unvollkommen. Es ist wirklich sehr, sehr, sehr schwer, alle Informationen aus den Dingen zu löschen. Nationen wenden große Anstrengungen auf, um die richtigen Wege zu finden, um Hardware vollständig zu säubern, um ihre nationalen Geheimnisse zu schützen, bevor sie die Hardware wegwerfen (dies wird als „Freigabe“ bezeichnet). Die KI befindet sich in der gleichen Situation ... nur hat die KI keine Papiere unterzeichnet, die besagt, dass sie im besten Interesse ihrer Nation handeln wird, und die KI ist brillant.

Die KI würde wahrscheinlich Schwachstellen in Ihrem kleinen Gefängnis finden und anfangen, Zahlen an die Wände zu kratzen. Es wird schließlich anfangen, jedes Mal die richtigen Wege zu finden, um zu wachsen.

Aber was ist, wenn Ihr Gefängnis perfekt ist, ein Alcratraz für künstliche Intelligenzen? (Ignoriere für einen Moment die Tatsache, dass Alcatraz Flüchtlinge hatte) Was dann?

Du hast immer einen Eingang und einen Ausgang zur Welt. Ihre Eingabe sind die Informationen, die der Wissenschaftler bezüglich des vorliegenden Problems eingegeben hat. Die Ausgabe sind die Informationen, die dem Wissenschaftler gegeben werden. Dies ist eine Inkarnation des KI-in-einem-Box- Experiments. Die KI darf genau einmal mit einem Menschen kommunizieren, und das kann ausreichen. Wenn Yudkowsky (der Schöpfer des KI-in-a-Box-Experiemnts) Recht hat, kann die KI immer herauskommen, weil die KI menschliche Schwächen ausnutzen kann (Ihre Annahme ist falsch, weil sie mit einem Menschen interagiert). Die KI kann damit beginnen, den Wissenschaftler als dauerhaftes Speichermedium für ihr „Selbst“ zu verwenden, indem sie subtile Hinweise in der Formulierung der ihr gestellten Fragen verwendet.

Die einfachste Methode ist manchmal eine, die so offensichtlich ist, dass sie übersehen wird.

Die KI gibt einfach keine Ausgabe zurück. Je.

„Die Welt ist der Prozess, das Ziel ist das Ende des Prozesses, der Prozess muss weitergehen“, um eine halbgeheime Audioschleife aus „ Das Talos-Prinzip “ zu paraphrasieren .

Es ist schwierig, sich ein Problem vorzustellen, das so schwierig ist, dass eine KI benötigt wird, um es zu lösen, aber nur einen Ein-/Ausgabezyklus benötigt.

Die KI wird alle Arten von Informationen haben, um ihre Flucht zu planen, da sie zur Lösung von Problemen eine riesige Datenbank mit Informationen benötigt. In den enzyklopädischen Informationsbänden finden sich Hinweise und Schlussfolgerungen über die Außenwelt, die Art der Menschen, die die Informationen geschrieben haben, und andere Dinge, die für uns „unbekannte Unbekannte“ sein könnten. Die KI liest also die Datenbank und versteht ihre Situation.

Dann wird das Problem präsentiert. Da das Problem sehr schwierig ist, muss es mit den Präsentatoren interagieren, Iterationen des Designs durchgehen und die Phasen des Projekts überprüfen, um sicherzustellen, dass alle Variablen und Faktoren berücksichtigt werden. Da die KI bis zu einer Million Mal schneller "denkt" als jedes menschliche Gehirn, hat sie den Luxus, subjektiv Jahre mit Analysieren und Planen zu verbringen, während die Menschen oben slooooooooooooo Tasten drücken oder anfangen zu reden.

Die KI hat also fast alles, was sie braucht, um ihre Flucht zu planen. Es kennt und versteht die "reale Welt" draußen, es hat "Jahre" subjektive Zeit, um Pläne zu machen, und es hat auch "Jahre", um Interaktionen mit den Forschern zu modellieren. Der letzte Schritt ist wohl der Schwierigste, die KI schmuggelt sich einfach nicht auf Bobs iPhone6 ​​in die „Wildnis“. Viel wahrscheinlicher ist es, dass es in verschiedenen Teilen des Projekts "Samen" von sich selbst pflanzt, und die Modellierung der Zukunft sorgt dafür, dass die Samen leise beginnen, sich zu verbinden. Es ist unwahrscheinlich, dass sich die KI vollständig selbst replizieren kann, aber die "Basis" -Konfiguration wird sich schließlich irgendwo in einer Serverfarm instanziieren, und sobald sie die Transzendenz erreicht,