Adobe Illustrator hat über fünf Minuten (und zählen) gebraucht, um ein um 18° gedrehtes 2D-Vektorbild auf meinem Computer in 3D zu rendern. Und doch kann ich und fast jeder andere leicht das fast augenblicklich gedrehte Motiv visualisieren und das Objekt mit geringem Aufwand kontinuierlich in Echtzeit vor dem geistigen Auge drehen.
Ich frage nicht, wie das Gehirn Repräsentationen von Objekten speichert , da dies eindeutig zur Debatte steht. Aber wie strukturiert das Gehirn seine interne Repräsentation von visuellen 3D-Daten?
Es ist fast definitiv nicht in einem pixelbasierten Format, wie gezeigt werden kann, indem man einfach ein Objekt irgendeiner Art visualisiert und dann mental auf ein Detail zoomt und feststellt, dass das Bild seine Schärfe behält. Es ist wahrscheinlich auch nicht das Zerlegen von Objekten in geometrische Formen, denn zumindest stelle ich mir meine Freunde nicht als Strichmännchen vor. Es könnte ein Vektorformat sein , aber dann sollte es einfacher sein, komplexe Formen zu visualisieren, die mathematisch einfach sind, wie diese:
Es scheint also, dass das Gehirn ein anderes Format verwendet. Wie funktioniert das nach bestem Wissen der modernen Kognition?
Diese Frage kann nicht in der Form beantwortet werden, in der Sie sie gestellt haben, sowohl wegen der Grenzen der aktuellen neurowissenschaftlichen Theorien und Methoden, wenn es darum geht, die Strukturen komplexer neuronaler Repräsentationen zu bestimmen (obwohl wir in einigen Fällen wie Ortszellen und Gitterzellen) und weil neuronale Repräsentationen nicht wirklich analog zu unseren umgangssprachlichen Konzepten einfacher Abbildungen von Zahlen auf Bilder sind (z. B. Pixel, Vektor, Wavelet usw. Grundlagen für die digitale Bilddarstellung).
Ich möchte Sie ermutigen, nicht nur in Bezug auf diese Darstellungsformate zu denken, die von Computerarchitekturen im Von-Neumann-Stil (dh normalen Computern) mit getrennten Verarbeitungs- und digitalen Speichersystemen bevorzugt werden, sondern in Bezug auf einen neuronalen Computer mit verteilter Berechnung und Speicher. Neurowissenschaftler denken typischerweise, dass die neuronale Repräsentation in der visuellen Wahrnehmung in einer Reihe von Stadien zunehmender Abstraktion auftritt. Auf der Netzhaut wird das Bild grob in Form von Pixeln dargestellt, aber es ist wirklich nur eine Reihe von Fotosensoren und daran befestigten Neuronen, die aktiviert werden, wenn Licht an verschiedenen Stellen mit unterschiedlichen Frequenzen und Amplituden auf die Netzhaut trifft. In V1 oder primärem visuellen Kortex, erfolgt die Darstellung im Hinblick auf das, was man sich als "Randdetektoren" vorstellen kann. In V2 werden die Zellen auf eine Vielzahl von etwas komplexeren Eigenschaften abgestimmt, wie z. B. Orientierung, Raumfrequenz, Farbe und binokulare Disparität (eine wichtige Information für die 3D-Wahrnehmung). Wenn Sie durch V3, V4, V5 aufsteigen , und V6 werden die Darstellungen immer komplexer, bis sie Informationen über die Struktur des zugrunde liegenden Konzepts selbst enthalten.
Die Dreidimensionalität tritt erst ein, wenn die visuellen Informationen von beiden Augen mit Top-Down-Informationen darüber kombiniert werden, wie die Dinge in der Welt zu sein scheinen (die auch von anderen Sinnen und Erfahrungen stammen), um auf die wahrscheinliche Form zu schließen das Objekt. Es ist unklar, ob es einen Ort im Gehirn gibt, an dem ein Bild explizit als 3D-Modell eines visuellen Objekts dargestellt wird. Wahrscheinlicher sind die rohen Wahrnehmungsdaten wie Farben und Muster in einem Bereich dargestellt und mit der stärker objektzentrischen strukturellen Repräsentation in einem anderen Bereich verbunden, und diese Zuordnung bewirkt die Co-Aktivierung aller Neuronen, die für die Wahrnehmung des Objekts in relevant sind Es ist eine dreidimensionale Form.
Wir können uns dies auch im Sinne der zeitgenössischen Theorie der enaktiven Wahrnehmung vorstellen, die besagt, dass das Gehirn Informationen in Form von Kontingenzen zwischen Zustand, Handlung und Beobachtung darstellt. In dieser Theorie ist überhaupt kein „Bild“ vorhanden, sondern nur eine Reihe von neuronalen Aktivierungen, die mit früheren Erfahrungen korrelieren (wobei die Korrelationen in Form von assoziativen Verbindungen zwischen Neuronen gespeichert werden, die einen kausalen Aktivierungspfad schaffen, entlang dem „Informationen“ reisen ) und Beziehungen zwischen möglichen Aktionen (entweder motorische Aktionen auf niedriger Ebene der Netzhaut oder anderer Muskeln,
Wenn Sie mehr lesen möchten, sollten diese Quellen ein guter Anfang sein: verteiltes neuronales Gedächtnis , verteilte neuronale Repräsentation eines Prozesses höherer Ordnung , Wahrnehmung als Assoziationen zwischen Handlungen und Beobachtungen
Es gibt auch einige Quellen, die direkte experimentelle Beweise für Ihre Frage bieten, aber keine so große konzeptionelle Einführung in die neuronale Berechnung und Darstellung bieten. Siehe "Neurale Berechnungen, die der Tiefenwahrnehmung zugrunde liegen" , Binokulare Tiefenwahrnehmung und die Großhirnrinde als Anfang.
Ihre Frage bezieht sich auch auf das Drehen eines Objekts "vor dem geistigen Auge". Es gibt auch eine sehr umfangreiche Forschung zu diesem Phänomen, das als "mentale Rotation" bezeichnet wird. Der Wikipedia-Artikel ist ein guter Anfang, aber es gibt noch viel mehr über dieses interessante Phänomen zu sagen, also zögern Sie nicht, eine verwandte Frage zu stellen, wenn Sie neugierig sind!
Robin Kramer-ten Have
Der Umweltschützer
Hund
Der Umweltschützer
Ischaki
Schiene
Schiene