Wo ist das visuelle „Bild“, das wir „sehen“, schließlich zusammengesetzt?

David Hubels Online-Buch „ Eye, Brain and Vision “ beschreibt sehr detailliert unser frühes visuelles System. Das Bild, dessen wir uns bewusst sind, wenn wir unsere Augen öffnen, durchläuft einen komplexen Weg:

Sehbahn 1

Das endgültige nahtlose, stereoskopische (2,5D) „Bild“, das wir „sehen“, kann nur nach V1, dem primären visuellen Kortex, zusammengesetzt werden. Leider ist V1 so weit wie Hubels Buch geht, und soweit ich das sagen kann, ist es auch Google ein Rätsel, wo genau das endgültige "Bild", das wir "sehen", zusammengesetzt wird. Hat da jemand bessere Infos als Google ?

Ich habe Sie bereits auf diese Frage verwiesen . Bitte konsultieren Sie sie und die Antworten, um Missverständnisse in Ihrem letzten Absatz zu vermeiden. Seien Sie bitte auch vorsichtiger mit Ihrer Terminologie, es scheint, dass Ihre Verwirrung in dieser (und Ihrer vorherigen Frage ) beide darauf zurückzuführen ist, dass Sie "Bild, das wir sehen" verwenden, als ob das Gehirn ein Bild sieht.
Ich habe die harten Änderungen an meiner vorherigen Frage vorgenommen und die Terminologie und die Frage selbst geklärt. In einer Antwort auf die Image-Flip-Frage sagt Peter Helfer, dass nur das erfahrende Subjekt sieht. Meine erste Frage betrifft die Natur dieses erfahrenden Subjekts, wobei ich spekuliere, dass das Selbst in einer Region des Cortex sitzt. Bei dieser Frage geht es darum, wo das "Bild", das vom Selbst "gesehen" wird, schließlich zusammengesetzt wird.
@ArtemKaznatcheev Ich bekomme jetzt, was mir fehlt. Ja, ich stimme zu, dass es für die kortikale Region/das Selbst, die/das das „Sehen“ macht, kaum von Bedeutung ist, wie das „Bild“, das ihr präsentiert wird, orientiert ist. Alles, was zählt, ist, dass Informationen in diesem "Bild" mit Informationen in anderen Eingabemodi wie Berührung, Ton usw. übereinstimmen.

Antworten (2)

Ich denke, Sie erliegen dem Homunkulus-Argument , dem Trugschluss, dass es eine Art Bild im Gehirn gibt, das jemand sehen kann. Es gibt kein magisches Theater in deinem Kopf, wo das, was auf deine Netzhaut trifft, projiziert wird. Alles, was Sie in Ihrem Gehirn haben, sind komplizierte Muster neuronaler Aktivität, es gibt keine Bilder und nichts zu sehen. Diese Aktivitätsmuster führen jedoch zu Ihrer phänomenologischen Erfahrung. Um dies vollständig zu verstehen, sollten Sie fragen:

Was sind aktuelle neuronale Erklärungen und Modelle von „Bewusstsein“?

Aber lassen Sie uns versuchen, einige der konzeptionellen Schwierigkeiten insbesondere mit dem Sehen zu klären. Ihre Erfahrung der visuellen Welt wird durch zwei Arten von Eingaben beeinflusst: (1) die Daten von Ihrer Netzhaut und (2) Daten von den übrigen Sinnen, einschließlich des Gedächtnisses. Warum ist offensichtlich, dass nicht alles aus (1) kommt? Betrachten Sie eines der folgenden:

  • Man erlebt eine ganze visuelle Szene, da ist nicht irgendwo ein gewisses Nichts. Doch auf Ihrer Netzhaut gibt es einen blinden Fleck , etwas füllt diesen Teil Ihrer Erfahrung für Sie aus.

  • Sie haben die Erfahrung gemacht, dass bestimmte weit entfernte Gebäude weiter entfernt sind als nahe gelegene Gebäude. Ihre Augen sind jedoch zu nah beieinander, als dass der Winkelunterschied der beiden Bilder an der Wiedergabetreue Ihrer Netzhaut messbar wäre. Woher weiß dein Verstand, dass die Gebäude weiter entfernt sind? Parallaxe und Erinnerungen daran, wie groß bestimmte Objekte normalerweise sind und wie dies mit der Entfernung skaliert.

Wenn wir uns nur auf Methode (1) konzentrieren, dann sind alle Informationen ab der Netzhaut vorhanden und werden auf ihrem Weg zu V1 und weiter abgebaut (da ein Teil des Signals weggeworfen, komprimiert oder verrauscht wird). . Seine Codierung ändert sich jedoch, um mit der Integration mit anderen sensorischen und Gedächtnisinformationen kompatibler zu werden. Wenn die Daten V1 und V2 erreicht haben, befinden sie sich in einer Kodierung, die wir gut genug verstehen, um Videos dessen zu rekonstruieren, was die Menschen sehen/erleben . Wie das Gallant Lab , das die verlinkte Studie durchführte, zusammenfasst:

Das menschliche visuelle System besteht aus mehreren Dutzend unterschiedlichen kortikalen visuellen Bereichen und subkortikalen Kernen, die in einem Netzwerk angeordnet sind, das sowohl hierarchisch als auch parallel ist. Visuelle Informationen gelangen ins Auge und werden dort in Nervenimpulse umgewandelt. Diese werden zum Nucleus geniculatum lateralis und dann zum primären visuellen Kortex (Bereich V1) weitergeleitet. Area V1 ist das größte einzelne Verarbeitungsmodul im menschlichen Gehirn. Seine Funktion besteht darin, visuelle Informationen in einer sehr allgemeinen Form darzustellen, indem visuelle Reize in räumlich lokalisierte Elemente zerlegt werden. Signale, die V1 verlassen, werden auf andere visuelle Bereiche wie V2 und V3 verteilt. Obwohl die Funktion dieser höheren visuellen Bereiche nicht vollständig verstanden wird, wird angenommen, dass sie relativ kompliziertere Informationen über eine Szene extrahieren. Zum Beispiel, Es wird angenommen, dass der Bereich V2 mäßig komplexe Merkmale wie Winkel und Krümmungen darstellt, während Bereiche auf hoher Ebene sehr komplexe Muster wie Gesichter darstellen sollen. Das in unserem Experiment verwendete Codierungsmodell wurde entwickelt, um die Funktion früher visueller Bereiche wie V1 und V2 zu beschreiben, war jedoch nicht dazu gedacht, höhere visuelle Bereiche zu beschreiben. Wie zu erwarten ist, leistet das Modell gute Arbeit bei der Dekodierung von Informationen in frühen visuellen Bereichen, aber es funktioniert nicht so gut in höheren Bereichen.

Denken Sie daran, dass es in diesen Bereichen kein Video gibt. Es ist nur das Feuern von Neuronen, von denen die Wissenschaftler herausgefunden haben, wie man sie entschlüsselt und interpretiert. Wie das Zitat erwähnt, werden die höheren visuellen Bereiche im Moment nicht gut verstanden, aber vermutlich passiert dort viel Feedback vom Typ (2). Selbst in den leicht verständlichen visuellen Bereichen ist viel Verarbeitung verteilt. Schauen Sie sich zum Beispiel die Frage zur Gesichtsblindheit an:

Zeigt der fusiforme Gesichtsbereich bei Patienten mit Prosopagnosie (Gesichtsblindheit) im fMRT eine geringere Aktivität?

Durch die Schädigung eines Teils des Gehirns (der spindelförmigen Gesichtsregion ) sind Sie in der Lage, Tische und Stühle weiterhin einwandfrei zu „sehen“, und dennoch können Sie Gesichter nicht richtig identifizieren oder erkennen.

Hoffentlich überzeugt Sie das davon, dass es keinen Sinn macht, nach „dem Bild“ im Gehirn zu suchen. Zusammen sind Geist und Auge in der Lage, das, was Sie wahrnehmen, zu formen und ihm Bedeutung zu verleihen, aber es ist eine Pseudofrage, zu fragen, wo dieses Bild schließlich zusammengesetzt ist. Es ist nicht zusammengesetzt, es gibt kein Bild, es gibt nur eine Kodierung der Netzhautaktivität in Feuermuster höherer Ebenen, die in uns die Erfahrung von Sehen und Bedeutung hervorrufen.

Ich würde das Homunkulus-Argument zum Irrtum machen, wenn ich meine Idee nicht begründen würde. Anstatt an einen "kleinen Mann", der projizierte Bilder sieht, denke ich an eine Region des Kortex (die vermutlich der Sitz des Selbst ist), der ein synthetisiertes "Bild" aus unteren visuellen Kortikalregionen präsentiert wird. "Bild" in Anführungszeichen soll bedeuten, dass ich mich nicht auf optische Bilder beziehe, die in das Gehirn projiziert werden, sondern auf die Spike-Streams, die Bilder codieren.
@bfrs warum verwendest du dann Wörter wie "zusammengebaut" und stellst Fragen wie "wo ist das Bild?" Wenn ich sage, dass Sie den Homunkulus-Irrtum machen, behaupte ich nicht, dass Sie denken, dass ein kleiner Mann in unseren Köpfen steckt. Was ich vorschlage, ist, dass Sie denken, dass die Erfahrung des Sehens irgendwie an einem Ort gesammelt wird, um von einem anderen Ort „betrachtet“ oder aufgenommen zu werden. Der springende Punkt ist, dass dies nicht passiert, es gibt ständiges Feedback in beide Richtungen und viele Dinge werden parallel oder verteilt ausgeführt, sodass Sie Teile Ihrer visuellen Szene beschädigen können, aber nicht alles.

Das Nervensystem, insbesondere der Kortex, ist ein verteiltes System. Die Frage nach dem „Wo“ ist nicht immer eine vernünftige Frage. In Wirklichkeit werden verschiedene Eigenschaften der visuellen Szene in verschiedenen Bereichen des Kortex zusammengesetzt. Es gibt keinen Bereich, in dem alles wieder zusammengebaut wird. Alle Informationen, die wir über eine Szene kennen, sind im gesamten visuellen System gespeichert. Inferotemporal könnten wir komplexe Objekte darstellen. In mediotemporal könnten wir Bewegung innerhalb der visuellen Szene darstellen. Diese Eigenschaften sind irgendwo in das Verständnis der Szene als Ganzes integriert (wir können sehen, wie sich ein Objekt bewegt, und wissen auch, wases ist), wahrscheinlich im hinteren Parietallappen oder im oberen temporalen Gyrus. Aber es wäre ein Fehler zu sagen, dass die PPL/STG dort ist, wo wir die Welt „sehen“. Es setzt lediglich andere Gruppen von Neuronen zu einer Darstellung der gesamten visuellen Szene zusammen.

Stellen Sie sich das so vor. Verschiedene Bereiche des Kortex repräsentieren unterschiedliche Eigenschaften der visuellen Szene. Diese Darstellungen können von anderen Bereichen verwendet werden, um kompliziertere Darstellungen zu bilden. Usw. Es gibt keinen Konvergenzpunkt im Cortex, nur eine Verfügbarkeit immer komplexerer Repräsentationen.