Sind 2 Augen für 3D-Sehen notwendig?

Gleich vorweg: Ich bin kein Biologie-Student, sondern Informatik-Student

Ich habe immer verstanden, dass der Mensch zwei Augen hat, damit wir 3D sehen können: Das linke Auge sieht mehr von der linken Seite eines Objekts als das rechte Auge und umgekehrt, dies hilft uns unter anderem, die Tiefe einzuschätzen.

Wenn ich jetzt ein Auge schließe, kann ich immer noch Tiefe wahrnehmen: Ich nehme an, das liegt daran, dass mein Gehirn die Lücken füllt? Wie lange funktioniert das? Verlieren Menschen irgendwann die Tiefenwahrnehmung (oder lässt sie zumindest deutlich nach), wenn sie ein einzelnes Auge verlieren?

Wenn ja, wie niedrig ist es? Wenn nicht, sind wir offensichtlich in der Lage, alles mit einem Auge wahrzunehmen: Warum haben wir dann zwei (außer Redundanz und einem größeren Sichtfeld? Was spricht dafür, die Evolution des Menschen besser zu betrachten, wenn man 2 Augen hat im Gegensatz zu 1 oder 3,4 ,..?

Hier ist ein Open-Access-Artikel über monokulare Stereopsis, der interessant sein könnte: researchgate.net/publication/… .. Wie gesagt, dies könnte für die Kognitionswissenschaft SE sehr gut geeignet sein.
@Kendall +1 für ordentlichen Artikel. Aber ich bin nicht einverstanden, die Frage zu migrieren.
Ich denke, Entfernung kann mit Informationen aus der Brennweite des Objektivs wahrgenommen werden, aber das reicht für 3D-Sehen nicht aus.
Versuchen Sie, einen Freund dazu zu bringen, mit Ihnen einen Ball hin und her zu werfen. Versuchen Sie dann, ein Auge zu schließen, während Sie den Ball kontinuierlich werfen. Ich denke, Sie werden von den Ergebnissen überrascht sein, wenn sie die gleichen sind wie meine. Aus meiner Erfahrung wird es in der Tat extrem schwierig, die für die Aufgabe erforderlichen Urteile mit nur einem Auge zu treffen.
Ich kann die 3D-Struktur eines Objekts in der Hand aus verschiedenen Perspektiven genau verstehen, wenn ich mit einem Auge sehe. Ist es nicht normal?

Antworten (2)

Anscheinend leidest du unter einem Denkfehler. "Das linke Auge sieht mehr von der linken Seite eines Objekts ..." ist nicht die Art und Weise, wie die Entfernungswahrnehmung funktioniert. Sonst könnten wir die Entfernung zu flachen Objekten wie Verkehrsschildern und Schießscheiben nicht einschätzen.

Der eigentliche Mechanismus ist die Parallaxenschätzung oder binokulare Disparität . Kurz gesagt, je näher ein Objekt an Ihren Augen ist, desto größer ist der Unterschied seiner Position auf der Netzhaut des linken und rechten Auges.

Sie können ein einfaches Experiment durchführen: Finden Sie einen Ort, an dem mehrere parallele Drähte in der Luft hängen: eine Zugleitung oder eine Telefon-/Stromleitung. Betrachten Sie die Drähte normal, und sie erscheinen nur als schwarze Linien am Himmel, ohne Entfernungswahrnehmung. Neigen Sie jetzt Ihren Kopf zur Seite, und Sie werden sofort ein Gefühl dafür bekommen, welcher näher und welcher weiter entfernt ist. Warum der Unterschied? Da jede Verschiebung eines horizontalen Drahtes das gleiche Bild ergibt, ist der Unterschied bei vertikalen Drähten offensichtlich.

Wenn Sie ein Auge schließen, verliert Ihr Gehirn die Fähigkeit, die Parallaxe abzuschätzen. Es bleiben jedoch mehrere Optionen:

  1. Visuelle Hinweise. Wenn ein Objekt ein anderes überlappt, ist es offensichtlich näher. Wenn zwei Objekte gleich aussehen, aber eines kleiner ist, ist es wahrscheinlich weiter entfernt (oder ein Kind). Wenn Sie die erwartete Größe eines Objekts (eines Berges/eines Pferdes/einer Fliege) kennen, können Sie auch das Gefühl der Entfernung bekommen.
  2. Fokussierabstand. Wenn Sie Ihr Auge auf ein nahes und ein fernes Objekt richten, sind die Gefühle unterschiedlich.
  3. Erinnerungen. Du erinnerst dich an das, was du mit zwei Augen gesehen hast.

Von diesen hängt nur (3) vom vorherigen binokularen Sehen ab. (1) und (2) sind sogar für diejenigen verfügbar, die mit einem Auge geboren wurden. Die Parallaxenschätzung ist jedoch viel schneller und präziser. Mit einem Auge können Sie eine Fliege an der Wand treffen, aber sie in der Luft zu fangen, wird extrem schwierig sein.

Eigentlich gibt es 4. den Kopf (oder den ganzen Körper) zu bewegen, um verschiedene Blickwinkel zu bekommen. Das menschliche Gehirn ist für diesen Ansatz perfekt angepasst und Computergrafiken „missbrauchen“ es häufig, weil der 2D-Bildschirm jedes binokulare Sehen oder Hinweise auf die Fokussierentfernung auslöscht. Deshalb werden 3D-Objekte häufig langsam rotierend dargestellt.
Als jemand, der auf einem Auge blind ist, kann ich bestätigen, dass Option 1 unter den meisten Umständen ziemlich gut funktioniert und Option 2 viele der anderen abdeckt. Sie funktionieren jedoch nicht gut bei sich schnell bewegenden Objekten.
Edit01 (here and scattered throughout)  

[Ich will nicht antagonistisch sein … aber zugegebenermaßen etwas defensiv.]
Soweit das Folgende ein Zitat aus einem bestehenden Werk ist, handelt es sich um den unten stehenden Artikel von Martin und Foley, S. 165-185 (mit einer vermerkten Ausnahme) – wobei noch einmal darauf hingewiesen wird, dass ich dies vor Jahren gelesen und nicht konsultiert habe (oder irgendetwas anderes). wenn ich das Folgende schreibe… und (erneut), dass ich bedenke, dass, obwohl dies als Wissenschaft studiert werden kann, das meiste Wurzelwissen (natürlich) angeboren und implizit ist und von jedem Erwachsenen explizit gemacht werden könnte, der es noch nicht hatte also (wie im folgenden Beispiel). (Es ist natürlich theoretisch möglich, dass ich andere Quellen zum gleichen Material gelesen habe. Soweit es mich betrifft, würden die meisten modernen Erwachsenen hier fast alles weder aufschlussreich noch umstritten finden, mit Ausnahme der Helligkeit (für die ich keine Quelle habe ),
Die atmosphärische Färbung ist insofern eine Ausnahme, als man damit herausfinden kann, dass Luft blau ist (im Gegensatz zu dem Wissen, dass Luft blau ist, um einem offensichtlichen Phänomen einen Sinn zu geben).
Helligkeit ist eine Ausnahme, in deren Fall ich tatsächlich eine Referenz hätte angeben sollen … außer dass ich sie, wie erwähnt, nicht in dem erwähnten Lehrbuch sehen kann und daher keine Ahnung habe, wo ich sie gehört habe (wobei ich anmerke, dass ich eine habe Erinnerung an die Aufregung, dies zu lernen (oder möglicherweise auszuarbeiten)).
Weitere Zitatanomalien und -unterschiede wie angegeben.

End — Main Body of  Edit01.  

Original, with references in “[]” added.  

Aus dem Gedächtnis, da sonst niemand darüber berichtet hat … .

Dies ist eher eine psychologische Frage (wie unten).

3D-Vision nutzt etwa sieben verschiedene Mechanismen. Binokulares Sehen macht nur zwei davon aus.
• Okklusion – jedes Auge sieht leicht unterschiedliche Bereiche eines teilweise verdeckten Objekts. [(„Occlusion“ schlägt auch das monokulare Thema „Interposition“ weiter unten vor.) Als binokulares Phänomen bezeichnen Martin und Foley (S. 183) diese „binokulare Disparität“, bei der es sich [auf den ersten Blick] tatsächlich um das Bild desselben handelt Objekt, das auf „andere“ – ich würde sagen „nicht übereinstimmende“ – Bereiche der Netzhaut fallen (in Abhängigkeit davon, ob es näher an, auf oder weiter von der Brennweite entfernt ist). [Nach einem kurzen Blick] scheinen sie nicht die Tatsache zu verbergen, dass ein Auge tatsächlich mehr von einem teilweise verdeckten Objekt sehen wird (was bedeutet, dass ich keine Ahnung habe, wo ich es gehört habe (und ich denke, dass ich es gut herausgefunden haben könnte mich selbst)).
• Fokus – Sie müssen beide Augen auf ein Objekt fokussieren, um es unscharf zu sehen; Ihr System kennt (relative) Augenpositionen und Motiventfernung. Dies beinhaltet sowohl das Fokussieren der Linse im Auge [„Akkommodation“ [p167] ist die Linsenform] als auch das Richten beider Augen auf das Objekt [„Konvergenz“ [p182] ist die Augen, die sich aufeinander zuwenden].
Binokulare Okklusionsinformationen funktionieren nur bis etwa (aus dem Gedächtnis) 2 m [„10 Fuß“ Martin und Foley p183]. Dies würde durch weiter auseinander liegende Augen verstärkt werden. (Fokus funktioniert auf eine viel größere Entfernung; ich bin mir nicht sicher, welcher der beiden oben genannten Aspekte nützlicher ist, aber ich vermute, dass es die Linsenform ist (und dass sie ungefähr gleich nützlich sind). [Martin und Foley erwähnen „10 Füße“ (S. 167), die Hochberg (1971) für die Akkommodation (Linsenform) zitieren…, scheinen dies jedoch als unmittelbar willkürlich gewählt zu haben.

Andere (monokulare) 3D-Sichthinweise umfassen die folgenden.
• Objektgröße – viele Objekte haben eine Standardgröße [„gewohnte Größe“, S. 167], und fast alle Objekte haben unterschiedliche Proportionen (wie etwa die Beindicke), je nachdem, wie groß und schwer sie sind [was Martin und Foley nicht abdecken; die Quelle bin ich]… und ein weiter entferntes Objekt hat eine kleinere Bildgröße. [Seiten 167-169 „Größenhinweise“, „relative Größe“.]
• Helligkeit – jedes gegebene Objekt wird aus größerer Entfernung weniger Licht in das Auge reflektieren (weil das Auge ein kleineres Ziel in größerer Entfernung ist). (Dies ist nützlicher und wichtiger, als man denkt.) [Nach einer kurzen Überprüfung scheint dies nicht im notierten Text zu sein. Ich glaube nicht (besonders), dass ich das für mich selbst herausgefunden habe, aber wenn es nicht in diesem Text steht, dann habe ich keine Ahnung, wo ich es gehört habe.]
• Perspektive – Viele Arten von Objekten (z. B. Straße, Weg, Mauer, Fluss) haben eine stabile Breite oder ähnliches oder analog, und diese wird mit zunehmender Entfernung eine zunehmend kleinere Bildgröße haben. [„lineare Perspektive“, Seite 170.]
• Textur – Viele Objekte haben eine bekannte Textur (oder (angenommen) eine regelmäßige Textur), und die Bildgröße der Details der Textur nimmt mit zunehmender Entfernung ab. Dies funktioniert auch für Gruppen von Tieren und Blättern und dergleichen. [S. 169-170.]
• Lufttönung – je weiter ein Objekt entfernt ist, desto mehr wird es durch den dazwischenliegenden Stickstoff blau gefärbt. [„atmosphärische Perspektive“ p170. Martin und Foley sagen auch, dass weiter entfernte Objekte „blurr/y/“ erscheinen. Ich würde sagen, das liegt hauptsächlich daran, dass wir für ein weiter entferntes Objekt eine geringere Sehschärfe haben (weil die Bildgröße kleiner ist); Martin und Foley führten es auf Störungen durch Luftpartikel zurück.]
• Die Physik der Bewegung – Geschwindigkeit und Beschleunigung können informativ sein. [Martin und Foley behandeln diesen Bereich auf den Seiten 174-176. Ich dachte an … was ich gesagt hatte. M&F erwähnen „Bewegungshinweise“ (die Klasse), „Bewegungsparallaxe“ (bei der sich das Motiv seitlich bewegt und mehrere stationäre Objekte), „Bewegungsperspektive“ (bei der sich das Motiv in jeder Umgebung hin- oder wegbewegt) und „kinetisch Tiefeneffekt“ (wobei es um scheinbare 3D-Eigenschaften bei rotierenden Objekten geht und angeblich nicht um Entfernung).]

[Andere monokulare Gegenstände, die Martin und Foley erwähnen … . • Schattierung [p170] – Objekte können Schatten auf andere Objekte werfen. Ich würde sagen, dass es hier primär nicht um Distanzwahrnehmung geht. • Interposition [p167] — das nähere Objekt verdeckt einen Teil des weiter entfernten Objekts (oder nicht). • Höhenhinweise [S. 173-174] – Meine Meinung dazu ist, dass auf ebenem Boden (und weil sich der Betrachter über dem Boden befindet) ein Objekt, das weiter entfernt ist, seine Basis näher am Horizont hat und somit visuell höher ist … und , für Objekte in der Luft würde ich hier nur sagen, dass es komplizierter ist.]

Die Konzentration ist sehr wertvoll, um beispielsweise einen Ball zu fangen, während bei einer Aufgabe wie dem Fahren [mit einem Auge] viel mehr 3D-Informationen verfügbar sind. [Quelle: Ich habe das mit Denken herausgefunden. …Also bin ich es.]

Was mehr als 2 Augen anbelangt, würde ein vertikaler Abstand der Augen (sowie der vorhandene horizontale Abstand) zusätzliche Okklusionsinformationen liefern, aber der Gewinn wäre minimal. [Quelle: Ich habe das mit Denken herausgefunden. …Also bin ich es.]

Source  

Die Quelle ist ein benutzerdefiniertes Buch – das heißt „Benutzerdefiniertes Buch“, das „eine Zusammenstellung von Kapiteln aus … [bestehenden] Titeln von Pearson Education Australia“ ist. Das Verlagslogo „Prentice Hall“ erscheint, aber nur als Logo und nicht auf dem Cover.
Das Custom Book ist „PSYC236 Cognition and Perception“, ©2001, Pearson Education Australia Pty Ltd. Es ist „Sourced from: Sensation and Perception 4th Edition“, ©2001, Martin and Foley.
Das zitierte Material stammt aus einem Kapitel mit der Nummer 6, was seine Nummer im Original-/Quellenbuch zu sein scheint; dito für die Seitenzahlen.

Aber die Frage basiert auf einem Missverständnis oder einer Umkehrung der Kausalität. "Menschen haben 2 Augen, damit wir 3D sehen können" ist rückwärts. Wir haben 3D-Sehen, weil wir zwei Augen haben. Wir haben zwei Augen, weil wir, wie alle Wirbeltiere (und Insekten &c), bilateral symmetrisch sind und zwei (oder Paare) von so ziemlich allem haben. Aber zum Beispiel Seesterne mit 5-zähliger Symmetrie haben 5 Augen.
Willkommen bei Biology.SE! Während dies Teil einer guten Antwort sein könnte, ist es viel wahrscheinlicher, dass Antworten eine positive Antwort erhalten, wenn Sie unterstützende Referenzen hinzufügen (Primärliteratur ist am besten). Ohne diese Unterstützung ist Ihre Antwort nicht von Ihrer Meinung zu unterscheiden und daher für diese Site nicht geeignet. Dies ist ein gutes Beispiel für die Formatierung von Referenzen . ——— Vielleicht möchten Sie auch an der Tour teilnehmen und dann die Seiten des Hilfezentrums konsultieren , um weitere Ratschläge zum effektiven Antworten auf dieser Website zu erhalten. Vielen Dank! 😊
@jamesqf Äh, ich denke, das OP ist ein bisschen verwirrt, aber ich denke, ihre Frage geht eher in die Richtung "Warum kann ich immer noch Tiefe mit nur einem Auge wahrnehmen?". "Wir haben 3D-Sehen, weil wir zwei Augen haben" ist nicht wahr - es gibt mehrere monokulare Tiefenhinweise, die uns ebenfalls 3D-Sehen ermöglichen. Menschen, denen physisch ein Auge fehlt oder die Amblyopie haben, sehen immer noch in 3D. Darüber hinaus haben viele andere Säugetiere ein schlechtes stereoskopisches Sehen, obwohl sie zwei Augen haben. Unsere Qualität des Stereosehens ist eine adaptive Eigenschaft, die wir mit anderen Säugetieren wie anderen Primaten und Fleischfressern (und Nicht-Säugetieren wie Greifvögeln) teilen.
Zusammenfassend denke ich, dass diese Antwort die gestellte Frage perfekt beantwortet. Es fehlen nur Referenzen, wie im Banner angegeben und von tyersome hervorgehoben.
@Bryan Krause: Richtig, und auch binokulare Stereopsis funktioniert nur bei relativ nahen Objekten. Haben Sie zum Beispiel jemals den übertriebenen 3D-Effekt bemerkt, wenn Sie ein ziemlich nahes Motiv mit einem guten Fernglas betrachten?
Dass die folgenden 3D-Sichthinweise verfügbar sind, ist notwendigerweise wahr (angesichts der Schwerkraft et al.): Okklusion, Linsenfokussierung, Augenfokussierung, Objektgröße, Helligkeit, Perspektive, Textur, Lufttönung, Beschleunigungsphysik (was natürlich alles ist Sie). Jedes Lehrbuch über die Psychologie des Sehens wird diese erwähnen. (Ich kann meine ausgraben, wenn dies tatsächlich helfen würde?) Ich glaube nicht, dass ich jemals einen Versuch gelesen habe, zu erklären, wie das menschliche Sehsystem diese Informationen nutzt .
Theoretisch könnte ich eine große Suche nach der Erwähnung von Experimenten durchführen, die zeigen, dass wir sie verwenden ? Ich denke jedoch, dass eine vernünftige Person {die Tatsache, dass die Elemente in der Liste unbedingt dorthin gehören} als ausreichend akzeptieren könnte. …Also nehme ich das als eine weitere persönliche Kränkung.