Können Sie mir bitte eine sehr kurze Erklärung zu allen Funktionen in der ventralen Stromarchitektur geben, die in dieser Abbildung zusammengefasst sind:
Diese Zahl stammt aus Serre et al.'s Eine quantitative Theorie der unmittelbaren visuellen Erkennung . Prog Brain Res. 2007.
Ich habe mehrere Artikel über dieses Modell gelesen, verstehe aber immer noch nicht das grundlegende Ziel, insbesondere hinter den beiden Operationen (Gauß-ähnliche und max-ähnliche Operationen). Kann mir also bitte jemand den ventralen Stromweg im Detail erklären ( von V1-V2-V4-IT-PFC) einschließlich der beiden Operationen in diesem Modell.
Zum Beispiel: Ich verstehe nicht, wie die Zellen in S1 aufgebaut sind ...
Dies ist eine typische Berechnungsarchitektur, die als Modell für den ventralen Strom der visuellen Verarbeitung bei Primaten vorgeschlagen wird . Es hat eine lange Geschichte (z. B. Neocognitoron von Fukushima war 1980 ) und immer noch weit verbreitet in maschinellem Lernen (z. B. Deep Learning ) und Neurowissenschaften.
Es wird durch die Organisation von V1 einfachen Zellen und komplexen Zellen motiviert. Einfache Zellen in V1 können ungefähr als Kantendetektoren an einer bestimmten Stelle der Netzhaut angesehen werden. Aus diesem Grund werden sie in der von Ihnen zitierten Abbildung als Kreis mit einem Balken dargestellt (ein Cartoon-Empfangsfeld). Die einfachen Zellen können nur sehr lokal Dinge erkennen, dh wenn die Kante an einer anderen Stelle in Ihrem Sichtfeld erscheint, reagiert sie nicht.
Mathematisch können Sie sich einen räumlichen Filter vorstellen, der eine Kante (z. B. orientiertes Gabor-Patch) erkennt, die mit Ihrem Netzhautbild multipliziert und summiert wird. Zum Beispiel erkennt der unten stehende Filter eine Übereinstimmung mit einem 45-Grad-Balken, der auf dem Bereich mit heißen Farben ausgerichtet ist, hat aber weniger Aktivität, wenn der Balken aus der spezifischen Position verschoben wird.
Andererseits sind die komplexen Zellen in V1 immer noch ein Kantendetektor, weisen aber eine gewisse Ortsinvarianz auf. Mit anderen Worten, wenn die Kante leicht verschoben ist, scheint sich die Reaktion komplexer Zellen nicht zu ändern. Es wird angenommen, dass dies darauf zurückzuführen ist, dass komplexe Zellen aus mehreren einfachen Zellen mit der gleichen Ausrichtung ziehen. Dies ist, was Sie in Ihrer Abbildung sehen, wo eine einzelne komplexe Zelle Informationen aus einfachen Zellen mit derselben Ausrichtung, aber an unterschiedlichen Orten, abruft.
Mathematisch kann eine Soft-Max-Operation oder eine Max-Operation über die einfachen Zellenausgänge zu einem guten komplexen Zellenmodell führen. Aber es ist nicht auf solche Operationen beschränkt. Tatsächlich werden auch quadratische oder andere nichtlineare Modelle in der Computational Neuroscience häufig verwendet.
Die vollständige Hierarchie für den ventralen Strom wird dann einfach durch wiederholtes Erweitern unter Verwendung der Simple-Cell-Complex-Cell-Analogie erhalten. Für jeden Stapel extrahiert die einfache Zellschicht ein lokales Merkmal (durch Berechnung der Ausgabe der komplexen Zelle der vorherigen Schicht), und die komplexe Zellschicht macht sie räumlich unveränderlich. Von Kanten in V1 kann man Ecken auf der nächsten Ebene erhalten, dann komplexe Konturen und den ganzen Weg bis zu Objekten. So geht zumindest die Geschichte.
Memmen
Christina
Memmen
Christina
Memmen
Christina
jonska
Christina
Memmen