Beim Reinforcement Learning wird stark zwischen modellbasierten und modellfreien Lernalgorithmen unterschieden, wobei modellfreie Methoden keine expliziten Informationen über die Dynamik der Umgebung verwenden.
Es scheint, als hätte diese Unterscheidung eine Entsprechung im menschlichen Lernen, aber es fällt mir sehr schwer, eine Erwähnung davon zu finden. Vielleicht würde es Konditionierung gegenüber eher kognitiven Formen des Lernens sein? Ich wäre überglücklich, wenn jemand einen Artikel finden könnte, der den Begriff „modellfrei“ verwendet, um sich auf einen Aspekt des menschlichen Lernens zu beziehen, oder mich einfach davon überzeugen könnte, dass der Begriff das richtige menschliche Analogon ist.
Existiert Forschung zum menschlichen Lernen mit einer modellfreien/modellbasierten Unterscheidung?
Gemäß den Kommentaren zu der Frage gibt es Humanforschung, die diese Unterscheidung beobachtet. CHCH spielt möglicherweise auf einen Artikel von Gläscher, Daw, Dayan und O'Doherty (2010) an, der den Unterschied zwischen modellfreiem Lernen und modellbasiertem Lernen prägnant definiert:
Reinforcement Learning (RL) nutzt sequentielle Erfahrungen mit Situationen („Zuständen“) und Ergebnissen, um Handlungen zu bewerten. Während modellfreies RL diese Erfahrung direkt in Form eines Belohnungsvorhersagefehlers (RPE) verwendet, verwendet modellbasiertes RL sie indirekt, indem es ein Modell des Zustandsübergangs und der Ergebnisstruktur der Umgebung erstellt und Aktionen durch Suche danach bewertet Modell.
Gläsert al. (2010) berichten fMRI-Beweise für neuronale Aktivität, die mit modellbasiertem Lernen im menschlichen intraparietalen Sulcus und lateralen präfrontalen Kortex vereinbar ist, und für modellfreies Lernen im ventralen Striatum. Sie schließen:
Dieser Befund unterstützt die Existenz von zwei einzigartigen Formen von Lernsignalen beim Menschen, die die Grundlage für unterschiedliche Rechenstrategien zur Verhaltenssteuerung bilden können.
CHCH
Artem Kaznatcheev
zergylord
Chuck Sherrington
zergylord
Steven Jeuris
Seanny123