Wie wir aus Fehlern lernen und warum Lob kaum Einfluss darauf hat
Wissenschaftler am Leibniz-Institut stellen fest, dass Feedback-Mechanismen auch ohne Belohnung funktionieren
Funktioniert Lernen auch ohne Belohnung? Das wollten Dr. André Brechmann und Dr. Susann Wolff vom Leibniz-Institut für Neurobiologie (LIN) Magdeburg mithilfe eines Experiments herausfinden. Das Ergebnis vorneweg: Auch ohne positives Feedback durch Belohnung können Versuchspersonen durchaus schnell Strategien erlernen, um richtige von falschen Tönen zu unterscheiden. Ihre Studie ist im Fachmagazin Cerebral Cortex erschienen.
Das Experiment
Es piepst. War das jetzt ein Zielton oder nicht? Bei der richtigen Kombination von Toneigenschaften die korrekte Taste zu drücken, ist die Aufgabe der Personen, die bei dem Experiment am LIN mitmachen. Dabei müssen sie bei den Tönen fünf Eigenschaften in zwei Ausprägungen voneinander unterscheiden: laut und leise, kurz und lang, auf und ab, hoch und tief sowie schnell und langsam. Studienleiter Brechmann erklärt: „Wir haben bei 55 Teilnehmenden untersucht, welche Strategien sie entwickeln, um die richtige Kombination zu finden, und ob sie ihre Strategie anpassen können, wenn wir die Tastenbelegung wechseln.“
Das hat nichts mit Belohnung zu tun
Die beiden Neurowissenschaftler haben dabei mit Feedback-Mechanismen gearbeitet, die nichts mit Belohnungen zu tun haben. „In einer Vorarbeit konnten wir bereits zeigen, dass eine akustische Information ,Taste wurde gedrückt´ schon ausreicht, um das Belohnungssystem zu aktivieren“, so Wolff. Im jetzigen Experiment mussten die Probandinnen und Probanden durch Versuch und Irrtum mit akustischem Feedback herausfinden, welche Tonkombination richtig ist und welche nicht. Zuerst mussten die Teilnehmenden raten und dann eine Strategie entwickeln, um die Zielkategorie herauszufinden.
Fehler helfen beim Lernen
Die Aufgabe war so schwer, dass es einige nicht geschafft haben, andere haben nur eine der Toneigenschaften herausgefunden, und wieder andere hatten spätestens beim Tausch der Tastenbelegung Schwierigkeiten, umzulernen. „Es kam also für alle darauf an, aus negativen Rückmeldungen zu lernen, um die richtige Strategie zu finden. Mit Hilfe der Magnetresonanztomographie konnten wir sehen, wo im Gehirn diese negative, aber hilfreiche Erfahrung für eine zusätzliche Aktivierung sorgte“, berichtet Wolff.
Brechmann fügt hinzu: „Fehler sind nicht alle gleichbedeutend: Beim initialen Lernen sind sie gar nicht zu vermeiden, wohingegen sie beim Wechsel der Tastenbelegung unerwartet sind – bis man herausfindet, dass sich die Spielregeln geändert haben. Es geht darum, aus den Fehlern zu lernen und flexibel eine Strategie zu entwickeln. Und um komplexe Zusammenhänge zu begreifen, braucht das Hirn zwar die sogenannten Belohnungszentren, aber nicht unbedingt eine Belohnung.“
In künftigen Studien wollen sich die Magdeburger auf die Teilnehmenden konzentrieren, die Probleme beim Umlernen hatten, und diese mit individuellem Feedback unterstützen. Außerdem wollen sie weitere Messwerte wie Puls, Hautleitwert, Atmung oder elektrische Hirnströme in die Auswertung einfließen lassen.
Hier geht es zur Originalpublikation
Sophie Ehrenberg, Leibniz-Institut für Neurobiologie