KI‑Tutoren schlagen Frontalunterricht — statistisch belegt.

Stand: April 2026 Quelle: Nature Scientific Reports Lesedauer: ca. 6 Min.

Neural · Tutor

Zusammenfassung

Eine 2025 in Nature Scientific Reports veröffentlichte randomisierte kontrollierte Studie (RCT) hat verglichen, wie viel Studierende mit einem KI‑Tutor zuhause lernen — verglichen mit aktivem Unterricht im Klassenzimmer mit denselben Inhalten. Ergebnis: Effektgröße 0,73 bis 1,3 Standardabweichungen zugunsten der KI‑Tutoren. Bei weniger Zeitaufwand. Eine der größten dokumentierten Wirkungen, die je in der Bildungsforschung gemessen wurden.

Einordnung: Mollick-Studie ist real und peer-reviewed (Nature Scientific Reports, nicht das Mutterjournal Nature). Setting: eine nigerianische Universität, Englischvokabular, 6 Wochen — Übertragung auf andere Kontexte unklar.Reality check: Mollick study is real and peer-reviewed (Nature Scientific Reports, not the parent journal Nature). Setting: one Nigerian university, English vocabulary, 6 weeks — transfer to other contexts unclear.

Wie groß ist eine Effektgröße von 1,0?

In der empirischen Bildungsforschung gilt:

0,2 SD = kleiner, aber messbarer Effekt.
0,5 SD = mittlerer Effekt — schon als bemerkenswert eingestuft.
0,8 SD = großer Effekt — selten in randomisierten Bildungsstudien.
1,0 SD und mehr = außergewöhnlich, vergleichbar mit Bloom's "Two‑Sigma‑Problem" — der berühmten 1984er Beobachtung, dass 1‑zu‑1‑Tutoring die Leistung um zwei Standardabweichungen steigern kann.

Die Nature‑Ergebnisse von 0,73–1,3 SD liegen in der Region, die Bloom für menschliche 1‑zu‑1‑Tutoren beobachtet hatte. Das ist die Antwort auf seine 40 Jahre alte Frage: "Wie geben wir jedem Schüler einen persönlichen Tutor?" — Die Antwort ist 2025 einigermaßen real geworden.

Was haben sie gemessen?

Studierende einer großen US‑Universität wurden in zwei Gruppen aufgeteilt:

Gruppe A: traditioneller Unterricht im Hörsaal mit aktiven Lernmethoden (peer instruction, problem solving)
Gruppe B: dieselben Inhalte, aber mit einem KI‑Tutor zuhause

Die KI‑Tutor‑Gruppe schnitt in den abschließenden Tests systematisch besser ab — und brauchte dafür weniger Zeit. Wichtig: Die KI war kein generischer Chatbot, sondern explizit nach research‑based design principles aufgebaut: aktives Lernen fördern, Cognitive Load managen, Feedback gezielt geben, Tempo individuell anpassen.

Effektgrößen großer Bildungsinterventionen

Cohen's d · Quelle: Hattie 2009, Nature 2025

0,73–1,3

Effektgröße SD

−40 %

Lernzeit bei besseren Ergebnissen

RCT

randomisiert kontrolliert

Was bedeutet das?

Die Studie ist nicht ein Beleg dafür, dass KI Lehrer:innen ersetzen sollte. Sondern dafür, dass gut designte KI‑Tutoring‑Systeme als Ergänzung enorme Effekte haben können. Lehrer:innen werden frei für das, was Menschen besser können: Beziehung, Motivation, ethische Einordnung, Prüfung von Verständnis durch echte Gespräche.

"Das ist nicht das Ende des Klassenzimmers — es ist das Ende der Idee, dass alle Schüler:innen im selben Tempo dieselbe Erklärung brauchen."

Limitationen

Eine Universität, ein Fachgebiet — Generalisierung steht noch aus.
Selbstdisziplin der Studierenden (zuhause lernen) war hoch.
Langzeit‑Retention nicht über mehrere Monate gemessen.

Original‑Studie

Direkt zur Open‑Access‑Publikation: nature.com/articles/s41598-025-97652-6

Kommentar

Die Mollick-Studie (Wharton/Penn, Mai 2025, Nature Scientific Reports) ist real und bemerkenswert — aber ihr Kontext ist sehr spezifisch: Studierende einer einzelnen nigerianischen Universität, Englischvokabular als Stoffgebiet, 6-Wochen-Intervention. Die 0,73–1,3 SD Effektgrößen liegen in einer Liga, die in der Bildungsforschung kaum jemals erreicht wird.

Wichtig zur Einordnung: Nature Scientific Reports ist peer-reviewed, aber nicht das Hauptjournal Nature; die Studie hat methodische Stärken (RCT, vorab-registriert), aber n und Setting limitieren die Übertragbarkeit. Bloom's "2-Sigma-Problem gelöst" ist die ambitionierte Lesart — die belegte Lesart ist: "in einem klar definierten Kontext erzielt KI ähnliche Effekte wie 1:1-Tutoring".

Quellen: Mollick et al., Nature Scientific Reports Mai 2025 · Wharton AI for Business Working Papers.

Quellen

Nature Scientific Reports — AI tutoring outperforms in-class active learning: an RCT: nature.com
Brookings — What the research shows about generative AI in tutoring: brookings.edu
Hechinger Report — The quest to build a better AI tutor: hechingerreport.org
Engageli — 25 AI in Education Statistics 2026: engageli.com