Fritz NESTLE, Ulm (Ludwigsburg)
Anmerkungen zum Thema e-testing
Hinführung1. Die Prämissen, auf denen die derzeitige Lernorganisation in Deutschland beruht, haben wenig oder gar nichts mit Lernfähigkeit oder Lernmotivation der Lernenden zu tun.
Die schlimmsten Folgen hat die Zeitssteuerung des Bildungsprozesses. Zum Beispiel müssen im Sekundarbereich zufolge der KMK-Vereinba-rung aus Sitzung 314 für die allgemeine Hochschulreife, sei es in G8, sei es in G9, 265 Jahreswochenstunden abgesessen werden. Transparente Krite-rien dazu, welche Qualifikationen in dieser Unterrichtszeit erworben wer-den sollte, werden nicht thematisiert. Das heißt unter anderem, dass ein Abiturszeugnis nichts darüber aussagt, ob der Inhaber über ein auch nur grundlegendes Verständnis für den Prozentbegriff verfügt oder ob er weiß, ob Ecuador in Afrika, der Antarktis oder sonst wo liegt. Überprüfbar definierte Bildungsstandards liegen in weiter Ferne. Die Ausarbeitung solcher überprüfbarer Standards scheint auch nicht das Ziel der Arbeit des „Instituts für Qualitätsentwicklung im Bildungswesen“ zu sein.2
Eine überwiegend durch solche Zeitvorgaben gesteuerte Schulkultur fokus-siert die Nutzung der heutigen Informationsverarbeitung – wie vor 40 Jah-ren die der audiovisuellen Medien – auf die punktuelle Ausarbeitung von e-learning-Sequenzen. Google verzeichnet am 20.1.2008 mehr als 20 Milli-onen Berichte über solche Anstrengungen. Dagegen ist e-testing als Grund-lage von überprüfbaren Bildungsstandards mit 340 Fundstellen nur mit rund einem Hunderstel Promille einschlägiger Arbeiten vertreten (davon die ersten 6 vom Verfasser dieses Beitrags).
Ein Vergleich dazu: Ötzis Schuhe sind vor 5 000 Jahren mit Liebe und Anstrengung in handwerklicher Einzelarbeit entstanden. Die Schuhindust-rie stellt heute bessere Schuhe in größerer Auswahl und mit geringerem Aufwand her. Lehrkräfte hingegen investieren heute noch landauf landab zehn bis 20 Prozent ihrer Arbeitszeit in die Entwicklung von selbst ausge-arbeiteten Lernkontrollen für ihre Schüler. Der konsequente Einsatz von e-testing würde diese Zeit sparen, wäre objektiver (weniger willkürlich) und würde zugleich das Verhältnis zwischen Lehrkraft und Schüler rational entkrampfen: Bildung hinkt nach gegenüber der industriellen Produktion.
Schulbehörden schließen sich häufig der Verteufelung von „teaching to the test“ an. Besser wäre es, statt dessen ein zielgerichtetes „learning for the test“ zu fördern und dazu die Repräsentation des „syllabus“ in den Tests zu sichern. Grund genug, im Vorgriff auf eine weniger anachronistische Lern-kontrollorganisation einige Gesichtspunkte zum Thema „e-testing“ zu reflektieren.
Ein Nebenziel ist dabei, einige der „Vor-“Urteile im Bereich des e-testing bewusst zu machen. Das Hauptziel ist die Trennung zwischen Lehrbemü-hungen auf der einen Seite und der Bewertung des Lernerfolgs auf der anderen Seite.
Das Prinzip „Wer lehrt, prüft.“ korrumpiert und liefert die Lernenden der Willkür – manchmal auch dem Machtmissbrauch – der Lehrenden aus. Statt dessen sollte auch im Bereich des Lernens die externe Evaluation der Lernergebnisse Standard werden. Dann kann die schwache Lehrkraft nicht mehr wie derzeit die Noten willkürlich manipulieren und ihre mangelnde Lehrleistung durch gute Noten zudecken.
Die Verwendung externer e-testing-Module entlastet nicht nur die Lehren- den. Sie schafft zudem die Möglichkeit, den Ergebnissen selbstorganisier-ten Lernens den gleichen Rang einzuräumen wie denen eines klassischen Unterrichts. Für „outputgesteuertes“ Lernen ist dies unverzichtbar. Ent-scheidend sollte sein, was gelernt worden ist, nicht wie gelernt worden ist.
Bisher waren die sachlich überholten Monopole für Information und Bewertung prägend für das Selbstverständnis vieler Lehrkräfte. Insbeson-dere wurde in Teilbereichen der Lehrerbildung die abstruse Vorstellung gepflegt, dass eine hohe fachliche Kompetenz der Lehrenden den besten Unterricht garantiere. Heute werden auch Fähigkeiten zu Analyse, Steuerung und Unterstützung von Lernprozessen einbezogen.
E-testing heute. Das Bild von e-testing ist vielfach noch geprägt von der Erinnerung an Markierungsbögen, auf denen mit weichem Bleistift eines von vier oder fünf mit A bis D (beziehungsweise E) gekennzeichneten Feldern zu schwärzen war. Diese Auswahlantwortaufgaben (multiple choice) waren zudem oft dümmlich:
Wie heißt die Hauptstadt von Baden-Württemberg?
(A) München, (B) Paris, (C) Stuttgart, (D) Heilbronn
Mittlerweile bestimmt nur noch die Frage nach dem finanziellen Program-mieraufwand, ob nur Auswahlantworten oder auch gebundene Freiantwor-ten verwendet werden, und welche Fehlertoleranz man einbaut.
E-testing eröffnet bei geeigneter Organisation auch die Chance, Lern- und Bildungsziele unabhängig von der manchmal trägen Kultusbürokratie zu definieren. Insbesondere ist es mit geeigneten Modulen möglich, Grund-qualifikationen, die im Lauf der Schuljahre nach „Abhaken“ durch Verges-sen verloren gehen, aktuell und individuell zu überprüfen. Innerhalb der heutigen Schule geschieht das so selten, dass unabhängig von „G8“ oder „G9“ viele die Schule mit unverzeihlichen Lücken verlassen. Zu Beginn des Studiums müssen diese mit größerem Aufwand geschlossen werden.
Im Dortmunder Manifest3 wurden vom Verfasser Minimalforderungen zusammengestellt, die man an e-testing-Module stellen sollte, wenn es um die Definition von überprüfbaren Standards geht:
- Ein e-testing-Modul besteht aus einer Gruppe vergleichbarer Aufgaben, die unmittelbar am Computer bearbeitet werden können. Der Computer liefert eine direkte Rückmeldung über den Bearbeitungserfolg. (Fast alle objektiv feststellbaren kognitiven Qualifikationen können in dieser Form definiert werden.)
- Als Bildungsstandard wird die erfolgreiche Bearbeitung einer hinreichend umfassenden Zufallsauswahl aus einer solchen Aufgabengruppe definiert.
- Die erfolgreiche Bearbeitung eines Bildungsstandards wird nach einer entsprechenden Zertifizierung als gleichwertig zur entsprechenden Bearbei-tung in der Schule anerkannt
- Jeder Interessierte hat über Internet oder UMTS freien Zugang zu den Bildungsstandards. (Das ermöglicht selbstorganisiertes Lernen.) Für die Zertifizierung von Bearbeitungen können Gebühren erhoben werden.
Die Gleichwertigkeit von frei erworbenen zu in der Schule gelernten Qua-lifikationen ist die wichtigste Forderung. Damit erst erhalten Alternativen zum klassischen schulischen Lernen eine Chance. Das „Risiko“: manche Lerner erreichen die Qualifikationen der Hochschulreife mit weniger als den 265 ministeriell geforderten Jahreswochenstunden. (Vergleich: Wer von Dresden nach Wien will, muss mindestens 265 Stunden unterwegs sein. - Zur Zeit Seumes4 war dies Standard auf Schusters Rappen.)
Nach dem Vorbild des Deutschen Instituts für Normung (oder der amerikanischen ETS oder NCTM) sind die Entwicklung nach der open-source-Idee und ein von der Schulbürokratie unabhängiger Anbieter als Distributor für solche Standards denkbar und wünschenswert. Die Mono-polstellung des staatlichen Schulwesens bei der Vergabe von Zugangsbe-rechtigungen für die berufliche und universitäre Bildung hat in Deutschland im Gegensatz zu vielen anderen Ländern (z.B. SAT oder TOEFL in USA) bisher ein konsequentes Input-Output-Denken verhindert.
Zugang zu e-Testing-Items. In der klassischen Theorie der Entwicklung psychologischer Tests nach Lienert5 wäre ein freier Zugang zu den Test-items nicht denkbar. Im Gegensatz dazu sollten die Items einer Lernkont-rolle jederzeit für jedermann im Internet zugänglich (und wie zum Beispiel bei Wikipedia gegebenenfalls korrigierbar) sein – und so zahlreich, dass ein Auswendiglernen entweder als Lernziel erwünscht oder wegen des Varian-tenreichtums kaum möglich ist.
Technische Realisierung (in PHP). PHP ist eine hinreichend komplexe, internetgeeignete Sprache, um die geeignete Präsentation von Items und die angemessene Auswertung von Antworten sicherzustellen. Beim Einsatz eines Programmgenerators, zum Beispiel der Übungs- und Testplattform eExercise6, erfordert die Entwicklung keine PHP-Kenntnisse.
Didaktische Realisierung, speziell Scorefunktionen. Ein Teil der Faszi-nation von Computerspielen geht davon aus, dass erfolgreiche Spieler sich und aller Welt ihren Scorewert präsentieren können. Dieser Scorewert wird unter anderem von der Zeitkomponente maßgeblich bestimmt. Generell ist auch ein Testergebnis um so mehr wert, je weniger Zeit für das Finden des Ergebnisses individuell aufgewendet wird. Ein Beispiel von vielen für eine Scorefunktion, die diesen Anspruch erfüllt (Scorewert $score; Zahl der richtigen $zr und Zahl der falschen $zf Einsetzungen, Zeit $arbeitszeit):
$score = 2*round(((2*$zr-$zf) + 1000/$arbeitszeit)*($zr/6))
Bewertung von Items, Finanzprobleme. Wo im Internet das Experten-rating durch demokratischere Bewertungsformen ersetzt worden ist, wie beispielsweise bei Ebay für die Vertrauenswürdigkeit oder bei Wikipedia für die inhaltliche Richtigkeit, scheinen die Bewertungsergebnisse dem Expertenrating ebenbürtig zu sein. Für die Übertragung auf die Entwick-lung von Bildungsstandards darf Gleiches erwartet werden, wenn die Be-wertung der Aufgaben durch andere Aufgabenentwickler oder die Bearbei-ter der Aufgaben freigegeben wird.
Item-Entwicklung durch Schüler. Eigene Erfahrungen zur Beteiligung der Schüler an der Gestaltung von Aufgaben sind durchweg positiv. Diese aktive Beteiligung schafft doppelten Nutzen: Die Entwicklung geht schnel-ler. Die Schüler lernen allein schon durch die Arbeit an den Aufgaben.
1Ausführlichere Informationen zum Thema in www.bildungsstandards.de
2Blum et al. Bildungsstandards Mathematik: konkret; Cornelsen Scriptor 2006
3www.bildungsoptionen.de/manifest.htm
4Johann Gottfried Seume: Spaziergang nach Syrakus im Jahre 1802
5Gustav A. Lienert/ Ulrich Raatz, Testaufbau und Testanalyse 6. Auflage 1998
6 http://sourceforge.net/projects/eexercise/ ,
http://enderssr.ikp.physik.tu-darmstadt.de/teaching/eexercise/ ,
Nestle N. et al. 2007 eExercise: Möglichkeiten zur Beobachtung individueller Lernstrategien .von Studierenden in einer freien, webbasierten Aufgabenplattform, Tagungs-CD zur DPG-Frühjahrstagung Regensburg (Lehmanns, Berlin)