Die FES wird 100! Mehr erfahren

Friedrichs Bildungsblog

Was bringt die Testeritis durch PISA und Co. (noch)?

Bild: von Kerstin Martens

Alle drei Jahre wieder kommt mit PISA Anfang Dezember die große Bescherung. Und jedes Mal regt sich in Deutschland Missmut über die gelieferten Präsente: „Es herrscht viel Mittel­maß“ titelte dieses Jahr die FAZ, „Wieder nichts gelernt“ schlussfolgerte der Spiegel und die PISA-Ergebnisse zeigen „weiter Probleme auf“, meinte die Frankfurter Rundschau. Auch unsere Bildungsministerin Anja Karliczek hat sich besorgt über die Leistungen der deutschen Schüler_innen in der neuen PISA-Studie gezeigt, die wieder im Mittelfeld gelandet sind. Sie wertet das deutsche Abschneiden als erneutes Alarmsignal, man könne damit nicht zufrieden sein. Aber was folgt nun konkret aus der Empörung? Nicht viel. Schon ein paar Tage später ist der PISA-Hype vorbei und an­dere Themen beherrschen die Schlagzeilen.

PISA und andere international vergleichende Schulleistungsuntersuchungen haben in den vergangenen Jahren zu Recht verstärkte Auf­merksamkeit in Politik, Medien und Gesell­schaft gewonnen. Zwar sind sie kein neues Phänomen, aber seit Mitte der 1990er Jahre hat ihre An­zahl deutlich zugenommen. In den letzten Jahren ist vor allem die Testindustrie be­deutend gewachsen und bietet verschiedene Arten von Bewertungen, unterschiedliche The­menberei­che und Testinstrumentarien für alle Altersklassen an. Heute gibt es nationale, regio­nale und internationale Vergleichsstudien, und immer mehr Länder machen mit. Kurz gesagt: es wer­den immer mehr Menschen immer häu­figer getestet.

FIMS, SIMs, TIMSS oder PISA, PIAAC, P4D und auch IGLU, PIRLS und VERA. All dies sind nur einige Abkürzungen für diese vergleichenden Leistungsstudien. Manche testen Schüler_innen in der Primar- oder Sekundarstufe, manche fokussieren auf die Fä­hig­keiten von Erwachsenen, einige testen vor allem mathemische und naturwissenschaftliche Fähigkeiten, andere vor allem Lesefähigkeit. Im englischsprachigen Kontext werden diese international large scale assessments mit einer weiteren Abkürzung, nämlich ILSA, belegt.

Warum wird immer mehr getestet?

Nationale und international-vergleichende Leistungs­untersuchungen haben häufig  das Ziel, Schwächen und Stärken der Bildungs­politik teilnehmender Länder offenzule­gen. Oder anders ausgedrückt: Diese Ver­gleichsstu­dien zielen auch darauf ab, die Produk­ti­onsleistung von Bildungssystemen messbar zu ma­chen. Da­durch erlauben sie es, Bildungsan­sätze verschiedener Länder, Regio­nen, Schulfor­men oder gar Einzelschulen und Individuen miteinander zu vergleichen.

Insbesondere für wissensbasierte, global miteinander konkurrierende Volkswirtschaf­ten wird die Produktion von Hu­man­ka­pital zunehmend zum Standortfaktor; zugleich stellt Chancenge­rechtigkeit in Hinblick auf den individuellen Zugang zu Bildungsmöglichkeiten eine Voraus­setzung für soziale In­tegration dar. Aus dieser gestiegenen Bedeutung von Bil­dung ergibt sich das wach­sende Interesse an internationalen Vergleichsstudien. Wo stehen wir im internationalen Vergleich? Wie sieht unsere bildungspolitische Situation aus? Welche vor­rangigen Probleme hat unser Bildungssystem und was müssen wir noch tun, um besser zu werden?

Was folgt aus diesen Bildungstests?

Die Ergeb­nisse vieler Vergleichsstudien werden für die Erstellung von Ratings und Rankings verwendet, die oft­mals den Ein­druck einer Rang­folge zwischen teilnehmenden Ländern mit „Bil­dungssiegern und -ver­lie­rern“ vermitteln. In einzelnen Ländern, wie bei­spielsweise den USA, haben sich auch nationale Testkulturen ent­wickelt, nach denen zum Teil auch die Bezahlung von Lehr­kräften erfolgt. Obwohl einige dieser international verglei­chenden Leistungsuntersuchungen bereits seit lan­ger Zeit regelmäßig durchgeführt werden, gelten sie insbesondere seit der Veröf­fentlichung der ersten PISA-Studie im Jahr 2001 als Richtmaß für die Wei­terentwicklung von „Humankapital“.

In vielen Ländern wurden sukzessive Reformprogramme für das Schul- und Unter­richtswesen angestoßen. Das uner­wartet schwache Ab­schneiden Deutschlands hat hierzulande die bil­dungspolitische Stagna­tion, die sich seit den 1970er Jahren entwi­ckelt hat, zur Auflö­sung ge­bracht und spürbare Veränderungen im Bil­dungs­bereich ausgelöst. Da diese interna­tio­nalen Vergleichsstudien auf die Messbarkeit von Bil­dungsoutput abzielen, haben sie teil­weise sogar zu einem prinzipiellen Paradigmen­wechsel in der Bildungs­steuerung geführt, der eine Evi­denzorientie­rung in den Vordergrund stellt (Nie­mann 2015).

Keine Frage: diese vergleichenden Tests, und allen voran PISA, haben bewirkt, dass interna­tional und national mehr über Bildung diskutiert wird und Verbesserungen angestrebt wurden. Ins­besondere in Deutschland, aber auch in anderen Ländern, haben solche Ver­gleichsstudien enorme Reformanstrengun­gen ausgelöst. Unser Land der Dichter und Denker ist aufgerüttelt worden. Bildungspolitik ist nach einer langen Zeit der Untätigkeit wieder auf die politische Tagesordnung geholt worden. Mit diesem Thema kann man heutzutage Wahlen gewinnen – oder auch (teil)verlieren (siehe Nordrhein-Westfalen 2017 oder Bremen 2019).

Welche Erkenntnisse ziehen wir aus PISA und Co?

Aber was bringt uns die inzwischen fast alljährliche Testerei? IGLU wird alle 5 Jahre durch­geführt, TIMSS steht alle vier Jahre an, PISA alle drei Jahre, VERA wird jährlich in den Klas­senstufen 3 und 8 angesetzt und so weiter. Erfahren wir durch diese vielen nationalen und internationa­len Tests wirklich noch etwas Neues und finden endlich den Schlüssel zum Er­folg? Oder wer­den wir nicht vor allem immer wieder daran erinnert, was wir ohnehin schon wissen? Schließlich wird ja das sprichwörtliche Schwein vom stetigen Wiegen auch nicht fett. Als vor kurzem zum nunmehr siebten Mal die PISA-Ergebnisse veröffentlich wurden, haben wir keine Schockwelle wie 2001 erlebt. Zumindest winken wir nicht schon gelangweilt ab.

Zusammenfassen kann man einen großen Teil der Ergebnisse solcher Vergleichsstudien im Grunde so:

  • Spitzenplätze belegen häufig die ostasiatischen Länder
  • Deutschland findet sich in der Regel irgendwo im (oberen) Mittelfeld.
  • Hierzulange hängt Schulbildung mehr als in anderen Ländern von der sozialen Her­kunft ab.
  • Große Sprünge oder Abstürze bleiben für Deutschland aus: Mal ist die Bundesrepublik ein paar Punkte besser geworden in einzelnen Bereichen, mal ein wenig schlechter. Entsprechend ändert sich der Rangplatz um ein paar Plätze nach oben oder nach unten.
  • Und bei innerdeutschen Vergleichen ist mein Bundesland, Bremen, immer auf einem der hinteren, meistens aber sogar auf dem letzten Platz.

Keine Frage und bei aller Kritik, die man an den PISA-Daten auch haben mag: Die Bildungs­daten, die dadurch generiert werden, lassen Langzeittrends berechnen, Korrelationen erkenn­bar ma­chen, ermöglichen es, Kausaleffekte zu visualisieren. Gerade in den sozialwissen­schaftlichen Fächer haben die Daten bedeutend zu Fragen der Ursachen der (Re-)Produktion von sozialer Ungleichheit beigetragen. In den letzten Jah­ren ist mit der Zunahme interna­tio­naler Migration auch die zentrale Funktion von Bildung für die In­tegration eth­nisch heteroge­ner Gesell­schaf­ten ins Blickfeld gerückt. Bessere Daten im Bereich Bildung haben wir nicht – und werden sie, wenn das Ziel ist, international zu vergleichen, zum jetzigen Zeitpunkt auch kaum gene­rieren können.

Die Bilanz ist aber auch: die großen, sich auszahlenden Umbrüche im Bildungsbe­reich, die erkennbaren Verbesserungen und Erfolge durch Reformen – beides ist in Deutsch­land ausgebleiben. Knapp 20 Jahre nach dem PISA-Schock sind wir nicht viel weiter als zu­vor. Vielleicht fehlt es uns an den brillanten Ideen. Vielleicht lassen sich „best practices“ aus anderen Ländern eben nicht so einfach und auch nicht 1:1 mal eben so bei uns umsetzen. (Die koreanische Paukschule etwa ist nicht unbedingt das ideal­typische Vorbild für das deutsche Bildungsverständnis – trotz der überragenden Leistungen in PISA.) Und ja, die Migration der letzten Jahre hat neue Herausforderungen mit sich ge­bracht, die die Aufmerksamkeit des Bildungssystems an anderer Stelle gefordert haben als das Curriculum PISA anzupassen. Ebenso hat die Geburtenzunahme seit 2012 einen Einfluss auf die Schüler_innenzahlen. Anders als bei der unerwarteten Flücht­lingswelle 2015 hätte man im Falle der Neu­geborenen allerdings berechnen können, dass diese Kinder auch irgendwann mal beschult werden müssen.

Zahlen sich Tests aus?

Was uns diese alljährliche Testerei kostet, wissen wir hingegen weniger. Laura Engel und David Rutkowski (2019) haben sich daran gewagt, die Kosten für die USA zu berechnen und dabei lediglich die zwei Komponenten in ihre Berechnung einbezogen: Gemeinkosten, d.h. was ein System als jährliche, nach Größe der Wirtschaft bemessene Gebühr für die Teil­nahme an PISA an die OECD zahlt und (2) Kosten für die Umsetzung im Land, also was ein System für die Durchführung der Bewertung bezahlt. Als größte Volkswirtschaft der Welt zahlen die USA die höchste PISA-Teilnahmegebühr an die OECD, die etwa 1 Million Dollar pro Jahr beträgt. Die Kosten für die Implementierung von PISA 2012 in den USA betrugen beispielsweise rund 6,7 Millionen Dollar.

Ist uns PISA und Co das Geld also wert? Vermutlich schon, denn es erinnert uns im­mer wieder daran, dass sich noch mehr bewegen muss, insbesondere in einem Land wie Deutschland, das quasi über keine andere Ressourcen verfügt als die Köpfe seines Landes. Aber ist es sinnvoll, so häufig und so viel zu testen? Würde es nicht auch ausreichen, wenn PISA beispielsweise alle 5 Jahre durchgeführt wird? Statt einen überschießenden Aktionismus durch die kurze Abfolge von Testreihen zu bewirken, der ggf. noch mit Legislaturperioden kollidiert, sind kluge Ideen und finanzielle Ressourcen gefragt. Zumindest VERA ist ja bereits teilweise ausgesetzt, um Bürokratie abzuschaffen und Lernzeit zu schaffen.

Denn: der Bildungsbereich ist im Grunde ein „träger“ Poli­tikbereich. Bis eine Reform derart ausgestaltet ist, dass sie eingeführt werden kann, vergeht einiges an Zeit. Bis die Re­form im Schulsystem angekommen ist, vergeht wiederum Zeit. Und bis sich die sinnhaft messbaren Veränderungen einer eingeführten Reform tatsächlich in Schüler_innenleistungen abzeichnen, müssen Jahre vergehen. Gleichzeitig braucht die OECD etwa ein Jahr, um die Testergebnisse zu veröffentlichen. Wie also soll ein national getestetes Bil­dungssystem (oder noch besser: ein föderal organisiertes System wie das der Bundesrepublik) innerhalb von zwei Jahren – also nach der Veröffentlichung der PISA-Ergeb­nisse und vor der nächsten Testrunde – wundersame Verbesserungen eingeführt haben, die zu deutlich veränderten und besseren Bildungswelten führen?

Kerstin Martens ist Professorin für Politikwissenschaft an der Universität Bremen und forscht zu internationaler Bildungspolitik.

Literatur

Engel, Laura and David Rutkowski. 2019. „Is PISA Worth its Cost? Some Challenges Facing Cost-Benefit Analysis of ILSAs.“ Laboratory of International Assessment Studies blog se­ries. Published on 28th March 2019. Zugriff vom 7.12.2019 bit.ly/2Wp3c9S 

Niemann, Dennis. 2015. „PISA in Deutschland: Effekte auf Politikgestaltung und -organisa­tion.“  DDS – Die Deutsche Schule 107 (2): 141-157.



Über diesen Bildungsblog

Friedrichs Bildungsblog ist der bildungspolitische Blog der Friedrich-Ebert-Stiftung. Friedrich Ebert ist nicht nur Namensgeber der Stiftung.

Sein Lebensweg vom Sattler und Sohn eines Schneiders zum ersten demokratisch gewählten Präsidenten Deutschlands steht für Aufstieg durch Bildung.

Weiterlesen

Katja Irle, Redaktionelle Betreuung des Blogs, Bildungs- und Wissenschaftsjournalistin 

Lena Bülow, Team Bildungs- und Hochschulpolitik der Friedrich-Ebert-Stiftung

Florian Dähne, Leiter Bildungs- und Hochschulpolitik der Friedrich-Ebert-Stiftung

Wenden Sie sich bei Ideen und Vorschlägen für Blogbeiträge gerne an florian.daehne(at)fes.de

Für weitere spannende Blogbeiträge klicken Sie hier:

nach oben