Abitur: Sollte es zweizielorientiert gestaltet werden?

Die kürzlich stattgefundene Abiturprüfung 2025 zeigte die bemerkenswerten Bemühungen des Bildungsministeriums und der Prüfungsausschüsse, die Bildungsbewertung gemäß dem neuen Allgemeinen Bildungsprogramm (GEP) zu erneuern. Da die Prüfung im ersten Jahr nach dem neuen Programm durchgeführt wird, sind einige Mängel aufgetreten, insbesondere der Schwierigkeitsgrad der Prüfungsfragen in einigen Fächern. Diese Mängel sind nachvollziehbar. Um die Qualität der Prüfungsfragen umfassender und genauer beurteilen zu können, müssen wir die Punkteverteilung der einzelnen Fächer nach Abschluss der Korrektur abwarten.

Đề thi tốt nghiệp THPT: Có nên thiết kế nhắm đến hai mục tiêu? - Ảnh 1. — Der gesamte Verein begleitet die Abiturientinnen und ...

ZWEI ARTEN VON EINSCHÄTZUNGSTESTS

Während der Entwicklung des Allgemeinen Bildungsprogramms 2018 beriet sich der Programmentwicklungsausschuss mit zahlreichen internationalen Beratern der Weltbank , darunter auch Professor Eduardo Cascallar, einem Experten für Bildungsevaluation. Professor Eduardo Cascallar promovierte an der University of Texas-Austin (USA), war Professor an der KU Leuven (Belgien) und jahrzehntelang als Berater für die Weltbank tätig.

Unser Arbeitsprogramm mit Professor Eduardo Cascallar dauerte eine Woche (Juli 2017) und war daher sehr umfangreich. Es bezog sich auf viele verschiedene Aspekte der Bildungsbewertung, insbesondere auf die Möglichkeit, internationale Bewertungserfahrungen im Rahmen der Umsetzung des neuen allgemeinen Bildungsprogramms auf Vietnam anzuwenden.

Angesichts der hitzigen Diskussion um die Abiturprüfung halte ich es für notwendig, einige Ideen und Informationen, die Professor Eduardo Cascallar erörtert hat, allen relevanten Parteien als Referenz zur Verfügung zu stellen.

Professor Eduardo Cascallar erklärte: „Es gibt Bewertungen, die auf den vermittelten Inhalten basieren (nennen wir sie „Vorab-Bewertung“), und es gibt Bewertungen, die die zukünftige Lernfähigkeit vorhersagen (nennen wir sie „prädiktive Bewertung“). Die beiden Tests sollten nicht zu einem zusammengefasst werden. Obwohl eine Korrelation zwischen den beiden Bewertungsergebnissen besteht, reicht diese Korrelation nicht aus, um sie zu kombinieren.

Professor Eduardo Cascallar erläuterte den Unterschied zwischen den beiden Testarten. Demnach basiert die „Vorabbewertung“ auf dem Bildungsprogramm. Ausgehend von den Kerninhalten wird eine Gewichtungstabelle erstellt, die die Fragetypen, den Schwierigkeitsgrad und den Umfang der Fragen klassifiziert. Bei der „prädiktiven Bewertung“ steht das Bildungsprogramm hingegen nicht im Mittelpunkt. Vielmehr geht es um die Bedürfnisse des Prüfers an den Kandidaten (TS), beispielsweise um herauszufinden, welche Kenntnisse und Fähigkeiten der TS für die Zukunft benötigt. Eine gute prädiktive Bewertung muss zu Bewertungsergebnissen führen, die mit zukünftigen Lernergebnissen kompatibel sind.

Đề thi tốt nghiệp THPT: Có nên thiết kế nhắm đến hai mục tiêu? - Ảnh 2. — Das Abitur 2025 wird nach dem neuen Programm in den Fächern Englisch und Mathematik als schwierig eingestuft.

ES IST UNMÖGLICH, EINE FRAGE ZU ENTWICKELN, DIE SOWOHL DIE LESE- ALS AUCH DIE SCHREIBFÄHIGKEIT TESTET.

Ein Mitglied des General Education Program Development Board warf die Frage auf, ob es möglich sei, einen „Vorab-Einschätzungstest“ zu verwenden, um Kandidaten für die Zulassung zu einer Universität herauszufiltern.

Professor Eduardo Cascallar hält eine Kombination für möglich. Besser sei es jedoch, die High-School-Ergebnisse mit einem Eignungstest wie dem SAT in den USA zu kombinieren. Mithilfe vieler kombinierter Informationen könne man in den USA 90 % der Lernfähigkeit von Studienanfängern beurteilen. Künstliche Intelligenz (KI)-Software mit rund 200 Variablen (darunter Persönlichkeit, familiärer Hintergrund usw.) könne die Lernfähigkeit von Schülern in den USA recht genau vorhersagen.

Professor Eduardo Cascallar betonte: „Bei der Gestaltung von Fragen sollten wir uns auf die Messung eines Aspekts konzentrieren. Schüler sollten nicht nur aufgrund ihres eingeschränkten Leseverständnisses an einer Matheaufgabe gehindert sein, da die Frage ihre mathematischen Fähigkeiten testen soll. Ebenso sollten wir eine Frage nicht so gestalten, dass sowohl Lese- als auch Schreibfähigkeiten geprüft werden. Wenn wir beides kombinieren, wird es schwierig zu erkennen, in welchem Aspekt die Schüler gut bzw. schlecht sind.“

Wenn der Test also 40 Fragen umfasst, wie viele Fragen sollte die Testdatenbank enthalten? Professor Eduardo Cascallar bestätigte: „Je mehr, desto besser. 1.000 bis 1.500 Fragen sind ein sicheres Niveau. Sie müssen 13 Fragen vorbereiten, um eine brauchbare Frage auszuwählen. Ein guter Testautor muss 10 bis 11 Fragen vorbereiten, um eine Frage auszuwählen, ein normaler Autor benötigt 13 bis 14 Fragen. Es dürfen nicht weniger als 10 Fragen sein, um eine Frage auszuwählen.“

Laut Professor Eduardo Cascallar reichen 40 Fragen für eine nationale Prüfung aus, wenn die Fragen gut sind. In Vietnam gibt es jedoch immer noch viele schlechte Fragen. Daher können etwa 60 Fragen als ausreichend angesehen werden.

Professor Eduardo Cascallar argumentiert daher, dass es keinen allgemeingültigen Test gibt, sondern nur einen Test mit einem spezifischen Ziel. Wenn der Test zwei Ziele verfolgt, muss er sehr lang sein. Beispielsweise benötigt ein objektiver Test für ein Ziel etwa 60 bis 80 Fragen, für zwei Ziele jedoch deutlich mehr. Bei guter Qualität reichen etwa 200 Fragen aus.

Đề thi tốt nghiệp THPT: Có nên thiết kế nhắm đến hai mục tiêu? - Ảnh 3.

Đề thi tốt nghiệp THPT: Có nên thiết kế nhắm đến hai mục tiêu? - Ảnh 4.

Đề thi tốt nghiệp THPT: Có nên thiết kế nhắm đến hai mục tiêu? - Ảnh 5.

Đề thi tốt nghiệp THPT: Có nên thiết kế nhắm đến hai mục tiêu? - Ảnh 6.

Englisch Prüfungsfragen für die Abiturprüfung 2025

Foto: Thuy Hang

Die Prüfung darf nicht „zu komprimiert“ sein

Aus den Empfehlungen von Professor Eduardo Cascallar ergeben sich folgende Meinungen:

Erstens ist die Kombination zweier Lernziele in einem Test in Vietnam eine Idee, die in Betracht gezogen werden sollte. Sollte diese Idee jedoch umgesetzt werden, müssten die Anzahl der Fragen und die Bearbeitungszeit des Tests erhöht werden.

Die Gestaltung eines Tests mit etwa 200 Fragen, wie Professor Eduardo Cascallar empfiehlt, ist nicht praktikabel (vielleicht gab er die Zahl von 200 Fragen mit der Implikation an, dass die Gestaltung eines Tests mit zwei Zielen nicht praktikabel ist), aber es handelt sich sicherlich nicht nur um 40 Fragen, die in 50 Minuten bearbeitet werden müssen, wie beim Englischtest des diesjährigen Abiturs. Die Kapazität dessen, was in Professor Eduardo Cascallars Interpretation als „Frage“ gilt, und im Englischtest mögen unterschiedlich sein, aber die Zeit für die Bearbeitung des Tests

50 Minuten sind ein objektives Maß für die Dauer einer Prüfung, was zeigt, dass die letzte Englischprüfung zu komprimiert war.

Wenn wir die 2-in-1-Politik (Prüfungen für Abitur und Hochschulzugang) beibehalten und die Prüfungszeit verkürzen, um viele Dinge zu sparen, wird es für die Prüfungskommissionen für Englisch (und viele andere Fächer) in den folgenden Jahren schwierig werden, ihre Aufgaben zu erfüllen. In diesem Fall würde die Verkürzung der Prüfungszeit den Druck auf die Prüfungskommissionen und die Kandidaten eher erhöhen als verringern.

Zweitens: Da einige Fächer des Abiturs zu schwierig erscheinen, haben viele vorgeschlagen, das Abitur abzuschaffen. Wir haben dieses Thema mehrfach diskutiert. Auch internationale Experten, darunter Professor Eduardo Cascallar, haben dazu ihre Empfehlung abgegeben.

Bildungsreformen auf nationaler Ebene müssen sorgfältig und umfassend durchdacht werden. Keine Lösung ist perfekt und keine Lösung unveränderlich. Doch wenn ein Problem auftritt und politische Änderungen vorgeschlagen werden, wird das vietnamesische Bildungswesen in endlose Reformen verstrickt sein.

Braucht es ein bundesweites Abitur?

Professor Eduardo Cascallar ist ebenfalls der Ansicht, dass eine nationale Abiturprüfung erforderlich sei, um einen gemeinsamen Bewertungsstandard zu schaffen. Dies führe jedoch dazu, dass sich Lehren und Lernen eher auf Prüfungen konzentrieren. Daher sei es notwendig, der Lehrerausbildung mehr Aufmerksamkeit zu schenken und die Kontrolle zu verstärken, um die Qualität von Lehren und Lernen zu verbessern. Anstelle nationaler Abschlussprüfungen könnten groß angelegte Umfragen eingesetzt werden (z. B. NAEP in den USA). Die Entwicklung eines solchen Tests ist jedoch hinsichtlich der Stichprobenziehung sehr komplex (schon kleine Änderungen der Stichprobenziehung verändern die Ergebnisse). Die Entwicklung des Tests ist sehr kostspielig, insbesondere im vietnamesischen Kontext (viele Regionen, ethnische Gruppen, logistische Probleme usw.).

Für Vietnam ist es heute besser, Prüfungen für alle Schüler zu organisieren, da dies zu einer umfassenden Beurteilung der Schüler aus verschiedenen Fächern und Regionen beiträgt.

Quelle: https://thanhnien.vn/de-thi-tot-nghiep-thpt-co-nen-thiet-ke-nham-den-hai-muc-tieu-18525070219492685.htm