Kandidaten bei der Abschlussprüfung in Ho-Chi-Minh-Stadt – Foto: NHU HUNG
Das Loben eines schönen Spektrums ausschließlich aufgrund der Diagrammform oder des intuitiven Gefühls entbehrt jedoch jeder wissenschaftlichen Grundlage und kann leicht zu Missverständnissen führen.
Ein „schönes“ Punktespektrum ist nur dann wertvoll, wenn es die Fähigkeiten der Schüler gemäß den Leistungsstandards ehrlich widerspiegelt, Fairness zwischen den Kandidatengruppen gewährleistet und auf der Grundlage objektiver, standardisierter Multiple-Choice-Testfragen erstellt wird.
Die diesjährigen Daten zur Ergebnisverteilung in Mathematik und Englisch geben tatsächlich Anlass zu wichtigen Warnungen.
Schauen wir uns zunächst die Spezifikationen an. In Mathematik erreichte die durchschnittliche Punktzahl 4,78 Punkte, der Median lag bei 4,6 – fast die Hälfte der Schüler erreichte eine Punktzahl unter 5. Nur 12 % der Kandidaten erreichten eine Punktzahl von 7 oder mehr, während fast 8 % eine Punktzahl unter 2,5 erreichten.
Das Fach Englisch hat einen Mittelwert von 5,38 und einen Median von 5,25, liegt aber immer noch 38 % unter dem Durchschnitt. Diese Zahlen kann man nicht als „schön“ bezeichnen, denn sie zeigen ein niedriges Durchschnittsergebnis und eine schiefe Verteilung – insbesondere in Mathematik.
Nach dem Bewertungsprinzip bei Multiple-Choice-Tests ist ein Punktespektrum nur dann gültig, wenn es mit stabilen Indikatoren für die Verteilung, Trennschärfe und Reliabilität des Tests einhergeht.
Die Abiturprüfung ist heute eine „Zwei-in-Eins“-Prüfung – sowohl für den Schulabschluss als auch für die Hochschulzulassung.
Und um sowohl den Abschluss als auch die Zulassung zur Universität zu erreichen, werden zur Klassifizierung der Kandidaten häufig standardmäßige Multiple-Choice-Tests so konzipiert, dass etwa 60–65 % der Fragen auf der Ebene des Wiedererkennens und Verstehens liegen, der Rest auf der Ebene der Anwendung und der hohen Anwendungskompetenz.
Bei der Testgestaltung ist dies durchaus möglich, wenn die Fragendatenbank standardisiert ist und die Fragen in Pilottests getestet werden, um Schwierigkeitsgrad und Unterscheidungsvermögen zu ermitteln.
Die Realität zeigt jedoch, dass die aktuelle Prüfung noch keinen vollständigen Standardisierungsprozess durchlaufen hat. Der Übergang zum allgemeinen Bildungsprogramm 2018 hat die Verwirrung bei der Prüfungsgestaltung in Mathematik und Englisch weiter offengelegt.
Aufgrund der fehlenden Standardisierung ist die Punkteverteilung unzuverlässig. In Mathematik ist die Punkteverteilung in diesem Jahr leicht rechtsschief, wobei der Spitzenwert bei etwa 4 bis 4,5 Punkten liegt. Das bedeutet, dass sich die meisten Kandidaten auf dem niedrigen Punkteniveau befinden.
Bei einer nationalen Prüfung bedeutet dies, dass viele Schüler die Mindestanforderungen für allgemeine Mathematikkenntnisse nicht erfüllen.
Obwohl die Punkteverteilung im Fach Englisch ausgeglichener ist, spiegelt sie tatsächlich die Ergebnisse einer ausgewählten Gruppe von Kandidaten wider. Da es sich um ein Wahlfach handelt, nahmen nur etwa 350.000 Schüler an der Prüfung teil, ein deutlicher Rückgang im Vergleich zu den Vorjahren. Fast 40 % schnitten immer noch unterdurchschnittlich ab – eine Zahl, die die Öffentlichkeit beunruhigt.
Bei nicht standardisierten Tests spiegelt dieses Ergebnis jedoch hauptsächlich das Niveau der Prüfungsteilnahme wider, kann aber nicht das Lernniveau oder die tatsächliche Unterrichtsqualität bestätigen. Um zu einer gültigen Schlussfolgerung zu gelangen, sind weitere Analysen nach Region, Lernbedingungen und Schulkontext erforderlich.
Bemerkenswert ist, dass viele Schulen IELTS-Ergebnisse von 6,5 in Englisch-Ergebnisse von 9 bis 10 umwandeln, obwohl nur sehr wenige Schüler in der Abschlussprüfung 9 bis 10 Punkte erreichen. Dadurch entsteht ein Unterschied, der unfair sein kann, wenn er nicht transparent geregelt wird.
Auf der Grundlage der oben genannten Daten muss das Ministerium für Bildung und Ausbildung den Prozess der Prüfungsstandardisierung vollständig umsetzen: eine Fragendatenbank erstellen, die den Ausgabestandards genau folgt, Fragen anhand repräsentativer Stichproben testen, den Schwierigkeitsgrad und die Unterscheidung analysieren und die allgemeine Zuverlässigkeit testen.
Die Prüfungsstruktur muss klar gestaltet sein und die Matrix sowie die Ziele der einzelnen Abschnitte müssen transparent bekannt gegeben werden. Dies trägt dazu bei, den Druck der Studierenden vor der Abschlussprüfung zu verringern, während den Hochschulen weiterhin eine Grundlage für eine angemessene Auswahl bleibt.
Darüber hinaus ist es notwendig, die Verwendung internationaler Zeugnisse bei der Zulassung anzupassen, um zu vermeiden, dass einer Gruppe von Studierenden unfaire Vorteile entstehen.
Schließlich sollte die Bewertung der Punkteverteilung auf statistischen Parametern basieren – wie etwa Mittelwert, Median, Standardabweichung, Punkteverteilung und Testzuverlässigkeit – und nicht nur auf der Betrachtung von Diagrammen oder subjektiven Meinungen von Experten.
Quelle: https://tuoitre.vn/thi-tot-nghiep-thpt-2025-pho-diem-khong-the-dep-neu-thieu-chuan-hoa-20250719093601269.htm
Kommentar (0)