Vietnam.vn - Nền tảng quảng bá Việt Nam

Độc lập - Tự do - Hạnh phúc

คะแนนสเปกตรัมไม่สามารถนำมาใช้เป็นพื้นฐานในการประเมินคุณภาพการศึกษาได้

สิ่งสำคัญคือต้องตระหนักว่าสเปกตรัมคะแนนนั้นเป็นเพียงเครื่องมือทางสถิติเชิงพรรณนา ไม่ใช่การวัดความยากหรือคุณภาพของการทดสอบโดยตรง

Báo Tuổi TrẻBáo Tuổi Trẻ16/07/2025

PHỔ ĐIỂM - Ảnh 1.

ผู้สมัครมีความเครียดในช่วงสอบปลายภาค - ภาพประกอบ: NAM TRAN

* ดูคะแนนสอบปลายภาคปี 2025 ได้อย่างรวดเร็วที่นี่

ในปี 2568 จะมีการจัดสอบวัดระดับชั้นมัธยมศึกษาตอนปลาย โดยมีการเปลี่ยนแปลงครั้งสำคัญ คือ จะไม่ใช้คลังข้อสอบแบบมาตรฐานอีกต่อไป แต่จะใช้วิธีการแบบผู้เชี่ยวชาญในการสร้างข้อสอบขึ้นมาแทน

นี่เป็นวิธีแก้ปัญหาที่ยืดหยุ่นในบริบทของการเปลี่ยนผ่านไปสู่หลักสูตร การศึกษา ทั่วไปแบบใหม่ อย่างไรก็ตาม การเปลี่ยนแปลงวิธีการตั้งคำถามยังทำให้เกิดคำเตือนที่สำคัญ นั่นคือ การกระจายคะแนนและตัวบ่งชี้ทางสถิติพื้นฐานของการสอบนี้ไม่สามารถใช้ประเมินคุณภาพการสอนหรือวางแผนนโยบายการศึกษาได้

การกระจายคะแนนไม่ใช่การวัดคุณภาพการทดสอบ

ในการสอบปลายภาคปี 2568 กระทรวงศึกษาธิการและฝึกอบรม จะไม่ใช้คลังข้อสอบมาตรฐานเป็นครั้งแรก แต่จะเปลี่ยนไปใช้วิธีการตั้งคำถามด้วยตนเองโดยผู้เชี่ยวชาญ การเปลี่ยนแปลงนี้ไม่เพียงแต่ส่งผลต่อวิธีการจัดทำข้อสอบเท่านั้น แต่ยังส่งผลโดยตรงต่อวิธีการวิเคราะห์และประเมินคุณภาพของข้อสอบและประสิทธิภาพในการสอนอีกด้วย

ทันทีที่การสอบสิ้นสุดลง การกระจายคะแนนและพารามิเตอร์ทางสถิติพื้นฐาน เช่น คะแนนเฉลี่ยและค่ามัธยฐาน จะยังคงได้รับการประกาศอย่างต่อเนื่องและกลายเป็นจุดสนใจของสาธารณชน อย่างไรก็ตาม สิ่งสำคัญคือต้องตระหนักให้ชัดเจนว่าการกระจายคะแนนเป็นเพียงเครื่องมือทางสถิติเชิงพรรณนา ไม่ใช่การวัดความยากหรือคุณภาพของการสอบโดยตรง

การกระจายคะแนนสามารถช่วยระบุลักษณะทั่วไปบางประการของการสอบได้ เช่น ผลการทดสอบมีความเบ้ไปทางซ้ายหรือขวา เข้มข้นอยู่ที่ระดับคะแนนบางระดับ หรือมีจุดสูงสุดที่ผิดปกติ

อย่างไรก็ตาม สิ่งเหล่านี้เป็นเพียงตัวบ่งชี้ทางอ้อมเท่านั้น ซึ่งได้รับอิทธิพลจากปัจจัยอื่นๆ มากมายนอกเหนือจากการสอบ เช่น ระดับการศึกษาของผู้สมัคร ระดับการทบทวน แนวทางการเตรียมตัวสอบ และปัจจัยสุ่มระหว่างการทดสอบ

การประเมินความยาก ความแม่นยำ และการจำแนกประเภทของการทดสอบไม่สามารถขึ้นอยู่กับการกระจายคะแนนเพียงอย่างเดียว

ในการที่จะได้ข้อสรุป ทางวิทยาศาสตร์ นั้น จำเป็นต้องวิเคราะห์โครงสร้างของข้อสอบแต่ละข้ออย่างละเอียด รวมถึงระดับการตอบสนองข้อกำหนดในโปรแกรม และใช้ดัชนีเฉพาะทาง เช่น ดัชนีความยาก: สะท้อนถึงระดับความท้าทายของข้อสอบแต่ละข้อ ดัชนีการแยกแยะ: ประเมินความสามารถในการจำแนกนักเรียนที่ดีและนักเรียนที่อ่อน ค่าสัมประสิทธิ์ความน่าเชื่อถือ: วัดความเสถียรและความสอดคล้องของข้อสอบทั้งหมด

เนื่องจากการสอบปี 2568 ยังไม่มีมาตรฐาน การใช้การกระจายคะแนนเพื่อสะท้อนคุณภาพของการสอบ หรือเพื่อสรุปว่าข้อสอบง่ายหรือยากนั้นขาดพื้นฐานทางวิทยาศาสตร์ การกระจายคะแนนในปีนี้ควรเป็นเพียงเครื่องมือทางสถิติที่ใช้สำหรับการลงทะเบียนเรียนเป็นหลัก และไม่สามารถใช้เพื่อให้ข้อเสนอแนะเกี่ยวกับคุณภาพการสอนหรือระดับการบรรลุข้อกำหนดของหลักสูตรการศึกษาทั่วไปใหม่ได้

การแจกแจงคะแนนนั้นจะใช้ได้เฉพาะเมื่อการทดสอบเป็นไปตามมาตรฐานเท่านั้น

การกระจายคะแนนและพารามิเตอร์ทางสถิติ เช่น คะแนนเฉลี่ย ค่าเบี่ยงเบนมาตรฐาน อัตราการผ่าน และการกระจายคะแนน เป็นเครื่องมือสำคัญในการวิเคราะห์ผลการสอบ ในทางทฤษฎี การกระจายคะแนนสามารถสะท้อนถึงระดับความยากของการสอบ ความสามารถในการจำแนกนักเรียน และแม้แต่แนวโน้มการสอนในช่วงเวลาต่างๆ

อย่างไรก็ตาม ข้อกำหนดเบื้องต้นสำหรับตัวบ่งชี้เหล่านี้ให้มีประโยชน์คือแบบทดสอบจะต้องเป็นเครื่องมือวัดที่ได้มาตรฐาน ซึ่งรวมถึง: การมีเมทริกซ์และข้อกำหนดของแบบทดสอบที่ชัดเจน คำถามที่ทดสอบความยากและการแยกแยะ การมีข้อมูลการทดลองจากแบบทดสอบทดลอง และการมีกระบวนการสร้าง-ตรวจสอบ-ยอมรับที่เข้มงวด

หากแบบทดสอบไม่ได้มาตรฐาน ไม่ว่าการกระจายคะแนนจะดีแค่ไหน ก็จะไม่สะท้อนถึงลักษณะที่แท้จริง การกระจายคะแนนที่เบ้ไปทางซ้าย (คะแนนสูงหลายครั้ง) ไม่ได้หมายความว่าแบบทดสอบนั้นง่ายเสมอไป และคะแนนเฉลี่ยที่ต่ำก็ไม่ได้หมายความว่านักเรียนจะอ่อนเสมอไป ทุกอย่างขึ้นอยู่กับความน่าเชื่อถือของแบบทดสอบ

การสอบโดยใช้วิธีการของผู้เชี่ยวชาญ: ยืดหยุ่นแต่ไม่สามารถทดแทนมาตรฐานได้

การตั้งคำถามโดยผู้เชี่ยวชาญนั้นพบได้บ่อยในแวดวงการศึกษา มักใช้เมื่อต้องการคำตอบอย่างรวดเร็ว เมื่อไม่มีเวลาเพียงพอในการสร้างคลังคำถามมาตรฐาน หรือในการสอบภายใน อย่างไรก็ตาม วิธีการนี้ขาดความเที่ยงตรงและเสถียรภาพเมื่อเทียบกับระบบคำถามมาตรฐาน

เมื่อตั้งคำถามตามผู้เชี่ยวชาญ: ระดับความยากขึ้นอยู่กับความคิดเห็นส่วนตัวของคอมไพเลอร์ คำถามไม่ได้รับการทดสอบในทางปฏิบัติ ไม่มีข้อมูลเปรียบเทียบที่ต้องปรับ การกระจายความยากและทักษะได้รับการออกแบบตามประสบการณ์แทนที่จะเป็นข้อมูล

ผลที่ตามมาคือ การกระจายคะแนนกลายเป็นผลคูณของการวัดที่ไม่ได้ผ่านการสอบเทียบ การใช้การกระจายคะแนนเพื่อสรุปผลเกี่ยวกับความสามารถของนักเรียน คุณภาพการสอน หรือความเกี่ยวข้องของหลักสูตร ถือเป็นข้อผิดพลาดเชิงวิธีการอย่างร้ายแรง

ข้อมูลไม่น่าเชื่อถือ ข้อสรุปที่ไม่ถูกต้อง นโยบายที่ไม่เหมาะสม

ในบริบทของการปฏิรูปการศึกษาในระยะสำคัญ การใช้ข้อมูลจากการสอบเพื่อประเมิน เปรียบเทียบ และตัดสินใจเป็นสิ่งจำเป็นอย่างยิ่ง อย่างไรก็ตาม สิ่งที่อันตรายที่สุดคือการพึ่งพาข้อมูลที่ไม่น่าเชื่อถือเพื่อกำหนดนโยบายอย่างเป็นระบบ

หากเราใช้การกระจายคะแนนสอบมัธยมศึกษาตอนปลายปีการศึกษา 2568 ซึ่งไม่ได้อิงจากคำถามทดสอบมาตรฐาน เพื่อประเมินคุณภาพการสอนระหว่างภูมิภาค เปรียบเทียบผลการเรียนตามกลุ่มนักเรียน และวิเคราะห์ความเหมาะสมของหลักสูตรการศึกษารูปแบบใหม่ การวิเคราะห์ดังกล่าวขาดพื้นฐานทางวิทยาศาสตร์ นำไปสู่ความเข้าใจผิดเกี่ยวกับสถานการณ์ปัจจุบันได้ง่าย และนำไปสู่นโยบายที่ไม่เกิดประสิทธิผล

การสอบเข้าไม่สามารถเทียบเท่ากับการสอบวัดผลอย่างเป็นระบบได้

สิ่งสำคัญคือต้องแยกแยะให้ชัดเจน: การสอบอาจจะเพียงพอที่จะใช้เป็นเกณฑ์ในการสำเร็จการศึกษาหรือการรับเข้าเรียน แต่ไม่มีคุณสมบัติที่จะเป็นเครื่องมือในการวัดคุณภาพของระบบการศึกษา

การสอบปลายภาคปี 2568 ซึ่งเป็นการสอบครั้งแรกภายใต้โครงการศึกษาทั่วไปใหม่ สามารถนำไปใช้ประเมินผลการศึกษาและคัดเลือกเข้ามหาวิทยาลัยได้อย่างเต็มที่ อย่างไรก็ตาม การคาดหวังให้การกระจายคะแนนประเมินคุณภาพการสอน ประสิทธิภาพของหลักสูตร หรือระดับนักศึกษาทั่วประเทศนั้นไม่สมจริงและไม่ถูกต้องตามระเบียบวิธี

การทดสอบที่ไม่ได้มาตรฐาน → ข้อมูลที่ไม่น่าเชื่อถือ → ไม่สามารถใช้เป็นเกณฑ์มาตรฐานในการวิเคราะห์หรือการกำหนดนโยบายทางการศึกษาได้

ความรู้สึกขององค์กรไม่ควรมาแทนที่หลักการทางวิทยาศาสตร์

ในด้านการศึกษา เช่นเดียวกับสาขาอื่นๆ ที่ใช้ข้อมูลในการตัดสินใจ จำเป็นต้องยึดถือหลักการที่ว่า “ข้อมูลที่เชื่อถือได้ต้องมาจากเครื่องมือวัดที่เชื่อถือได้” อย่างเคร่งครัด ความคาดหวังในการมีข้อมูลจึงเป็นสิ่งที่ไม่อาจมองข้ามได้ โดยไม่คำนึงถึงมาตรฐานของเครื่องมือในการรวบรวมข้อมูล

การจัดการสอบปลายภาคปี 2568 โดยใช้คำถามที่ผู้เชี่ยวชาญสร้างขึ้น ถือเป็นทางเลือกที่ยอมรับได้ในระดับปฏิบัติการ อย่างไรก็ตาม ผลการสอบนี้ไม่ควรและไม่สามารถนำไปใช้ในการประเมินหรือเสนอแนะนโยบายอย่างเป็นระบบได้

วิทยาศาสตร์การวัดไม่อนุญาตให้ใช้การวัดที่ไม่ถูกต้องเป็นเกณฑ์มาตรฐาน การศึกษาไม่สามารถใช้ข้อมูลที่ไม่น่าเชื่อถือเป็นพื้นฐานทางนโยบายได้

กลับสู่หัวข้อ
ดร. ไซ กง ฮ่อง

ที่มา: https://tuoitre.vn/khong-the-lay-pho-diem-lam-can-cu-danh-gia-chat-luong-giao-duc-20250716150343597.htm


การแสดงความคิดเห็น (0)

No data
No data

หัวข้อเดียวกัน

หมวดหมู่เดียวกัน

เฮลิคอปเตอร์ต่อต้านเรือดำน้ำ Ka-28 เข้าร่วมขบวนพาเหรดกลางทะเลทันสมัยขนาดไหน?
ภาพพาโนรามาของขบวนพาเหรดฉลองครบรอบ 80 ปี การปฏิวัติเดือนสิงหาคม และวันชาติ 2 กันยายน
ภาพระยะใกล้ของเครื่องบินขับไล่ Su-30MK2 ที่กำลังทิ้งกับดักความร้อนบนท้องฟ้าของบาดิญ
ยิงปืนใหญ่ 21 นัด เปิดงานวันชาติ 2 กันยายน

ผู้เขียนเดียวกัน

มรดก

รูป

ธุรกิจ

No videos available

ข่าว

ระบบการเมือง

ท้องถิ่น

ผลิตภัณฑ์