Vietnam.vn - Nền tảng quảng bá Việt Nam

คะแนนสเปกตรัมไม่สามารถนำมาใช้เป็นพื้นฐานในการประเมินคุณภาพการศึกษาได้

สิ่งสำคัญคือต้องตระหนักว่าสเปกตรัมคะแนนนั้นเป็นเพียงเครื่องมือทางสถิติเชิงพรรณนา ไม่ใช่การวัดความยากหรือคุณภาพของการทดสอบโดยตรง

Báo Tuổi TrẻBáo Tuổi Trẻ16/07/2025

PHỔ ĐIỂM - Ảnh 1.

ผู้สมัครมีความเครียดในช่วงสอบปลายภาค - ภาพประกอบ: NAM TRAN

* ดูคะแนนสอบปลายภาคปี 2025 ได้อย่างรวดเร็วที่นี่

ในปี 2568 จะมีการจัดสอบวัดระดับชั้นมัธยมศึกษาตอนปลาย โดยมีการเปลี่ยนแปลงครั้งสำคัญ คือ จะไม่ใช้คลังข้อสอบแบบมาตรฐานอีกต่อไป แต่จะใช้วิธีการแบบผู้เชี่ยวชาญในการสร้างข้อสอบขึ้นมาแทน

นี่เป็นวิธีแก้ปัญหาที่ยืดหยุ่นในบริบทของการเปลี่ยนผ่านไปสู่หลักสูตร การศึกษา ทั่วไปแบบใหม่ อย่างไรก็ตาม การเปลี่ยนแปลงวิธีการตั้งคำถามยังทำให้เกิดคำเตือนที่สำคัญ นั่นคือ การกระจายคะแนนและตัวบ่งชี้ทางสถิติพื้นฐานของการสอบนี้ไม่สามารถใช้ประเมินคุณภาพการสอนหรือวางแผนนโยบายการศึกษาได้

การกระจายคะแนนไม่ใช่การวัดคุณภาพการทดสอบ

ในการสอบปลายภาคปี 2568 กระทรวงศึกษาธิการและฝึกอบรม จะไม่ใช้คลังข้อสอบมาตรฐานเป็นครั้งแรก แต่จะเปลี่ยนไปใช้วิธีการตั้งคำถามด้วยตนเองโดยผู้เชี่ยวชาญ การเปลี่ยนแปลงนี้ไม่เพียงแต่ส่งผลต่อวิธีการจัดทำข้อสอบเท่านั้น แต่ยังส่งผลโดยตรงต่อวิธีการวิเคราะห์และประเมินคุณภาพของข้อสอบและประสิทธิภาพในการสอนอีกด้วย

ทันทีที่การสอบสิ้นสุดลง การกระจายคะแนนและพารามิเตอร์ทางสถิติพื้นฐาน เช่น คะแนนเฉลี่ยและค่ามัธยฐาน จะยังคงได้รับการประกาศอย่างต่อเนื่องและกลายเป็นจุดสนใจของสาธารณชน อย่างไรก็ตาม สิ่งสำคัญคือต้องตระหนักให้ชัดเจนว่าการกระจายคะแนนเป็นเพียงเครื่องมือทางสถิติเชิงพรรณนา ไม่ใช่การวัดความยากหรือคุณภาพของการสอบโดยตรง

การกระจายคะแนนสามารถช่วยระบุลักษณะทั่วไปบางประการของการสอบได้ เช่น ผลการทดสอบมีความเบ้ไปทางซ้ายหรือขวา เข้มข้นอยู่ที่ระดับคะแนนบางระดับ หรือมีจุดสูงสุดที่ผิดปกติ

อย่างไรก็ตาม สิ่งเหล่านี้เป็นเพียงตัวบ่งชี้ทางอ้อมเท่านั้น ซึ่งได้รับอิทธิพลจากปัจจัยอื่นๆ มากมายนอกเหนือจากการสอบ เช่น ระดับการศึกษาของผู้สมัคร ระดับการทบทวน แนวทางการเตรียมตัวสอบ และปัจจัยสุ่มระหว่างการทดสอบ

การประเมินความยาก ความแม่นยำ และการจำแนกประเภทของการทดสอบไม่สามารถขึ้นอยู่กับการกระจายคะแนนเพียงอย่างเดียว

ในการที่จะได้ข้อสรุป ทางวิทยาศาสตร์ นั้น จำเป็นต้องวิเคราะห์โครงสร้างของข้อสอบแต่ละข้ออย่างละเอียด รวมถึงระดับการตอบสนองข้อกำหนดในโปรแกรม และใช้ดัชนีเฉพาะทาง เช่น ดัชนีความยาก: สะท้อนถึงระดับความท้าทายของข้อสอบแต่ละข้อ ดัชนีการแยกแยะ: ประเมินความสามารถในการจำแนกนักเรียนที่ดีและนักเรียนที่อ่อน ค่าสัมประสิทธิ์ความน่าเชื่อถือ: วัดความเสถียรและความสอดคล้องของข้อสอบทั้งหมด

เนื่องจากการสอบปี 2568 ยังไม่มีมาตรฐาน การใช้การกระจายคะแนนเพื่อสะท้อนคุณภาพของการสอบ หรือเพื่อสรุปว่าข้อสอบง่ายหรือยากนั้นขาดพื้นฐานทางวิทยาศาสตร์ การกระจายคะแนนในปีนี้ควรเป็นเพียงเครื่องมือทางสถิติที่ใช้สำหรับการลงทะเบียนเรียนเป็นหลัก และไม่สามารถใช้เพื่อให้ข้อเสนอแนะเกี่ยวกับคุณภาพการสอนหรือระดับการบรรลุข้อกำหนดของหลักสูตรการศึกษาทั่วไปใหม่ได้

การแจกแจงคะแนนนั้นจะใช้ได้เฉพาะเมื่อการทดสอบเป็นไปตามมาตรฐานเท่านั้น

การกระจายคะแนนและพารามิเตอร์ทางสถิติ เช่น คะแนนเฉลี่ย ค่าเบี่ยงเบนมาตรฐาน อัตราการผ่าน และการกระจายคะแนน เป็นเครื่องมือสำคัญในการวิเคราะห์ผลการสอบ ในทางทฤษฎี การกระจายคะแนนสามารถสะท้อนถึงระดับความยากของการสอบ ความสามารถในการจำแนกนักเรียน และแม้แต่แนวโน้มการสอนในช่วงเวลาต่างๆ

อย่างไรก็ตาม ข้อกำหนดเบื้องต้นสำหรับตัวบ่งชี้เหล่านี้ให้มีประโยชน์คือแบบทดสอบจะต้องเป็นเครื่องมือวัดที่ได้มาตรฐาน ซึ่งรวมถึง: การมีเมทริกซ์และข้อกำหนดของแบบทดสอบที่ชัดเจน คำถามที่ทดสอบความยากและการแยกแยะ การมีข้อมูลการทดลองจากแบบทดสอบทดลอง และการมีกระบวนการสร้าง-ตรวจสอบ-ยอมรับที่เข้มงวด

หากแบบทดสอบไม่ได้มาตรฐาน ไม่ว่าการกระจายคะแนนจะดีแค่ไหน ก็จะไม่สะท้อนถึงลักษณะที่แท้จริง การกระจายคะแนนที่เบ้ไปทางซ้าย (คะแนนสูงหลายครั้ง) ไม่ได้หมายความว่าแบบทดสอบนั้นง่ายเสมอไป และคะแนนเฉลี่ยที่ต่ำก็ไม่ได้หมายความว่านักเรียนจะอ่อนเสมอไป ทุกอย่างขึ้นอยู่กับความน่าเชื่อถือของแบบทดสอบ

การสอบโดยใช้วิธีการของผู้เชี่ยวชาญ: ยืดหยุ่นแต่ไม่สามารถทดแทนมาตรฐานได้

การตั้งคำถามโดยผู้เชี่ยวชาญนั้นพบได้บ่อยในแวดวงการศึกษา มักใช้เมื่อต้องการคำตอบอย่างรวดเร็ว เมื่อไม่มีเวลาเพียงพอในการสร้างคลังคำถามมาตรฐาน หรือในการสอบภายใน อย่างไรก็ตาม วิธีการนี้ขาดความเที่ยงตรงและเสถียรภาพเมื่อเทียบกับระบบคำถามมาตรฐาน

เมื่อตั้งคำถามตามผู้เชี่ยวชาญ: ระดับความยากขึ้นอยู่กับความคิดเห็นส่วนตัวของคอมไพเลอร์ คำถามไม่ได้รับการทดสอบในทางปฏิบัติ ไม่มีข้อมูลเปรียบเทียบที่ต้องปรับ การกระจายความยากและทักษะได้รับการออกแบบตามประสบการณ์แทนที่จะเป็นข้อมูล

ผลที่ตามมาคือ การกระจายคะแนนกลายเป็นผลคูณของการวัดที่ไม่ได้ผ่านการสอบเทียบ การใช้การกระจายคะแนนเพื่อสรุปผลเกี่ยวกับความสามารถของนักเรียน คุณภาพการสอน หรือความเกี่ยวข้องของหลักสูตร ถือเป็นข้อผิดพลาดเชิงวิธีการอย่างร้ายแรง

ข้อมูลไม่น่าเชื่อถือ ข้อสรุปที่ไม่ถูกต้อง นโยบายที่ไม่เหมาะสม

ในบริบทของการปฏิรูปการศึกษาในระยะสำคัญ การใช้ข้อมูลจากการสอบเพื่อประเมิน เปรียบเทียบ และตัดสินใจเป็นสิ่งจำเป็นอย่างยิ่ง อย่างไรก็ตาม สิ่งที่อันตรายที่สุดคือการพึ่งพาข้อมูลที่ไม่น่าเชื่อถือเพื่อกำหนดนโยบายอย่างเป็นระบบ

หากเราใช้การกระจายคะแนนสอบมัธยมศึกษาตอนปลายปีการศึกษา 2568 ซึ่งไม่ได้อิงจากคำถามทดสอบมาตรฐาน เพื่อประเมินคุณภาพการสอนระหว่างภูมิภาค เปรียบเทียบผลการเรียนตามกลุ่มนักเรียน และวิเคราะห์ความเหมาะสมของหลักสูตรการศึกษารูปแบบใหม่ การวิเคราะห์ดังกล่าวขาดพื้นฐานทางวิทยาศาสตร์ นำไปสู่ความเข้าใจผิดเกี่ยวกับสถานการณ์ปัจจุบันได้ง่าย และนำไปสู่นโยบายที่ไม่เกิดประสิทธิผล

การสอบเข้าไม่สามารถเทียบเท่ากับการสอบวัดผลอย่างเป็นระบบได้

สิ่งสำคัญคือต้องแยกแยะให้ชัดเจน: การสอบอาจจะเพียงพอที่จะใช้เป็นเกณฑ์ในการสำเร็จการศึกษาหรือการรับเข้าเรียน แต่ไม่มีคุณสมบัติที่จะเป็นเครื่องมือในการวัดคุณภาพของระบบการศึกษา

การสอบปลายภาคปี 2568 ซึ่งเป็นการสอบครั้งแรกภายใต้โครงการศึกษาทั่วไปใหม่ สามารถนำไปใช้ประเมินผลการศึกษาและคัดเลือกเข้ามหาวิทยาลัยได้อย่างเต็มที่ อย่างไรก็ตาม การคาดหวังให้การกระจายคะแนนประเมินคุณภาพการสอน ประสิทธิภาพของหลักสูตร หรือระดับนักศึกษาทั่วประเทศนั้นไม่สมจริงและไม่ถูกต้องตามระเบียบวิธี

การทดสอบที่ไม่ได้มาตรฐาน → ข้อมูลที่ไม่น่าเชื่อถือ → ไม่สามารถใช้เป็นเกณฑ์มาตรฐานในการวิเคราะห์หรือการกำหนดนโยบายทางการศึกษาได้

ความรู้สึกขององค์กรไม่ควรมาแทนที่หลักการทางวิทยาศาสตร์

ในด้านการศึกษา เช่นเดียวกับสาขาอื่นๆ ที่ใช้ข้อมูลในการตัดสินใจ จำเป็นต้องยึดถือหลักการที่ว่า “ข้อมูลที่เชื่อถือได้ต้องมาจากเครื่องมือวัดที่เชื่อถือได้” อย่างเคร่งครัด ความคาดหวังในการมีข้อมูลจึงเป็นสิ่งที่ไม่อาจมองข้ามได้ โดยไม่คำนึงถึงมาตรฐานของเครื่องมือในการรวบรวมข้อมูล

การจัดการสอบปลายภาคปี 2568 โดยใช้คำถามที่ผู้เชี่ยวชาญสร้างขึ้น ถือเป็นทางเลือกที่ยอมรับได้ในระดับปฏิบัติการ อย่างไรก็ตาม ผลการสอบนี้ไม่ควรและไม่สามารถนำไปใช้ในการประเมินหรือเสนอแนะนโยบายอย่างเป็นระบบได้

วิทยาศาสตร์การวัดไม่อนุญาตให้ใช้การวัดที่ไม่ถูกต้องเป็นเกณฑ์มาตรฐาน การศึกษาไม่สามารถใช้ข้อมูลที่ไม่น่าเชื่อถือเป็นพื้นฐานทางนโยบายได้

กลับสู่หัวข้อ
ดร. ไซ กง ฮ่อง

ที่มา: https://tuoitre.vn/khong-the-lay-pho-diem-lam-can-cu-danh-gia-chat-luong-giao-duc-20250716150343597.htm


การแสดงความคิดเห็น (0)

No data
No data
ฉากมหัศจรรย์บนเนินชา 'ชามคว่ำ' ในฟู้โถ
3 เกาะในภาคกลางเปรียบเสมือนมัลดีฟส์ ดึงดูดนักท่องเที่ยวในช่วงฤดูร้อน
ชมเมืองชายฝั่ง Quy Nhon ของ Gia Lai ที่เป็นประกายระยิบระยับในยามค่ำคืน
ภาพทุ่งนาขั้นบันไดในภูทอ ลาดเอียงเล็กน้อย สดใส สวยงาม เหมือนกระจกก่อนฤดูเพาะปลูก
โรงงาน Z121 พร้อมแล้วสำหรับงาน International Fireworks Final Night
นิตยสารท่องเที่ยวชื่อดังยกย่องถ้ำซอนดุงว่าเป็น “ถ้ำที่งดงามที่สุดในโลก”
ถ้ำลึกลับดึงดูดนักท่องเที่ยวชาวตะวันตก เปรียบเสมือน 'ถ้ำฟองญา' ในทัญฮว้า
ค้นพบความงดงามอันน่ารื่นรมย์ของอ่าว Vinh Hy
ชาที่มีราคาแพงที่สุดในฮานอย ซึ่งมีราคาสูงกว่า 10 ล้านดองต่อกิโลกรัม ได้รับการแปรรูปอย่างไร?
รสชาติแห่งภูมิภาคสายน้ำ

มรดก

รูป

ธุรกิจ

No videos available

ข่าว

ระบบการเมือง

ท้องถิ่น

ผลิตภัณฑ์