По словам г-на NTD, текущий процесс создания тестов слишком сильно зависит от личных ощущений и опыта. Несмотря на то, что они являются высококвалифицированными преподавателями, многим людям в команде по созданию тестов не хватает опыта в тестировании, и они даже ничего не знают об основных статистических методах оценки сложности вопроса или эффективности вариантов вмешательства. Это превращает процесс создания тестов в ручной, ненаучный процесс; вызывая споры об уровне сложности, легкости, краткости, длине и потенциальных рисках.
![]() |
Кандидаты на выпускные экзамены в средней школе по математике и английскому языку жаловались, что это было сложно. Фото: Nhu Y |
Следствием этого является «перцептивная» сложность: вопрос считается «сложным» или «легким» на основе субъективного восприятия тестируемого или опыта прошлых лет. Однако это восприятие может полностью отличаться от реальности, если его применять к десяткам тысяч кандидатов. Без таких показателей, как индекс сложности (p-value), рассчитанный на основе реальных данных, мы не можем точно знать, насколько «сложным» или «легким» является вопрос по сравнению с общими способностями кандидатов.
Анализ дистракторов бесполезен. Без статистического анализа эффективности анализа дистракторов неправильный выбор может стать слишком очевидным или, наоборот, слишком обманчивым, чтобы отражать истинные способности. Это лишает вопрос его дискриминационной силы, превращая его в случайный вопрос или простой тест памяти.
Вопросу не хватает дискриминации. Без этого индекса мы не можем знать, действительно ли вопрос выполняет хорошую фильтрацию. Вопрос, который слишком прост для кого-либо или слишком сложен для кого-либо, является плохим дискриминатором.
При формулировании вопросов на основе личного опыта составители тестов могут непреднамеренно включать вопросы, которые предвзяты по отношению к определенному аспекту знаний, с которым они знакомы, или использовать выражения, которые доступны только определенной группе кандидатов. Это подрывает справедливость экзамена и является крайне рискованным.
Решение этой проблемы, по мнению г-на NTD, требует революции в подходе к созданию тестов, в сторону профессионализации и научного применения. Это включает в себя углубленную подготовку в области тестирования; создание стандартизированного банка вопросов; профессиональный процесс создания тестов; и участие статистических экспертов.
Переход от эмоций и переживаний к профессиональному процессу разработки тестов, основанному на статистических данных, не только повышает качество тестовых вопросов, но и укрепляет доверие общества к справедливости и прозрачности вступительных экзаменов.
«Анатомирование» 4 причин
Доктор Тран Нам Ха, эксперт по экзаменам, проанализировал причины, по которым экзаменационные вопросы по некоторым предметам выпускного экзамена средней школы 2025 года являются «абсолютно» сложными.
По словам доктора Нам Ха, первой причиной является несоответствие между целями экзамена и его структурой. Количество вопросов на уровне приложения и высокого уровня приложения составляет большую долю, в то время как вопросы на знание и понимание, которые являются «поддержкой» для средних студентов, резко сократились. Эта предвзятость показывает, что экзамен нацелен на классификацию, а не на выпуск.
Что еще важнее, способы постановки вопросов и отбор материалов во многих академических предметах, которые являются глубокими, объемными и незнакомыми, особенно по литературе и английскому языку, заставляют студентов тратить много времени на чтение и понимание, оставляя им недостаточно энергии для выполнения основных требований.
Вторая ошибка — это ошибка в понимании и применении тестовой матрицы. Тестовая матрица, которая должна быть инструментом для обеспечения баланса в содержании и когнитивном уровне, была неправильно понята и применена неправильно. Многие подразделения считают матрицу просто таблицей распределения номеров вопросов, из которой они используют программное обеспечение для случайного рисования, игнорируя подробные спецификации для каждого вопроса.
Не имея контроля над оцениваемыми компетенциями, сложностью и дискриминацией, тест превращается в «продукт лотереи» вместо научного инструмента оценки. Еще более тревожно то, что путаница между матрицей и спецификациями теста привела к тому, что процесс построения теста полностью оторвался от требований образовательной программы 2018 года.
В-третьих, еще одним основным недостатком является отсутствие национального стандартизированного банка вопросов. Текущая постановка вопросов по-прежнему в значительной степени опирается на опыт экспертов без эмпирических данных о сложности или дискриминации. Это делает качество вопросов зависимым от личных ощущений и опыта, что приводит к сильным колебаниям между годами и между экзаменационными кодами.
В результате среднестатистические ученики старших классов, которые являются основной целью выпускного экзамена, больше не имеют возможности справедливого доступа к экзаменационным вопросам.
Последняя причина — непоследовательность в политике коммуникации и технических процедурах. В феврале представители Министерства образования и обучения объявили о создании банка вопросов для экзамена по новой программе.
Но всего несколько месяцев спустя, на пресс-конференции (после экзамена), один из руководителей заявил, что в первый год «не использовался банк тестов». Непоследовательность в коммуникации политики не только подрывает общественное доверие, но и направляет подготовку учителей и учащихся в неправильное русло.
Источник: https://tienphong.vn/de-thi-kho-nong-bong-cac-dien-dan-quy-trinh-ra-de-thi-can-duoc-chuyen-nghiep-hoa-post1756576.tpo
Комментарий (0)