logo search
УМК Теория обучения Еловикова

9.4. Тестирование как метод оценивания качества образовательного процесса

П

ТЕСТ (от англ. test – испытание, проверка) – в педагогике и психологии – стандартизированные задания, по результатам выполнения которых судят о психофизиологических и личностных характеристиках, а также знаниях, умениях, навыках испытуемых.

рименение диагностических тестов в зарубежных шко­лах имеет давнюю историю. Признанный авторитет в облас­ти педагогического тестирования Э. Торндайк (1874-1949) выделяет три этапа внедрения тестирования в практику американской школы:

1. Период поисков (1900-1915). На этом этапе происхо­дило осознание и первоначальное внедрение тестов памя­ти, внимания, восприятия и других, предложенных француз­ским психологом А. Бинэ. Разрабатываются и проверяются тесты интеллекта, позволяющие определять коэффициент умственного развития.

2. Последующие 15 лет – годы «шума» в развитии школьного тестирования, приведшие к окончательному ос­мыслению его роли и места, возможностей и ограничений. Были разработаны и внедрены тесты О. Стоуна по арифме­тике, Б. Зекингема для проверки правописания, Э. Торндайка по диагностике большинства школьных предметов. Т. Келли разработал способ измерения интересов и наклонностей обучаемых (при изучении алгебры), а Ч. Спирмен предло­жил общие основы использования корреляционного анализа для стандартизации тестов.

3. С 1931 г. начинается современный этап развития школьного тестирования. Поиски специалистов направляют­ся на повышение объективности тестов, создание непре­рывной (сквозной) системы школьной тестовой диагностики, подчиненной единой идее и общим принципам, созданию но­вых, более совершенных средств предъявления и обработки тестов, накопления и эффективного использования диагнос­тической информации.

Педология, развившаяся в России в начале века, безоговорочно приняла тестовую основу объективного школьного контроля.

После известного постановления ЦК ВКП(б) «О педологи­ческих извращениях в системе Наркомпроса» (1936) были ликвидированы не только интеллектуальные, но и безобид­ные тесты успеваемости. Попытки возродить их в 70-х годах ни к чему не привели. В этой области наша наука и практика значительно отстали от зарубежной.

В школах развитых стран внедрение и совершенствова­ние тестов шло быстрыми темпами. Широкое распростране­ние получили диагностические тесты школьной успеваемо­сти, использующие форму альтернативного выбора пра­вильного ответа из нескольких правдоподобных, написания очень краткого ответа (заполнения пропусков), дописывания букв, цифр, слов, частей формул и т. п. С помощью этих не­сложных заданий удается накапливать значительный ста­тистический материал, подвергать его математической обработке, получать объективные выводы в пределах тех задач, которые предъявляются к тестовой проверке. Тесты печатаются в виде сборников, прилагаются к учебникам, распространяются на компьютерных дискетах.

Существует несколько разновидностей тестов. По объекту исследования можно выделить:

1. Тесты общих умственных способностей, умственного раз­вития.

2. Тесты специальных способностей в различных областях деятельности.

3. Тесты для определения отдельных качеств (черт) лично­сти (памяти, мышления, характера и др.).

4. Тесты для определения уровня воспитанности (сформированности общечеловеческих, нравственных, социальных и других качеств).

5. Дидактические тесты обученности, успеваемости, академических дости­жений.

Применение тех или иных тестов будет наиболее эффектив­ным и обеспечит надежные выводы лишь при условии пра­вильного их сочетания со всеми другими группами тестов.

Дидактические тесты, или школьные тесты, можно подразделить на тесты обучаемости и тесты обученности. Рассмотрение тестов обучаемости мы отнесем к теме «Неуспеваемость». В настоящей лекции мы будем вести речь о тестах обученности, или тестах достижений учащихся.

Тест обученности – это совокупность заданий, сориентированных на определение (измерение) уровня (степени) усвоения определенных частей содержания обучения (И.П. Подласый).

М.Б. Челышкова предлагает классифицировать тесты обученности по характеру задач, решаемых в процессе тестирования. Она выделяет:

1) входное тестирование (для определения исходного уровня перед началом обучения) – претесты (предварительные тесты);

2) текущее тестирование (для мониторинга учебных достижений) – формирующие и диагностические тесты;

3) итоговое тестирование (для определения итоговых достижений) – итоговые тесты .

Претесты позволяют выявить готовность к усвоению новых знаний у всех учеников класса.

Формирующие тесты нацелены на осуществление дифференцированного подхода к успевающим и неуспевающим учащимся в повседневном учебном процессе. Для успевающих учеников формирующие тесты создают необходимую мотивацию учения с помощью дозирования трудности заданий. Для неуспевающих – помогают выявить пробелы и оказать помощь в обучении.

Диагностические тесты направлены на установление причин пробелов в знаниях учащихся, что достигается специальным содержанием тестовых заданий. Диагностические тесты, как правило, более подробные, чем формирующие, в них много однотипных заданий, но каждое задание составлено таким образом, чтобы можно было отследить правильность выполнения каждого этапа работы, что и позволяет установить причины недостатков в уровне подготовки учащихся.

Итоговые тесты называют также суммативными тестами. Их цель – обеспечить объективную оценку результатов обучения по завершению некоторого этапа обучения (завершение темы, курса, временного периода обучения).

К тестам обученности предъявляются следующие требования. Они должны быть:

При разработке тестов важно обеспечить их соответствие критериям надежности и достоверности. Проведение теста должно отвечать требованиям объективности.

Критерий надежности отражает характеристики тестов с точки зрения точности и устойчивости результатов измерения. На надежность влияют две группы факторов. Первая группа носит случайный характер, это факторы психологические и физиологические, предугадать которые при разработке теста просто невозможно. Вторая группа представляет собой неслучайные факторы, отражающие особенности методов и средств измерений, выбранных для проведения теста. Тест будет более надежным в том случае, если он грамотно составлен и многократно апробирован с использованием математических методов вычисления степени надежности. Надежность тестов обеспечивается:

Критерий достоверности, или валидности, указывает на степень пригодности выбранного теста для оценки подготовки учеников. Этот критерий учитывает адекватность избранных методов и средств тестирования поставленным целям. Валидность обеспечивается:

Требование объективности проведения теста означает устранение влияния субъективных факторов со стороны лиц, проводящих исследование. Для установления объективности необходимо проводить исследования в максимально унифицированных условиях (объективность проведения измерений), для оценки результатов необходимо использовать одинаковые оценочные шкалы и эталоны, чтобы разные лица, проводящие исследование в сходных условиях получили сходные результаты (объективность обработки данных), интерпретация данных должна быть свободна от субъективных воздействий (объективность интерпретации результатов).

При подготовке материалов для тестирования необходимо придерживаться основных правил.

1. Нельзя включать ответы, неправильность которых на мо­мент тестирования не может быть обоснована учащимися.

2. Неправильные ответы должны конструироваться на ос­нове типичных ошибок и должны быть правдоподобными. Например, в математических тестах учитель может продумать возможные варианты ошибок и предложить ответы, которые могут быть получены в каждом из ошибочных случаев. Тогда можно будет обнаружить не только пробелы в знаниях, но и найти причины ошибок.

3. Правильные ответы среди всех предлагаемых ответов должны размещаться в случайном порядке, чтобы исключить возможность «вычисления» правильного ответа по какой-либо системе.

4. Вопросы не должны повторять формулировок учебника, то есть они должны быть направлены не на проверку памяти, а на выяснение понимания материала.

5. Ответы на одни вопросы не должны быть подсказками для ответов на другие.

6. Вопросы не должны содержать «ловушек».

На практике в тестах применяют самые различные вопросы, упражнения, за­дания. Можно выделить три ос­новные группы:

Тесты на выборку представляют собой вопрос с готовыми вариантами ответа, среди которых один или несколько правильных. Ответ на такой вопрос легко фиксировать и одно­значно оценить. Необходимо только четко разрабатывать эталоны ответа. В отличие от тестов на воспроизведение они содержат подсказку, что повышает их обучающую функ­цию, но снижает объективность контроля. Существуют два вида тестов на выборку: альтернативные и избирательные.

Альтернативный тест представляет собой вопрос, допускающий только два варианта ответа: «да» или «нет». Например: является ли формула (утверждение, формулировка) правильной? Согласны ли вы с тем, что …? Верно ли, что …? Эти тесты удобно использовать для проверки усвоения фактического материала, владения прави­лами правописания и т.д. Недостаток этих тестов в том, что шанс угадать ответ на каждый вопрос составляет 50%. Но чем больше вопросов в тесте, тем меньше шансов угадать все ответы.

Избирательный тест представляет собой вопрос с несколькими вариантами ответа, один (или несколько) из которых является правильным. Ученику необходимо отметить правильный ответ. В этом случае шансов угадать правильно очень мало. Вопрос может начинаться со слов: какой, какая, где, когда, кто, что. Англичане предложили использовать вопросы, стимулирующие аналитическое мышление: зачем? Почему? Этот тест позволяет прове­рять не только фактические знания, но и их полноту и осоз­нанность. Выполняет, в основном, контролирующую функцию.

Тесты на воспроизведение предполагают са­мостоятельный ответ учащихся без каких-либо ограниче­ний и подсказок. Существует два типа тестов на воспроизведение: конструктивные и подстановочные.

Конструктивный тест представляет собой традиционный вопрос, четко сформулированный, но без вариантов ответа. Например:

В каком веке …?

Перечислите …

Назовите …

Когда …

Зачем …

Эти тесты позволяют проверять любые уровни знаний, но их трудно однозначно оценить. Обязательно должен быть сформулирован эталон ответа.

Тест-подстановка представляет собой фразу (формулу, схему, таблицу, рисунок), в которой пропущено какое-либо слово (число, цифра, конструктивная деталь). Необходимо заполнить пропуски. Возможны также варианты написания развернутого, но по возможности немногословного ответа.

Тесты-задачи тоже бывают двух видов: типовые (ход решения известен ученику) и нетиповые (ход и метод решения ученику неизвестен, он должен сконструировать их самостоятельно на основе изученного материала).

Обучающие функции тестов различны. Выбор типа вопроса влияет на результаты обу­чения. Так, альтернативные тесты несут в себе максимальную подсказку; для повторения материала и для закрепления знаний они наиболее полезны. В то же время избирательные, подстановочные и конструктивные тесты такой подсказки не дают, и в силу этого они предоставляют больше возможностей для получения объективной информации о познаниях учащихся. Поэтому при разработке системы проверочных заданий имеет смысл начинать текущий контроль с альтернативных тестов, потом переходить к избирательным заданиям и типовым задачам, и только после них – к тестам конструктивным, подстановочным и нетиповым задачам.

Для технической поддержки тестирования используются специальные средства, которые подразделяются на две боль­шие группы. К первой относятся устройства (приспособления) для индивидуальной проверки – перфокарточки различных видов, матрицы, учетные карточки и т. п. Вторую группу со­ставляют средства группового контроля – автоматизированные классы (контрольно-обучающие комплексы), реализующие идеи программированного обучения. Именно сочетанием эф­фективного управления познавательным процессом и система­тизированным тестированием обученности (обеспечением опе­ративной обратной связи) и достигается существенное повы­шение качества дидактического процесса. Современные быст­родействующие компьютеры позволяют реализовать совершен­ные в диагностическом отношении тесты.