Классическая теория тестирования
Рассмотрим самые простые и необходимые процедуры статистической обработки результатов тестирования знаний и методы оценки качества теста в соответствии с классической теорией тестирования.
Обозначим через xij числовую оценку успешности выполнения j-го задания, выполненного i-м испытуемым. Результаты тестирования обычно представляются в виде матрицы {xij} с n строками и m столбцами (i=1,…,n; j=1,…,m). В практике тестирования принято, как правило, пользоваться дихотомической шкалой оценок результатов, когда множество возможных оценок состоит всего из двух элементов {0;1}: 0 – задание не выполнено, 1 – выполнено правильно (рис.1).
Рис. 1
Процесс статистической обработки матрицы результатов тестирования будем рассматривать последовательно, по шагам. Ниже рассматриваются эти шаги и приводятся соответствующие формулы. При выполнении этих шагов в среде Ехсе1 можно практически обойтись без формул (разумеется, потому, что в Ехсеl они встроены).
1 шаг. Вычисляются индивидуальные баллы испытуемых yi (i=1,…,n), показывающие результат выполнения теста каждым студентом:
.
Поскольку для проверки статистических гипотез, которые применяются в классической теории тестов, используют предположение о нормальном распределении суммарных баллов испытуемых, то рекомендуется исследовать распределение частот. Для сравнения распределения баллов с нормальным можно использовать любой из критериев, применяемых обычно для этой цели.
2 шаг. Вычисляются средние результаты суммарных баллов испытуемых:
.
3 шаг. Вычисляются средние результаты испытуемых по каждому заданию:
.
Для дихотомических данных величины, вычисляемые по аналогичной формуле, обозначаются через pj и традиционно называются в тестологии мерой трудности задания j (j=1,2,…,m):
.
Заметим, однако, что чем больше величина коэффициента pj, тем большая часть испытуемых успешно справляется с заданием j. Так что на самом деле коэффициенты pj (j=1,2,...,m) должны интерпретироваться как показатели легкости заданий.
4 шаг. Вычисляется дисперсия и стандартное отклонение суммарных баллов испытуемых:
, .
5 шаг. Вычисляется дисперсия результатов испытуемых по j–ому заданию (j=1,…,m). Если успешность выполнения задания оценивается баллами 0 или 1, мера вариации определяется по формуле:
.
Когда множество оценок состоит из более чем двух значений, применима формула:
.
Вычислив дисперсию, можно найти и стандартное отклонение .
6 шаг. Определяется коэффициент "влияния" тестового задания - связь каждого j–го задания (j=1,…,m) с суммой баллов по всему тесту. Для этого можно использовать коэффициент корреляции Пирсона:
.
Тестовые задания, плохо коррелирующие с суммой баллов (Rj<0,15), должны быть исключены.
7 шаг. Определяется попарная корреляционная связь заданий между собой. Здесь тоже можно использовать коэффициент корреляции Пирсона rjk, (j,k=1, 2,…,m):
.
Для дихотомических оценок успешности выполнения заданий тот же результат можно получить, оценив эту связь посредством коэффициента корреляции (j,k=1, 2,…,m) для такого рода данных:
,
где A– количество испытуемых, верно выполнивших задания j и k; B, - количество испытуемых, верно выполнивших задание j и неверно - задание k; C - количество испытуемых, неверно выполнивших задание j и верно задание k; D - количество испытуемых, неверно выполнивших задания j и k. Очевидно, величины A,B,C и D вычисляются по формулам:
, , , .
Тестовые задания, имеющие отрицательные коэффициенты корреляции, должны быть исключены.
8 шаг. Вычисляется индекс Ij(j=1, 2, … m) дискриминативности (дискриминации) задания, то есть его различающая способность, указывающая на возможность разделять отдельных испытуемых по уровню выполнения теста в целом. Для этого из общей совокупности испытуемых выделяют две подгруппы – тех, кто получил самые высокие суммарные баллы, и тех, кто получил самые низкие. Тогда индекс дискриминативности может быть определен как разность между относительными численностями испытуемых, правильно выполнивших задание jв этих двух подгруппах. Например, упорядоченную совокупность суммарных баллов делят на три части и сравнивают результаты выполнения каждого задания j первой и последней третями испытуемых.В этом случае для дихотомических данных индекс приобретает вид:
Чем больше коэффициент Ij, тем больше дискриминативность задания.
Другой способ – вычисление коэффициента дискриминации Dj:
, где
A – множество хорошо успевающих студентов,
B – множество плохо успевающих студентов, |A| - количество хорошо успевающих студентов.
- Современные средства оценивания результатов обучения
- Содержание
- 2 … . Требования к формам представления тз
- 3. Основные принципы составления заданий
- 4. Наиболее часто в построении заданий встречаются ошибки следующих типов:
- 5. Требования к технологиям компьютерного тестирования
- Лабораторная работа №3 Знакомства с конструктором тестов аст Цель работы:
- 1. Общие понятия
- 2. Функции конструктора тестов
- 3. Первый сеанс работы
- 4. Перемещение задания по структуре нтз
- 5. Экспорт тз
- 6. Библиотека ole-объектов
- Решение задач
- Возможные конфликтные ситуации
- 7. Мастер тестовых заданий
- Лабораторная работа № 4 Мастер тестовых заданий. Создание тестовой базы. Цель работы:
- Способ формирования содержательной части заданий
- I. Обработка swaPом документа Word.
- Оформление структуры материалов:
- 1. Задания открытой формы:
- 2. Задания закрытой формы:
- 3. Задания на установление соответствия:
- 4. Задание на установление правильной последовательности:
- II. Обработка swaPом Накопителя тестовых заданий.
- III. Примеры и технология выполнения задач с помощью swap:
- Лабораторная работа №7 Расчет характеристик тестовых заданий на основе анализа статистических данных в среде Excel Цель работы:
- Общие понятия
- Использование специальных функций
- Использование инструмента Пакет анализа
- Проведение корреляционного анализа
- Классическая теория тестирования
- Анализ и интерпретация коэффициента дискриминации
- 1. Общие положения
- 2. Коэффициент надежности, дисперсия и стандартная ошибка
- 3. Оценка надежности при повторном тестировании
- 4. Оценка надежности при однократном тестировнии
- 5. Интерпретация коэффициента надежности теста
- 6. Вычисление погрешности измерения тестового балла
- Методика оценки валидности тестовых заданий
- 1. Основные термины и определения
- 2. Область использования и сфера применимости теста
- 3. Содержательная валидность теста
- 4. Расчет критериальной валидности теста
- Современные средства оценивания результатов обучения
- 452453, Республика Башкортостан, г. Бирск, ул. Интернациональная, 10.