logo
пособие2

Общие понятия

При обработке результатов тестирования в терминах математической статистики и теории вероятностей используются описательные или дескриптивные статистики: минимум, максимум, среднее, дисперсия, стандартное отклонение, медиана, квартили, мода. Рассмотрим их краткие характеристики и основные приемы вычислений в среде Excel.

Минимум и максимум — это минимальное и максимальное значения переменной.

Среднее значение — сумма значений переменной, деленная на количество значений переменной.

Для оценки степени разброса (отклонения) какого-то показателя от его среднего значения, наряду с максимальным и минимальным значениями, используются понятия дисперсии и стандартного отклонения.

Дисперсия выборки или выборочная дисперсия – это мера изменчивости переменной. Дисперсия меняется от нуля до бесконечности. Крайнее значение 0 означает отсутствие изменчивости, когда значения переменной постоянны.

Дисперсия характеризует разброс точек xi вокруг xср, но имеет другую размерность. Поэтому нельзя сравнить значение D со значением xср, то есть определить велик ли разброс по сравнению со средним. Чтобы устранить этот недостаток используется стандартное отклонение.

Стандартное отклонение, среднее квадратическое отклонение вычисляется как корень квадратный из дисперсии. Чем выше дисперсия или стандартное отклонение, тем сильнее разбросаны значения переменной относительно среднего.

Медиана разбивает упорядоченный ряд вариант выборки на две равные части. Половина значений переменной лежит ниже медианы, половина — выше. Медиана дает общее представление о том, где сосредоточены значения переменной, иными словами, где находится ее центр. В некоторых случаях медиана более удобна, чем среднее.

Рассмотрим способы определения медианы при различных значениях N. Для нахождения медианы измерения записывают в ряд по возрастанию значений. Если число измерений N нечетное, то медиана численно равна значению этого ряда, стоящему точно в середине, или на (N+1)/2 месте. Например, медиана пяти измерений: 9, 15, 20, 26, 27 – равна 20 – значению, стоящему на третьем месте (N+1)/2=(5+1)/2=3.

Если число измерений четное, то медиана численно равна среднему арифметическому значений ряда, стоящих в середине, или на N/2 и N/2+1 местах. Например, медиана десяти измерений: 4, 5, 5, 6,7, 8, 8, 9, 9, 9 – равна 7,5 (7+8)/2=7,5 – среднему арифметическому значений ряда, стоящих на пятом и шестом местах (N/2=10/2=5 и N/2+1=5+1=6).

Квартили представляют собой значения, которые делят две половины выборки (разбитые медианой) еще раз пополам (от слова кварта — четверть).

Различают верхнюю квартиль, которая больше медианы и делит пополам верхнюю часть выборки (значения переменной больше медианы), и нижнюю квартиль, которая меньше медианы и делит пополам нижнюю часть выборки.

Таким образом, три точки — нижняя квартиль, медиана и верхняя квартиль - делят выборку на 4 равные части.

Мода представляет собой максимально часто встречающееся значение переменной в выборке. Например, если исследовалось число правильно решенных учащимися задач, то модой будет такое число задач, для которого число учащихся, правильно решивших именно это число задач, максимально. Сложность в том, что редкая совокупность имеет единственную моду. (Например: 1, 6, 6, 8, 8, 8, 9, 10 – мода = 8).

Ассиметрия – это свойство распределения выборки, которое характеризует несимметричность распределения случайной величины. Асимметрия бывает положительной и отрицательной. Положительная сдвигается влево, а отрицательная – вправо.

Эксцесс – это мера крутости кривой распределения. Кривая распределения может быть островершинной, плосковершинной, средне вершинной.

Теперь рассмотрим, как эти показатели можно рассчитать в среде Excel.