logo
Психология теория

Анализ первичных статистик

Для определения способов математико-статистической обработки, прежде всего, необходимо оценить характер распределения по всем используемым параметрам.

Для параметров имеющих нормальное распределение или близкое к нормальному, можно использовать методы параметрической статистики которые во многих случаях являются более молодыми, чем методы непараметрической статистики. Достоинством последних является то, что они позволяют проверять статистические гипотезы независимо от формы распределения.

Одним из важнейших в математической статистике является понятие нормального распределения. Нормальное распределение - модель варьирования некоторой случайной величины, значения которой определяются множеством одновременно действующих независимых факторов.

Важнейшие первичные статистики:

а) средняя арифметическая - величина, сумма отрицательных и положительных отклонений от которой равна нулю. В статистике ее обозначают буквой М или x ;

б) cpеднее квадратичное отклонение (обозначаемое греческой буквой s (сигма) и называемое также основным, или стандартным, отклонением) - мера разнообразия входящих в группу объектов, она показывает, на сколько в среднем отклоняется каждая варианта (конкретное значение оцениваемого параметра) от средней арифметической. Чем сильнее разбросаны варианты относительно средины, тем большим оказывается среднее квадратичное отклонение.

в) коэффициент вариант - частное от деления сигмы на среднюю, умноженное на 100%. Обозначается CV :

CV = s/ М * 100%

Для нормального распределения известны точные количественные зависимости частот и значений, позволяющие прогнозировать появление новых вариант:

Слева и справа от средней арифметической лежит 50% вариант.

В интервале от М-16 до М+16 лежат 68.7% всех вариант.

В интервале от М-1.966 до М+1.966 лежат 95% вариант.

Таким образом, ориентируясь на эти характеристики нормального распределения можно оценить степень близости к нему рассматриваемого распределения.

г) коэффициент асимметрии и эксцесс.

Коэффициент асимметрии - показатель скошенности распределения в левую или правьте сторону по оси абсцисс. Если правая ветвь кривей длиннее левой - говорят о положительной асимметрии, в противоположном случае - об отрицательной.

Эксцесс - показатель островершинности. Кривые, более высокие в своей средней части, островершинные, называются эксцессивными, у них большая величина эксцесса. При уменьшении величины эксцесса кривая становится все более плоской, приобретая вид плато, а затем и седловины - с прогибом в средней части.

Очень большие эксцесс и асимметрия часто являются индикатором ошибок при подсчетах вручную или ошибок при введении данных через клавиатуру при компьютерной обработке.

Существует правило, согласно которому все расчеты вручную должны выполняться дважды (особенно ответственные - трижды), причем желательно разными способами, с вариацией последовательности обращения к числовому массиву.

Статистические ошибки репрезентативности показывают в каких пределах могут отклоняться от параметров генеральной совокупности (от математического ожидания или истинных значений) наши частные определения, полученные на основании конкретных выборок.

Очевидно, что величина ошибки тем больше, чем больше варьирование признака и чем меньше выборка.