8. Надежность
Надёжностью называется один из критериев качества теста, его устойчивость по отношению к погрешностям измерения. Различают два вида надёжности - надёжность как устойчивость и надёжность как внутреннюю согласованность.
Устойчивость результатов теста или ретестовая надежность – возможность получения одинаковых результатов у испытуемых в различных случаях.
Устойчивость определяется с помощью повторного тестирования (ретеста). В данном методе предлагается провести несколько замеров с некоторым промежутком времени (от недели до года) одним и тем же тестом. Если корреляция между результатами различных замеров будет высокой, следовательно, тест достаточно надежный. Наименьшим удовлетворительным значением для ретестовой надежности является 0,7. Однако надежность не всех тестов можно проверять этим методом, так как оцениваемое качество, явление или эффект могут быть сами по себе нестабильны (например, наше настроение, которое может меняться от одного замера к следующему). Еще один недостаток повторного тастирования – это эффект привыкания. Испытуемые уже знакомы с этим тестом, а может быть, даже помнят большую часть своих ответов после предыдущего заполнения.
В связи с выше сказанным возможно исследование надежности психодиагностических методик с использованием параллельных форм, при которых конструируются эквивалентные или параллельные наборы заданий. Получается, что испытуемые выполняют совершенно другой тест при аналогичных условиях. Однако, имеются трудности в доказательстве того, что обе формы являются действительно эквивалентными. Несмотря на это, на практике параллельные формы тестов оказываются полезными в установлении надежности тестов.
Внутренняя согласованность определяется связью каждого конкретного элемента теста с общим результатом, тем, насколько каждый элемент входит в противоречие с остальными, насколько каждый отдельный вопрос измеряет признак, на который направлен весь тест. Чаще всего тесты, разрабатываются таким образом, чтобы у них была высокая степень внутренней согласованности, а связи с тем, что если одна переменная измеряется частью теста, то тогда в других частях, если они не согласованы с первой, эта же переменная измеряться не может. Таким образом, чтобы тест был валидным, необходимо, чтобы он был согласован.
Однако существует и противоположная точка зрения. Кэттелл говорит о том, что высокая внутренняя согласованность на самом деле является противоположностью валидности: каждый вопрос должен затрагивать меньшую область или иметь более узкое значение, чем критерий, подвергающийся измерению. Если все вопросы являются согласованными в высокой степени, они сильно коррелируют, и, следовательно, надежный тест будет измерять только лишь сравнительно "узкую" переменную с малыми отклонениями. По рассуждениям Кэттелла, максимум валидности существует, когда все задания теста не коррелируют друг с другом, а каждое из них имеет положительную корреляцию с критерием. Однако, такой тест будет характеризоваться низкой надежностью по внутренней согласованности.
Для проверки внутренней согласованности применяются:
Метод расщепления или метод автономных частей
Метод эквивалентных бланков
Альфа Кронбаха
Метод расщепления
Этот метод заключается в расщеплении/разделении теста на две равные части (например, четные и нечетные вопросы, первая и вторая половина), а затем находится корреляция между ними. Если корреляция высокая, тест можно считать надежным.
Метод эквивалентных бланков
МЭБ состоит в применении двух сопоставимых друг с другом форм теста для большой выборки (например, формы L и M для измерения в шкале интеллекта Стэнфорда-Бине) Результаты, полученные при выполнении двух форм, сравнивают и высчитывают корреляцию. Если коэффициент корреляции высокий, следовательно, тест надежен. Недостаток этого метода в том, что он подразумевает такой длительный и трудоемкий процесс, как создание двух эквивалентных форм.
Альфа Кронбаха
В этом методе, предложенном Ли Кронбахом, сравнивается разброс каждого элемента с общим разбросом всей шкалы. Если разброс результатов теста меньше, чем разброс результатов для каждого отдельного вопроса, следовательно, каждый отдельный вопрос направлен на исследование одного и того же признака, свойства или явления. Они вырабатывают значение, которое можно считать истинным. Если такое значение выработать нельзя, то есть получается случайный разброс при ответе на вопросы, тест не надежен и коэффициент альфа Кронбаха будет равен 0. Если же все вопросы измеряют один и тот же признак, то тест надежен и коэффициент альфа Кронбаха в этом случае будет равен 1.
α Кронбаха определяется как
,
где N - число элементов в шкале, - дисперсия общего тестового балла, и - дисперсия элемента i.
Надежность показывает, что результаты проводимого исследования близки к истине, а валидность показывает, что результаты действительно относятся к тому явлению, которое изучается исследователем. Валидное исследование автоматически является надежным, однако обратное следствие не обязательно. Надежное исследование может и не быть валидным.
Помимо надежности тестов, есть так же надежность наблюдения – межнаблюдательская надежность. МН – это процент совпадения результатов наблюдения экспертов друг с другом.
- Тема 1. Теоретические основы возрастной психодиагностики. Нормативная база деятельности психолога-диагноста
- Понятие про возрастную психодиагностику как прикладную специально психологическую науку
- Этический кодекс психолога - диагноста
- Этические аспекты профессиональной деятельности возрастного психолога - диагноста
- Тема 2. Методы психологической диагностики развития личности
- Классификация методов возрастной психодиагностики
- Лонгитюд как основной метод возрастной психодиагностики
- Диагностическое интервью: виды, структура, валидность
- Анкетные методы и оценочные шкалы
- Тесты: классификация, валидность и надежность
- Проективные методы
- Тема 3. Детская психодиагностика: критерии, нормативные шкалы, методы
- Общие задачи и принципы психодигностического обследование детей разных вековых групп
- Психодиагностика новорожденного и грудного ребенка: критерии, особенности проведения
- Нормативные шкалы развития грудного ребенка: Шкала оценки психического развития ребенка а. Гезелла; Шкала оценки языкового развития ребенка (Института педиатрии амн Украины)
- Методики психологической диагностики развития грудного ребенка
- Психодиагностика ребенка раннего и дошкольного возраста: критерии, особенности проведения
- Нормативные шкалы развития ребенка раннего и дошкольного возраста: Шкала оценки особенностей психологического развития ребенка за и. Мамайчук
- Методики психологической диагностики развития ребенка раннего и дошкольного возраста
- Методики диагностики познавательных процессов ребенка и др;
- Методики диагностики речевого развития;
- Методики диагностики личностного развития ребенка;
- Методики диагностики психологической адаптированости ребенка к дошкольному учреждению;
- Методики диагностики особенностей общения детей с ровесниками и взрослыми;
- Диагностика межличностного взаимодействия в группах детского садика.
- 8. Психологическое заключение про психологическое развитие ребенка по результатам наблюдения
- Тема 4. Психодиагностика развития личности в общеобразовательном пространстве
- Основные задачи и принципы школьной психодиагностики
- Диагностика психологической готовности ребенка к школьному обучению: принципы, методы, методики
- Диагностика психологической адаптированости первоклассника к школе
- Психологическая диагностика детей группы риска. Дефектодиагностика
- Содержание и задачи работы психолого-медико-педагогических комиссий
- Методики психологической диагностики развития ребенка школьного возраста
- Методики диагностики развития основных видов деятельности;
- Методики диагностики познавательных процессов ребенка и интеллекта в целом;
- Диагностика эмоционально-волевой сферы;
- Методики диагностики особенностей общения детей с ровесниками и взрослыми;
- Методики диагностики школьной осведомленности.
- Методики социально-психологического исследования классного коллектива
- Особенности диагностики психологической адаптированости ребенка к обучению в средней и старшей школе
- Задача и особенности подростковой и юношеской психодиагностики
- Тема 5. Психодиагностика зрелости: критерии, специфика, методы
- Основные задачи и принципы психологической диагностики личности на этапе зрелости
- Структурный подход к психологическому изучению взрослого человека
- Диагностика личностной зрелости человека: специфика, методики
- Диагностика интеллектуального развития взрослых
- Методы и методики типологизации личности в психологическом исследовании
- 6. Осуществление психодиагностики личностной зрелости
- Тема 6. Критерии и методы диагностики развития личности на этапе поздней зрелости
- Основные задачи и принципы психологической диагностики личности на этапе поздней зрелости
- Диагностика интеллектуальной и личностной сферы пожилых людей: подходы, специфика, методики
- Тема 7. Психодиагностический процесс
- 1. Психодиагностический процесс
- 2. Этапы и проведение психодиагностического исследования
- 3. Словарь терминов
- 4. Особенности использования психодиагностических данных
- 5. Классификация психодиагностических методик
- 6. Требования к психодиагностическому инструментарию
- 7. Психометрические характеристики теста
- 8. Надежность
- 9. Валидность
- 10. Теоретические вопросы психодиагностики Интеллекта
- 11. Модели Интеллекта
- 12. Тестовые методы исследования Интеллекта
- 15. Способности и их диагностика
- 14. Уровень успеха и его оценка
- 15. Теории личности как основа психодиагностики
- 16. Теоретические основы диагностики личности
- 17. Диагностические методы исследования личности
- 18. Опросники как методики исследования личности и их специфика
- 19. Психодиагностическое изучение некоторых аспектов личности
- 20. Особенности проектного метода как способа исследования личности
- 21. Источники развития проектного метода
- 22. Проективные методики в контексте личного смысла (отечественная психология)
- 23. Основные теоретические положения исследования межличностных отношений
- 24. Особенности исследования межличностных отношений
- 25. Социометрия