Надежность психологического теста. Надежность теста это


Надежность психологического теста - это... Что такое Надежность психологического теста?

Надёжностью называется один из критериев качества теста, его устойчивость по отношению к погрешностям измерения. Различают два вида надёжности - надёжность как устойчивость и надёжность как внутреннюю согласованность.

Надёжность как устойчивость

Устойчивость результатов теста или ретестовая надежность (англ - test-retest reliability) – возможность получения одинаковых результатов у испытуемых в различных случаях.

Устойчивость определяется с помощью повторного тестирования (ретеста):

В данном методе предлагается провести несколько замеров с некоторым промежутком времени (от недели до года) одним и тем же тестом.

Если корреляция между результатами различных замеров будет высокой, следовательно, тест достаточно надежный. Наименьшим удовлетворительным значением для ретестовой надежности является 0,7. Однако надежность не всех тестов можно проверять этим методом, так как оцениваемое качество, явление или эффект могут быть сами по себе нестабильны (например, наше настроение, которое может меняться от одного замера к следующему). Еще один недостаток повторного тестирования – это эффект привыкания. Испытуемые уже знакомы с этим тестом, а может быть, даже помнят большую часть своих ответов после предыдущего заполнения.

В связи с выше сказанным возможно исследование надежности психодиагностических методик с использованием параллельных форм, при которых конструируются эквивалентные или параллельные наборы заданий. Получается, что испытуемые выполняют совершенно другой тест при аналогичных условиях. Однако, имеются трудности в доказательстве того, что обе формы являются действительно эквивалентными. Несмотря на это, на практике параллельные формы тестов оказываются полезными в установлении надежности тестов.

Надёжность как внутренняя согласованность

Внутренняя согласованность(англ. - self-consistent) определяется связью каждого конкретного элемента теста с общим результатом, тем, насколько каждый элемент входит в противоречие с остальными, насколько каждый отдельный вопрос измеряет признак, на который направлен весь тест. Чаще всего тесты, разрабатываются таким образом, чтобы у них была высокая степень внутренней согласованности, а связи с тем, что если одна переменная измеряется частью теста, то тогда в других частях, если они не согласованы с первой, эта же переменная измеряться не может. Таким образом, чтобы тест был валидным, необходимо, чтобы он был согласован.

Однако существует и противоположная точка зрения. Кэттелл говорит о том, что высокая внутренняя согласованность на самом деле является противоположностью валидности: каждый вопрос должен затрагивать меньшую область или иметь более узкое значение, чем критерий, подвергающийся измерению. Если все вопросы являются согласованными в высокой степени, они сильно коррелируют, и, следовательно, надежный тест будет измерять только лишь сравнительно "узкую" переменную с малыми отклонениями. По рассуждениям Кэттелла, максимум валидности существует, когда все задания теста не коррелируют друг с другом, а каждое из них имеет положительную корреляцию с критерием. Однако, такой тест будет характеризоваться низкой надежностью по внутренней согласованности.

Для проверки внутренней согласованности применяются:

  1. Метод расщепления или метод автономных частей
  2. Метод эквивалентных бланков
  3. Альфа Кронбаха
Метод расщепления (Split-half reliability)

Этот метод заключается в расщеплении/разделении теста на две равные части (например, четные и нечетные вопросы, первая и вторая половина), а затем находится корреляция между ними. Если корреляция высокая, тест можно считать надежным.

Метод эквивалентных бланков

МЭБ состоит в применении двух сопоставимых друг с другом форм теста для большой выборки (например, формы L и M для измерения в шкале интеллекта Стэнфорда-Бине) Результаты, полученные при выполнении двух форм, сравнивают и высчитывают корреляцию. Если коэффициент корреляции высокий, следовательно, тест надежен. Недостаток этого метода в том, что он подразумевает такой длительный и трудоемкий процесс, как создание двух эквивалентных форм.

Альфа Кронбаха

В этом методе, предложенном Ли Кронбахом, сравнивается разброс каждого элемента с общим разбросом всей шкалы. Если разброс результатов теста меньше, чем разброс результатов для каждого отдельного вопроса, следовательно, каждый отдельный вопрос направлен на исследование одного и того же признака, свойства или явления. Они вырабатывают значение, которое можно считать истинным. Если такое значение выработать нельзя, то есть получается случайный разброс при ответе на вопросы, тест не надежен и коэффициент альфа Кронбаха будет равен 0. Если же все вопросы измеряют один и тот же признак, то тест надежен и коэффициент альфа Кронбаха в этом случае будет равен 1.

α Кронбаха определяется как

{ { {N} \over{N-1} } \left( { { \sigma^{2}_{X} - \sum_{i=1}^N{\sigma^{2}_{Y_i}}} \over{\sigma^{2}_{X}} } \right) },

где N - число элементов в шкале, \sigma^{2}_{X} - дисперсия общего тестового балла, и \sigma^{2}_{Y_i} - дисперсия элемента i.

См. также

Помимо надежности тестов, есть так же надежность наблюдения – межнаблюдательская надежность. МН – это процент совпадения результатов наблюдения экспертов друг с другом.

Надежность и валидность

Надежность показывает, что результаты проводимого исследования близки к истине, а валидность показывает, что результаты действительно относятся к тому явлению, которое изучается исследователем. Валидное исследование автоматически является надежным, однако обратное следствие не обязательно. Надежное исследование может и не быть валидным.

Литература

Пол Клайн. "Справочное руководство по конструированию тестов", Киев, 1994.

Wikimedia Foundation. 2010.

dic.academic.ru

Билет 17. Надежность теста и ее виды.

Психометрика– область ПД, связанная с теорией, практикой и измерениями ПД.

Методологическая дисциплина(по отношению к ПД):

Обосновывает требования к…

- измерительным психодиагностическим методам;

- процедурам разработки теста;

- применению процедуры статистического анализа;

- адаптации методик к новым условиям их применения;

- интерпретации тестовых данных (пр: проблема критерия и т.п.).

Знание психометрики необходимо для критичности…:

- в понимании ограниченности методик;

- в понимании допущений, которые были сделаны при разработке;

- в понимании валидности и надежности

и т.д.

Основные психометрические характеристики:

- надежность;

- валидность.

НАДЕЖНОСТЬ(устойчивость) – это такая характеристика методики, которая позволяет оценить постоянство тестовых показателей (т.е. устойчивость результатов теста к действию посторонних, случайных факторов).

На надежность методики влияет (посторонние факторы):

- нестабильность диагностируемого свойства;

- несовершенство диагностических методик:

– небрежно составленная инструкция;

– разнородные по своему характеру задания;

– нечетко определенная область измерения;

– нечетко прописанная процедура обследования.

- меняющаяся ситуация обследования:

– разное время дня;

– разная освещенность помещения;

– посторонние шумы;

– погода и т.д.

- манера поведения психолога:

– разная стимуляция клиента на выполнение задания и т.д.

- состояние клиента (колебание в этих состояниях):

– настроение;

– усталость и т.д.

- элемент субъективизма в способах оценки/ интерпретации результатов (особенно при открытых ответах и т.п.).

Для того, чтобы надежность методики была высокой, методика должна быть стандартизирована(все д.б. прописано: процедура проведения, область исследования и т.д.).

В качестве цифрового показателя надежностивыступаеткоэффициент корреляции.

Виды надежности:

РЕТЕСТОВАЯ НАДЕЖНОСТЬ– вид надежности, который определяется путем повторного обследования одних и тех же лиц при помощи одной и той же методики.

(Чем выше коэффициент корреляции, тем выше надежность, т.е. мы получаем примерно то же самое распределение).

Определение временного интервала:

С увеличением временного интервала – показатели корреляции имеют тенденцию к снижению (т.к. имеет место влияние посторонних факторов).

Пр: могут произойти естественные временные изменения.

Обычно выбираются непродолжительные временные интервалы: от 2 недель до 2–4 месяцев (это зависит от возраста обследуемых. Чем старше, тем больше можно делать интервал, и наоборот).

Слишком маленький интервал:

→ проблема запоминания;

→ проблема интереса.

НАДЕЖНОСТЬ ПАРАЛЛЕЛЬНЫХ ФОРМ– проверяется с помощью взаимозаменяемых форм теста (т.е. одни и те же обследуемые сначала обследуются с помощью одного теста, затем (через определенный интервал) с помощью другого теста).

Требования к созданию параллельных форм теста:

1. Количество заданий д.б. одинаково.

2. Типы заданий в обеих формах д.б. унифицированы (приведены в соответствие) в плане психологического содержания, уровня и пределов трудности, охвата тех или иных операций.

3. Задания в тесте д.б. распределены по трудности одинаковым образом.

4. обе формы должны иметь примерно одинаковое среднее значение и среднее отклонение.

5. Процедура применения отдельных форм, техника оценивания результатов д.б. унифицированы.

Показатель надежности – коэффициент корреляции.

НО!! Существует опасность обучаемости решению тестов. Обследуемый может запомнить алгоритм решения определенных типов задач.

НАДЕЖНОСТЬ ЧАСТЕЙ ТЕСТА (одномоментная надежность/ надежность-согласованность)– характеристика надежности осуществляется путем анализа устойчивости результатов отдельных совокупностей тестовых задач или единичных заданий теста.

Надежность проверяют на результатах…:

1) Результаты теста расщепляются на части (чаще всего путем деления на четные и нечетны пункты).

2) По каждой половине рассчитываются суммарные баллы.

3) Между двумя рядами баллов по испытуемым рассчитываются допустимые коэффициенты корреляции.

Разделение теста на части → уменьшение величины этого теста → уменьшение/ снижение достоверности результатов.

+ надо предусмотреть:при разделении – задания по своему характеру д.б. однородными.

Преимущества данного вида надежности:

1) Отсутствие влияния факторов, порождаемых повторным тестированием: эффект упражнения, снижение мотивации и т.д.

2) Менее трудоемок (пр: не надо разрабатывать параллельную форму теста, проводить повторное обследование и т.д.).

!! Наиболее высокий показатель надежности обеспечивает надежность параллельных форм !!

Но она ограничивается техническими возможностями.

studfiles.net

надёжность теста - это... Что такое надёжность теста?

 надёжность теста

Aviation medicine: test reliability

Универсальный русско-английский словарь. Академик.ру. 2011.

  • надёжность таможенного обеспечения
  • надёжность теста, достигаемая сопоставлением результатов отдельных частей

Смотреть что такое "надёжность теста" в других словарях:

  • НАДЁЖНОСТЬ ТЕСТА — НАДЁЖНОСТЬ ТЕСТА. Показатель точности педагогического измерения и устойчивости результатов тестирования к воздействию посторонних или случайных факторов. Тест считается надежным, если он дает одни и те же (или очень близкие) показатели для… …   Новый словарь методических терминов и понятий (теория и практика обучения языкам)

  • Надёжность пунктов — – надёжность теста, определяемая степенью, в которой разные пункты теста измеряют одни и те же конструкты (в данном случае качества или черты) …   Энциклопедический словарь по психологии и педагогике

  • Надёжность взаимозаменяемых форм — – надёжность теста, определяется близкими результатами, которые получены посредством использования параллельных или эквивалентных тестов …   Энциклопедический словарь по психологии и педагогике

  • Надёжность психологического теста — Надёжностью называется один из критериев качества теста, его устойчивость по отношению к погрешностям измерения. Различают два вида надёжности  надёжность как устойчивость и надёжность как внутреннюю согласованность. Содержание 1 Надёжность… …   Википедия

  • Надёжность ретестовая — – метод определения надёжности теста путём применения его два раза (или более) с одним и тем же человеком и последующего вычисления коэффициента надёжности между соответствующими значениями. Предполагается, что период времени между тестированиями …   Энциклопедический словарь по психологии и педагогике

  • Надёжности коэффициент — – в статистике – коэффициент корреляции, выражающий степень связи между двумя наборами значений, причём эти наборы значений представляют собой результаты двух сеансов тестирования одним и тем же инструментом. Этот коэффициент используется затем в …   Энциклопедический словарь по психологии и педагогике

  • Надежность психологического теста — Надёжностью называется один из критериев качества теста, его устойчивость по отношению к погрешностям измерения. Различают два вида надёжности надёжность как устойчивость и надёжность как внутреннюю согласованность. Содержание 1 Надёжность как… …   Википедия

  • Контроль в обучении — абитуриент тест, айзенка тест, анализ ошибок, анализ речи компьютером, анализ урока, анкета, анкетирование, баллы оценочные, валидность теста, векслера тест, гиперкоррекция, грамматико морфологические ошибки, грамматико синтаксические ошибки,… …   Новый словарь методических терминов и понятий (теория и практика обучения языкам)

  • Плетизмография полового члена — (пенильная плетизмография, фаллометрия)  метод, которым измеряется изменение в кровоснабжении полового члена.[1] Обычно о кровотоке в члене судят по изменению окружности или объёма полового члена. Метод используется при расследовании… …   Википедия

  • Преждевременное излитие околоплодных вод — Преждевременный разрыв плодных оболочек (ПРПО) – это осложнение беременности, характеризующееся нарушением целостности оболочек плодного пузыря и излитием околоплодных вод (до начала родовой деятельности) на любом сроке беременности. Часто воды… …   Википедия

  • Джобс, Стив — Стив Джобс Steve Jobs …   Википедия

universal_ru_en.academic.ru

её виды, способы установления. Соотношение валидности и надежности.

МИНОБРНАУКИ РФ

Государственное образовательное учреждение

Высшего профессионального образования

«Поволжская государственная социально-гуманитарная академия»

Кафедра социальной педагогики, психологии и педагогики начального образования

Выполнила студентка II курса по

Психолого-педагогической диагностике

дневного отделения

факультета начального образования

(специальность Социальная педагогика)

Павлова Марина Вячеславовна

Самара 2011

Содержание

  1. Введение

  2. Надежность психодиагностических методик

  3. Способы установлении и виды надежности

  4. Соотношение валидности и надежности

  5. Заключение

  6. Список использованной литературы

Введение

В традиционной тестологии термин «надежность» означает относительное постоянство, устойчивость, согласованность результатов теста при первичном и повторном его применении на одних и тех же испытуемых. Как пишет А. Анастази, вряд ли можно с доверием относиться к тесту интеллекта, если по нему в начале недели ребенок имел показатель, равный 110, а к концу — 80. Повторное применение надежных методик дает сходные оценки. При этом в определенной мере могут совпадать как сами результаты, так и порядковое место (ранг), занимаемое испытуемым в группе. И в том, и в другом случае при повторении опыта возможны некоторые расхождения, но важно, чтобы они были незначительными, в пределах одной группы. Можно сказать, что надежность методики — это такой критерий, который говорит о точности психологических измерений, т. е. позволяет судить о том, насколько внушают доверие полученные результаты.

Надежность можно установить двумя общими способами: 1) путем сравнения результатов, получаемой посредством данной методики или теста разными диагностами; 2) путем сравнения результатов, получаемой применением данной методики или теста в идентичных условиях. Различается множество видов надежности и конкретных способов определения их уровня. Определение надежности теста бывает связано с понятием внутренней состоятельности теста; это выражается в расчленении теста на части с последующим сопоставлением результатов частей. Надежность теста определяется также методами анализа дисперсионного и факторного.

Виды надёжности

При исследовании надёжности часто ставится задача определить причины, приводящие к формированию той или другой стороны надёжности. Без этого невозможно наметить правильную программу работ по повышению надёжности. Это приводит к делению надёжности на:

Аппаратную надёжность , обусловленную состоянием аппаратуры;

Программную надёжность объекта, обусловленную состоянием программ;

Надёжность объекта, обусловленную качеством обслуживания;

Надёжность функциональная.

Особого внимания заслуживает понятие “программная надёжность”, так как её важная роль в обеспечении надёжности АСУ является одной из самых характерных особенностей прикладной теории надёжности АСУ. Понятие “программная надёжность” возникло в результате следующих основных причин. В инженерной практике всё большее значение приобретают программно-управляемые изделия: программно-управляемые станки; вычислительные машины и системы машин; системы передачи данных АСУ и др. Для этих изделий характерно то, что они являются органическим слиянием технических средств (аппаратуры) и программы. Без программного обеспечения вычислительный комплекс, или тракт передачи данных, - это “мёртвый” набор технических устройств, который оживает тогда и только тогда, когда он используется как единое целое с программой. Поэтому говорить о надёжности таких устройств бессмысленно, если не учитывать влияния программного обеспечения.

Учёт влияния программного обеспечения приводит к необходимости выделять в особый вид программную надёжность объектов.

Надёжность функциональная - надёжность выполнения отдельных функций, возлагаемых на систему. АСУ, как правило, система многофункциональная, т.е. она предназначается для выполнения ряда функций, различных по своей значимости. Требования к надёжности выполнения различных функций могут быть различными (например, для функции “расчёт зарплаты” требуется высокая точность, но не требуется жёсткого ограничения времени). Поэтому может оказаться целесообразным задавать различные требования к выполнению различных функций. Примером функциональной надёжности в АСУ может быть надёжность передачи определённой информации в системе передачи данных.

studfiles.net

надёжность теста - это... Что такое надёжность теста?

 надёжность теста n

psych. Aufgabenrehabilität, Testreabilität, Testzuverlässigkeit

Универсальный русско-немецкий словарь. Академик.ру. 2011.

  • надёжность считывания
  • надёжность транспорта

Смотреть что такое "надёжность теста" в других словарях:

  • НАДЁЖНОСТЬ ТЕСТА — НАДЁЖНОСТЬ ТЕСТА. Показатель точности педагогического измерения и устойчивости результатов тестирования к воздействию посторонних или случайных факторов. Тест считается надежным, если он дает одни и те же (или очень близкие) показатели для… …   Новый словарь методических терминов и понятий (теория и практика обучения языкам)

  • Надёжность пунктов — – надёжность теста, определяемая степенью, в которой разные пункты теста измеряют одни и те же конструкты (в данном случае качества или черты) …   Энциклопедический словарь по психологии и педагогике

  • Надёжность взаимозаменяемых форм — – надёжность теста, определяется близкими результатами, которые получены посредством использования параллельных или эквивалентных тестов …   Энциклопедический словарь по психологии и педагогике

  • Надёжность психологического теста — Надёжностью называется один из критериев качества теста, его устойчивость по отношению к погрешностям измерения. Различают два вида надёжности  надёжность как устойчивость и надёжность как внутреннюю согласованность. Содержание 1 Надёжность… …   Википедия

  • Надёжность ретестовая — – метод определения надёжности теста путём применения его два раза (или более) с одним и тем же человеком и последующего вычисления коэффициента надёжности между соответствующими значениями. Предполагается, что период времени между тестированиями …   Энциклопедический словарь по психологии и педагогике

  • Надёжности коэффициент — – в статистике – коэффициент корреляции, выражающий степень связи между двумя наборами значений, причём эти наборы значений представляют собой результаты двух сеансов тестирования одним и тем же инструментом. Этот коэффициент используется затем в …   Энциклопедический словарь по психологии и педагогике

  • Надежность психологического теста — Надёжностью называется один из критериев качества теста, его устойчивость по отношению к погрешностям измерения. Различают два вида надёжности надёжность как устойчивость и надёжность как внутреннюю согласованность. Содержание 1 Надёжность как… …   Википедия

  • Контроль в обучении — абитуриент тест, айзенка тест, анализ ошибок, анализ речи компьютером, анализ урока, анкета, анкетирование, баллы оценочные, валидность теста, векслера тест, гиперкоррекция, грамматико морфологические ошибки, грамматико синтаксические ошибки,… …   Новый словарь методических терминов и понятий (теория и практика обучения языкам)

  • Плетизмография полового члена — (пенильная плетизмография, фаллометрия)  метод, которым измеряется изменение в кровоснабжении полового члена.[1] Обычно о кровотоке в члене судят по изменению окружности или объёма полового члена. Метод используется при расследовании… …   Википедия

  • Преждевременное излитие околоплодных вод — Преждевременный разрыв плодных оболочек (ПРПО) – это осложнение беременности, характеризующееся нарушением целостности оболочек плодного пузыря и излитием околоплодных вод (до начала родовой деятельности) на любом сроке беременности. Часто воды… …   Википедия

  • Джобс, Стив — Стив Джобс Steve Jobs …   Википедия

universal_ru_de.academic.ru


Смотрите также