Open Library - открытая библиотека учебной информации. Форма теста


Виды тестов и формы тестовых заданий

План

1. Основные виды педагогических тестов.

2. Формы тестовых заданий.

3. Эмпирическая проверка и статистическая обработка результатов.

4. Принципы отбора содержания. Критерии оценки содержания теста.

5. Соотношение формы задания и вида проверяемых знаний, умений, навыков.

1. Основные виды педагогических тестов

Существуют два основных вида тестов: традиционные и нетрадиционные.

Тест обладает составом, целостностью и структурой. Он состоит из заданий, правил их применения, оценок за выполнение каждого задания и рекомендаций по интерпретации тестовых результатов. Целостность теста означает взаимосвязь заданий, их принадлежность общему измеряемому фактору. Каждое задание теста выполняет отведенную ему роль и потому ни одно из них не может быть изъято из теста без потери качества измерения. Структуру теста образует способ связи заданий между собой. В основном, это так называемая факторная структура, в которой каждое задание связано с другими через общее содержание и общую вариацию тестовых результатов.

Традиционный тест представляет собой единство, по меньшей мере, трех систем:

- содержательной системы знаний, описываемой языком проверяемой учебной дисциплины;

- формальной системы заданий возрастающей трудности;

- статистических характеристик заданий и результатов испытуемых.

Традиционный педагогический тест нужно рассматривать в двух существенных смыслах: - как метод педагогического измерения и как результат применения теста. Удивительно, что тексты на русском языке тяготеют к смыслу метода, в то время как в большинстве работ западных авторов понятие тест чаще рассматривается в смысле результатов. Между тем, оба эти смысла характеризуют тест с разных сторон, потому что тест надо понимать одновременно и как метод, и как результат педагогического измерения. Одно дополняет другое. Тест, как метод, не мыслится без результатов, подтверждающих качество его самого и качество оценок измерения испытуемых различного уровня подготовленности.

В приведенном выше определении традиционного теста получили развитие несколько идей.

Первая идея - тест рассматривается не как обычная совокупность или набор вопросов, задач и т.п., а в виде понятия "система заданий". Такую систему образует не всякая совокупность, а только та, которая обусловливает возникновение нового интегративного качества, отличающего тест от элементарного набора заданий и от других средств педагогического контроля. Из множества возможных систем наилучшую образует та целостная совокупность, в которой качество теста проявляется в сравнительно большей степени. Отсюда вытекает мысль о выделении первого из двух главных системообразующих факторов - наилучшего состава тестовых заданий, образующих целостность. Исходя из этого, можно дать одно из самых коротких определений: тест - это система заданий, образующих наилучшую методическую целостность. Целостность теста - это устойчивое взаимодействие заданий, образующих тест как развивающуюся систему.

Вторая идея состоит в том, что в данном определении теста совершен отход от укоренившейся традиции рассмотрения теста как простого средства проверки, пробы, испытания. Всякий тест включает в себя элемент испытания, он не сводится весь к нему. Ибо тест - это еще и концепция, содержание, форма, результаты и интерпретация - все, требующее обоснования. Этим подразумевается, что тест является качественным средством педагогического измерения. В соответствии с положениями теории, тестовые оценки не являются точными оценками испытуемых. Правильно говорить, что они лишь репрезентируют эти значения с некоторой точностью.

Третья идея, развиваемая в нашем определении традиционного теста - это включение нового понятия - эффективность теста, который ранее в литературе по тестам не рассматривался в качестве критерия анализа и создания тестов. Ведущая идея традиционного теста - минимумом числом заданий, за короткое время, быстро, качественно и с наименьшими затратами сравнить знания как можно большего числа учащихся.

По существу, этим отражается идея эффективности педагогической деятельности в области контроля знаний. Хотелось бы думать, что против самой этой идеи возражать уже некому и незачем. Если наш учитель может разъяснить учебный материал не хуже своего зарубежного коллеги, то хорошо проверить требуемые знания, у всех учеников, по всему изученному материалу, он не в состоянии из-за господствующей у нас классно-урочной системы занятий, нехватки компьютерной техники, тестов и программ для организации автоматизированного самоконтроля - самой гуманной формы контроля знаний. Не в состоянии он это делать и физически. В силу, мягко скажем, ошибочной социальной политики зарплата наших учителей уже давно не компенсирует затраты даже физической энергии, необходимой для хорошего преподавания, не говоря уже о повышенных затратах энергии интеллектуальной, что способно совершать только раскованное, а не озабоченное поисками хлеба мышление. Как отмечается в литературе, квалифицированный работник получает у нас в три-четыре раза меньше того уровня зарплаты, за границами которого нарушается нормальная жизнедеятельность и начинается разрушение трудового потенциала.

Хотя в литературе имеются сотни примеров определений теста, с которыми либо трудно, либо вообще нельзя согласиться, это совсем не означает, что данное определение традиционного теста - истина в последней инстанции. Как и все остальные понятия, оно нуждается в постоянном улучшении. Просто оно представляется автору пока более аргументированным, чем некоторые другие известные понятия педагогического теста. Впрочем, стремление к улучшению понятий - явление совершенно нормальное и необходимое для нормально развивающейся практики и науки. Конструктивные попытки дать другие определения теста или оспорить уже имеющиеся всегда полезны, но именно этого нам не достает.

К традиционным тестам относятся тесты гомогенные и гетерогенные. Гомогенный тест представляет собой систему заданий возрастающей трудности, специфической формы и определенного содержания - система, создаваемая с целью объективного, качественного, и эффективного метода оценки структуры и измерения уровня подготовленности учащихся по одной учебной дисциплине. Легко видеть, что в своей основе определение гомогенного теста совпадает с определением традиционного теста.

Гомогенные тесты распространены больше других. В педагогике они создаются для контроля знаний по одной учебной дисциплине или по одному разделу такой, например, объемной учебной дисциплины, как физика. В гомогенном педагогическом тесте не допускается использование заданий, выявляющих другие свойства. Наличие последних нарушает требование дисциплинарной чистоты педагогического теста. Ведь каждый тест измеряет что-то заранее определенное.

Например, тест по физике измеряет знания, умения, навыки и представления испытуемых в данной науке. Одна из трудностей такого измерения заключается в том, что физическое знание изрядно сопряжено с математическим. Поэтому в тесте по физике экспертно устанавливается уровень математических знаний, используемых при решении физических заданий. Превышение принятого уровня приводит к смещению результатов; по мере превышения последние все больше начинают зависеть не столько от знания физики, сколько от знания другой науки, математики. Другой важный аспект - стремление некоторых авторов включать в тесты не столько проверку знаний, сколько умение решать физические задачи, вовлекая, тем самым, интеллектуальный компонент в измерение подготовленности по физике.

Гетерогенный тест представляет собой систему заданий возрастающей трудности, специфической формы и определенного содержания - система, создаваемая с целью объективного, качественного, и эффективного метода оценки структуры и измерения уровня подготовленности учащихся по нескольким учебным дисциплинам. Нередко в такие тесты включаются и психологические задания для оценки уровня интеллектуального развития.

Обычно гетерогенные тесты используются для комплексной оценки выпускника школ, оценки личности при приеме на работу и для отбора наиболее подготовленных абитуриентов при приеме в вузы. Поскольку каждый гетерогенный тест состоит из гомогенных тестов, интерпретация результатов тестирования ведется по ответам на задания каждого теста (здесь они называются шкалами) и кроме того, посредством различных методов агрегирования баллов делаются попытки дать общую оценку подготовленности испытуемого.

Напомним, что традиционный тест представляет собой метод диагностики испытуемых, в котором они отвечают на одни задания, в одинаковое время, в одинаковых условиях и с одинаковой оценкой. При такой ориентации задачи определения точного объема и структуры освоенного учебного материала отступают, по необходимости, на задний план. В тест отбирается такое минимально достаточное количество заданий, которое позволяет сравнительно точно определить, образно говоря, не "кто что знает", а "кто знает больше". Интерпретация результатов тестирования ведется преимущественно на языке тестологии, с опорой на среднюю арифметическую, моду или медиану и на так называемые процентильные нормы, показывающие - сколько процентов испытуемых имеют тестовый результат хуже, чем у любого взятого для анализа испытуемого с его тестовым баллом. Такая интерпретация называется нормативно-ориентированной. Здесь вывод достраивается рейтингом: задания ответы выводы о знаниях испытуемого рейтинг, понимаемый как вывод о месте или ранге испытуемого.

Интегративные тесты. Интегративным можно назвать тест, состоящий из системы заданий, отвечающих требованиям интегративного содержания, тестовой формы, возрастающей трудности заданий, нацеленных на обобщенную итоговую диагностику подготовленности выпускника образовательного учреждения. Диагностика проводится посредством предъявления таких заданий, правильные ответы на которые требуют интегрированных (обобщенных, явно взаимосвязанных) знаний двух и большего числа учебных дисциплин. Создание таких тестов дается только тем преподавателям, которые владеют знаниями ряда учебных дисциплин, понимают важную роль межпредметных связей в обучении, способны создавать задания, правильные ответы на которые требуют от учащихся знаний различных дисциплин и умений применять такие знания.

mirznanii.com

Тесты как метод психодиагностики. Классификация тестов

Тесты (в переводе с английского "испытание", "проверка", "проба") — это стандартизированные краткие и чаще всего ограниченные во времени испытания, предназначенные для установления количественных (и качественных) индивидуально-психологическихразличий.

Тесты можно классифицировать в зависимости от того, какой признак взят за основание деления. Наиболее значительными представляются следующие три основания для классификации: форма, содержание и цель психологического тестирования.

Формы психологического тестирования

По форме тесты могут быть индивидуальные и групповые; устные и письменные; бланковые, предметные, аппаратурные и компьютерные; вербальные и невербальные (практические).

Индивидуальные и групповые (коллективные) тесты. Индивидуальные тесты — это такой тип методик, когда взаимодействие экспериментатора и испытуемого происходит один на один. Эти тесты имеют большую историю. С них началась психодиагностика. Индивидуальное тестирование имеет свои преимущества: возможность наблюдать за испытуемым (за его мимикой, другими непроизвольными реакциями), слышать и фиксировать непредусмотренные инструкцией высказывания, что позволяет оценить отношение к тестированию, функциональное состояние испытуемого и др. Кроме того, психолог, опираясь на уровень подготовленности испытуемого, может по ходу эксперимента заменить один тест другим. Индивидуальная диагностика необходима при работе с детьми младенческого и дошкольного возраста, в клинической психологии — для тестирования лиц с соматическими или нервно-психическими нарушениями, людей с физическими недостатками и т.д. Необходима она и в тех случаях, когда нужен тесный контакт экспериментатора и испытуемого с целью оптимизации его деятельности. Для индивидуального тестирования нужно, как правило, много времени. Оно предъявляет высокие требования к уровню квалификации экспериментатора. В этом отношении индивидуальные тесты менее экономичны по сравнению с групповыми.

Групповые тесты — это такой тип методик, который позволяет одновременно проводить испытания с очень большой группой людей (до нескольких сот человек).

Одно из главных преимуществ групповых тестов — массовость испытаний. Другое преимущество — инструкции и процедура проведения достаточно просты, и от экспериментатора не требуется высокой квалификации. При групповом тестировании в большой степени соблюдается единообразие условий проведения эксперимента. Обработка результатов обычно носит более объективный характер. Результаты большинства групповых тестов могут обрабатываться на ЭВМ. Еще одно преимущество группового тестирования — относительная легкость и быстрота сбора данных и как следствие более благоприятные по сравнению с индивидуальным тестированием условия для сопоставления с критерием. Для большинства современных стандартизированных тестов нет ничего необычного в том, что их нормативные выборки включают от 100 до 200 тыс. человек, в то время как даже наиболее тщательно разработанные индивидуальные тесты при стандартизации с трудом набирают данные для 2—4 тыс. человек.

Однако следует отметить и определенные недостатки группового тестирования. Так, у экспериментатора гораздо меньше возможностей добиться взаимопонимания с испытуемым, заинтересовать его и заручиться его согласием сотрудничать. Любые случайные состояния испытуемого, такие, как болезнь, утомление, беспокойство и тревожность, которые могут влиять на выполнение заданий, гораздо труднее выявить в групповом тестировании. В целом лица, незнакомые с такой процедурой, скорее покажут более низкие результаты в групповых тестах, нежели в индивидуальных. Поэтому в тех случаях, когда принимаемое по результатам тестирования решение важно для испытуемого, желательно дополнить результаты группового тестирования либо индивидуальной проверкой неясных случаев, либо информацией, полученной из других источников.

Устные и письменные тесты. Эти тесты различаются по форме ответа. Устными чаще всего бывают индивидуальные тесты, письменными — групповые. Устные ответы в одних случаях могут формулироваться испытуемым самостоятельно ("открытые" ответы), в других — он должен из нескольких предложенных ответов выбрать и назвать тот, который считает правильным ("закрытые" ответы). В письменных тестах ответы даются испытуемым или в тестовой тетради, или на специально разработанном бланке ответов. Письменные ответы также могут носить "открытый" или "закрытый" характер.

Бланковые, предметные, аппаратурные, компьютерные тесты. Эти тесты различаются по материалу оперирования. Бланковые тесты (другое широко известное название — тесты "Карандаш и бумага") представлены в виде тетрадей, брошюр, в которых содержится инструкция по применению, примеры решения, сами задания и графы для ответов (если тестируются дети младшего возраста). Для старших подростков предусмотрены варианты, когда ответы заносятся не в тестовые тетради, а на отдельные бланки. Это позволяет использовать одни и те же тестовые тетради многократно, до тех пор, пока они не износятся. Бланковые тесты могут применяться как при индивидуальном, так и при групповом тестировании.

В предметных тестах материал тестовых задач представлен в виде реальных предметов: кубиков, карточек, деталей геометрических фигур, конструкций и узлов технических устройств и т.п. Наиболее известные из них — кубики Косса, тест сложения фигур из набора Векслера, тест Выготского—Сахарова. Предметные теста в основном проводятся индивидуально.

Аппаратурные тесты — это такой тип методик, который требует применения специальных технических средств или специального оборудования для проведения исследования или регистрации полученных данных. Широко известны приборы для исследования времени реакции (реактометры, рефлексометры), устройства для изучения особенностей восприятия, памяти, мышления. В последние годы аппаратурные тесты широко используют компьютерные устройства. С их помощью моделируются различные виды деятельности (например, водителя, оператора). Это особенно важно для профессиональной   диагностики,   ориентированной   на   определенный   критерий.   В большинстве случаев аппаратурные тесты проводятся индивидуально.

Компьютерные тесты. Это автоматизированный вид тестирования в форме диалога испытуемого и ЭВМ. Тестовые задания предъявляются на экране дисплея, а ответы испытуемый вводит в память ЭВМ с помощью клавиатуры; таким образом, протокол сразу создается как набор данных (файл) на магнитном носителе. Стандартные статистические пакеты позволяют очень быстро проводить матема-тико-статистическую обработку полученных результатов по разным направлениям. При желании можно получить информацию в виде графиков, таблиц, диаграмм, профилей.

С помощью компьютера экспериментатор получает для анализа такие данные, которые без ЭВМ получить практически невозможно:

время выполнения заданий теста, время получения правильных ответов, количество отказов от решения и обращения за помощью, время, затрачиваемое испытуемым на обдумывание ответа при отказе от решения, время ввода ответа (если он сложен) в ЭВМ и т.д. Эти особенности испытуемых можно использовать для углубленного психологического анализа в процессе тестирования.

Вербальные и невербальные тесты. Эти тесты различаются по характеру стимульного материала. В вербальных тестах основным содержанием работы испытуемых являются операции с понятиями, мыслительные действия, осуществляемые в словесно-логической форме.

Составляющие эти методики задания апеллируют к памяти, воображению, мышлению в их опосредованной речевой форме. Они очень чувствительны к различиям в языковой культуре, уровню образования, профессиональным особенностям. Вербальный тип заданий наиболее распространен среди тестов интеллекта, тестов достижений, при оценке специальных способностей (например, творческих).

Невербальные тесты — это такой тип методик, в которых тестовый материал представлен в наглядной форме (в виде картинок, чертежей, графических изображений и т.п.). Они включают речевую способность испытуемых только в плане понимания инструкций, само же выполнение этих заданий опирается на перцептивные, психомоторные функции. Самым известным невербальным тестом являются Прогрессивные матрицы Равена. Невербальные тесты уменьшают влияние языковых и культурных различий на результат обследования. Они также облегчают процедуру обследования испытуемых с нарушением речи, слуха или с низким уровнем образования. Невербальные тесты широко используются при оценке пространственного и комбинаторного мышления. В качестве отдельных субтестов они включены во многие тесты интеллекта, общих и специальных способностей, тесты достижений.

Классификация тестов по содержанию

hr-portal.ru

Окончательная форма теста

Психология Окончательная форма теста

просмотров - 25

Занятие 7. Тест нервно-психической адаптации

И. Н. Гурвич

Вводные замечания.Тест разработан в отделœении психопрофилак­тики и внебольничной психиатрии Психоневрологического научно-исследовательского института им. В. М. Бехтерева. Конкретно-мето­дологической основой теста послужила концептуальная модель пред-болезненных состояний в психиатрии, выдвинутая С. Б. Семичовым. Им же разработаны концепты симптомов, содержащиеся в первич­ной форме теста.

Назначение и содержание теста.Это психиатрический тест, что на операциональном уровне выражается в выявлении уровня нервно-психической адаптации путем установления наличия и выраженно­сти у индивида некоторых психиатрических симптомов. Такая его направленность выражается еще и в том, что крайними категориями многомерной шкалы адаптации выступают абсолютное (идеальное) нервно-психическое здоровье и вероятное болезненное нервно-пси­хическое состояние.

Тест может быть применен:

• в качестве самостоятельной клинико-психологической методики;

• составе методического оснащения программ, направленных на изучение факторов нервно-психического здоровья популяций, когда тестовые оценки представляют собой результирующую пе­ременную, отражающую влияние факторов, изучаемых в эпиде­миологическом аспекте;

• в составе двухшаговых скрининговых процедур — для первого шага скрининга, в этом случае тест позволяет расслоить популя­цию по уровню нервно-психического здоровья.

Состав. Тест состоит из 26 суждений, что практически достаточно для гомогенного теста. Суждения отобраны по результатам оценки надежности и валидности первичной формы теста и размещены в случайном порядке. Каждое из них имеет 4-балльную шкалу с нулевым делœением (ᴛ.ᴇ. подразумевающую возможность отсутствия симптома), относящуюся к так называемым шкалам последовательных интервалов. Получение итоговых оценок осуществляется путем суммирования.

Шкалы построены по типу шкалы Ликерта; они идентифицируют сим­птом с преходящей реакцией, актуальной реакцией, состоянием или развитием. Окончательная форма теста приведена в табл. 7.1.

Таблица 7.1

Симптом Есть и всœегда было Есть уже длитель­ное время Появилось в послед­нее время Было в прошлом, но сейчас нет Нет и не было
Бессонница          
Ощущение, что окружающие не­одобрительно к вам относятся          
Головные боли          
Изменение настрое­ния без видимых причин          
Боязнь темноты          
Чувство, что вы ху­же других людей         '
Склонность к сле­зам, плаксивость         _
Ощущение «комка» в горле          
Боязнь высоты          
Быстрая утомляе­мость, чувство усталости        
Неуверенность в се­бе и в своих силах          
Сильное чувство вины          
Опасения но пово­ду тяжелого забо­левания (не под­твержденного при обследовании)          
Боязнь находиться одному в помеще­нии или на улице          
Опасение покра­снеть «на людях»          
Трудности в обще­нии с людьми          
Необоснованный прах за себя, других людей, боязнь ка­ких-либо ситуаций          
Дрожание рук, ног, невозможность сдержать проявле­ния своих чувств          
Сниженное или подавленное на­строение          
Сердцебиение          
Беспричинная тре­вога, «предчувст­вия», чувство, что может произойти что-то неприятное          
Безразличие ко всœему          
Раздражительность, вспыльчивость          
Повышенная пот­ливость          
Чувство слабости          

Сндартизационная выборка. Тест стандартизирован на «гнездной» выборке работников производственного объединœения «Невский завод» (Санкт-Петербург). «Гнездами» служили цеховые врачебные участки. Объем выборки, сформированной путем сплошного «внутригнездного» отбора, составил 2203 единицы. При оценке по t-критерию Стьюдента оказалось, что по полу для большинства возрастных групп стандартизационная выборка достаточно хорошо репрезентирует гене­ральную совокупность работников крупного промышленного предпри­ятия, а различия достоверно (при Р >0,01) устанавливаются лишь по относительно малочисленным группам занятых в возрасте 18-25 лет и 56 лет и старше.

Проведение теста.Тест относится к типу «карандаш—бумага» и допу­скает групповое проведение в виде анкетного опроса. Для оценки ре­зультатов необходим ключ — прозрачная «сетка», где нанесены шкаль­ные оценки значений ответов.

Позиция интервьюера индифферентная. Инструкция респонден­там дается в терминах опросного исследования, употребление здесь слова «тест» нежелательно. Она может звучать примерно так:

На вашем предприятии (в организации, городе и т. д.) проводится исследование для совершенствования медицинской помощи и предупреждения нервно-психических расстройств.

Просим вас заполнить вопросник. Ваши ответы помогут улучшить диспансерное обслуживание (работающих на вашем предприятии, проживающих в вашем городе и т. д.). Заполненный опросник не подлежит огласке и не может быть использован для медицинского учета или каких-либо других административных целœей.

Все вопросы имеют готовые варианты ответа и не требуют длительно обдумывания. Отметьте знаком «+» (по каждой строке в соответствующему вашему ответу столбце), были ли когда-нибудь у вас явления, которыми, как правило, отвечает психика человека на трудные жизненные обстоятельства, болезни.

Время заполнения бланка — около 5 мин. Нередко у респондентов возникает вопрос о выборе варианта ответа͵ если симптом отмечается «иногда». В этом случае говорится, что такая характеристика относится практически ко всœем перечисленным симптомам, поскольку ни один из них не может присутствовать «постоянно», и предлагается указать, «давно ли появился» данный симптом.

Важным деонтологическим аспектом поведения интервьюера выступает акцентирование того факта͵ что ответы на тест не являются основанием для установления психиатрического диагноза, а сам те предназначен для психически здоровых людей.

Ключ и обработка данных.Перевод градаций шкал (I) в баллы (II) производится так: (табл. 7.2).

Таблица 7.2

Читайте также

  • - Окончательная форма теста

    Занятие 7. Тест нервно-психической адаптации И. Н. Гурвич Вводные замечания.Тест разработан в отделении психопрофилак­тики и внебольничной психиатрии Психоневрологического научно-исследовательского института им. В. М. Бехтерева. Конкретно-мето­дологической... [читать подробенее]

  • oplib.ru

    56. Основные этапы создания теста.

    Создание теста - это результат процесса мышления, с одной стороны, и соблюдение определенных правил конструирования - с другой.

    Психологический тест может быть охарактеризован как эффективный инструмент при условии, что он удовлетворяет определенным требованиям. Основные из них следующие:

    1. Использование психометрической шкалы не ниже интервальной.

    2. Высокая надежность теста.

    3. Высокий уровень валидности теста.

    4. Хорошая различительная способность каждого задания теста, т.е. дискриминативность.

    5. Наличие нормативных данных, или возможность описания результатов теста с высокой точностью различными моделями, наличие критериев, установленных экспертами.

    1. Разработка первичной формы теста.

    1. Выбор предмета диагностики.

    2. Анализ и теоретическая разработка предмета диагностики, которая заключается в создании теоретического и операционального определения предмета диагностики.

    3. Выбор области валидности применяемого теста.

    4. Выбор шкалы ответов.

    5. Выбор типов задний в соответствии с характером ответа.

    6. Составление и формулирование заданий теста, определение порядка размещения их в тесте.

    7. Проведение созданной формы на специально подобранной выборке.

    2. Психометрическая проверка теста.

    1. Анализ пунктов теста. Смысл этой процедуры состоит в том, чтобы определить насколько каждое задание теста соответствует общему диагностическому содержанию методики.

    2. Проверка основных видов надежности теста. Задачей данной процедуры является определение того, насколько результаты тестирования подвержены влиянию различных побочных факторов.

    3. Оценка основных видов валидности или обоснованности теста. Задачей данной процедуры является определение того, насколько хорошо создаваемая методика выполняет свои диагностические задачи, т.е. диагностирует тот конструкт, который лежит в ее основе.

    3. Расчет нормативных показателей.

    Надежность теста. Дисперсия результатов попадания может быть объяснена не только дисперсией «истинной», обусловленной различиями в выраженности психологического качества, но и разбросом, вызванным действием случайных факторов, т.е. дисперсией «погрешности»:

    Dx = Dист. + Dпогр.

    Отношение дисперсии истинной к дисперсии совокупной и будет называться коэффициентом надежности измерения.

    Источником D «погрешности» являются разного рода ошибки. Появление ошибок может быть вызвано разными причинами, среди которых можно выделить две: неточность измерительного инструмента и условия опыта.

    Под надежностью теста в самом широком смысле понимается характеристика того, в какой степени выявленные у испытуемых различия по тестовым результатам отражают действительные различия в измеряемых свойствах, а в каком они могут быть приписаны действию случайных факторов.

    Надежность как устойчивость результатов. Надежность как устойчивость результатов во времени представляет собой согласованность результатов теста, получаемых при первичном и вторичном его применении по отношению к одним тем же испытуемым в разные моменты времени.

    Ретестовой надежности - процедуры повторного тестирования одной и той же выборки. Повышение надежности в этом случае свидетельствует о повышенной чувствительности результатов тестирования к изменению состояния испытуемых и обстановки тестирования. При определении ретестовой надежности особое значение имеет интервал между первичным и повторным тестированием. Оптимальный интервал для ретестовой надежности - 6 месяцев для взрослых и 3 месяца для детей.

    Надежность параллельных форм. Использование двух взаимозаменяемых форм теста. Обследовании выборки сначала основным набором заданий, а затем - дополнительным, аналогичным первому. Другим путем проверки этого вида надежности является разбиение всей выборки на две примерно равные группы. Первичное тестирование заключается в тестировании первой группы одной формой теста (А), а второй группы - аналогичной формой (В). После небольшого интервала времени (примерно около недели) проводится повторное тестирование в обратном порядке.

    Надежность как точность измерений. Наличие внутренней согласованности между заданиями теста и их «суммарную работу на общую цель - точное измерение тестируемой характеристики». Процедура проверки предполагает вычисление интеркорреляционных связей между заданиями, составляющими тест. Метод расщепления - тестировании испытуемого двумя половинками теста. Существуют несколько способов расщепления теста пополам. Данный способ определения надежности как внутренней согласованности часто называют надежность по однородности.

    Надежность относительно постоянства условий - проявляется в надежности экспериментатора. В любом исследовании экспериментатор может выполнять три функции: организатора исследования, оценщика и интерпретатора.

    Валидность теста. В понятие валидности входит большое количество самой разнообразной информации о тесте. Понятие валидности относится не столько к самому тесту, сколько к цели, ситуации и процедуре его применения. Он может быть валидным или невалидным лишь по отношению к определенной цели применения.

    Критериальная валидность - отражает соответствие диагноза и прогноза определенному кругу критериев измеряемого качества. Она измеряется путем корреляции баллов по тесту и показателей по внешнему параметру, избранному в качестве критерия, причем это должен быть именно внешний, т.е. жизненный, независимый от тестирования критерий. Критериальная валидность делится на:

    Текущая валидность - это характеристика теста, отражающая его способность различать испытуемых на основании диагностического признака, являющегося объектом исследования в данной методике (уровень способностей, вербальный интеллект, тревожность и т.д.).

    Прогностическая валидность характеризует степень точности и обоснованности суждений о диагностируемом качестве по его результату, спустя определенное время после его измерения.

    Характеристики критериальной меры:

    1. Релевантность критерия. Это степень, в которой критериальная мера значима для целей измерения; 2. Свобода от «загрязнения» (контаминации). Выполнение индивидом работы является функцией как переменных индивида, так и переменных ситуации; 3. Надежность критерия. Если критерий используется в качестве показателя исполнения работы индивидом, это должен быть стабильный показатель.

    Конструктная валидность. Конструктная валидность теста показывает, насколько его результаты могут рассматриваться в качестве меры некоего теоретического конструкта или свойства. Проверка конструктной валидности может осуществляться следующими способами: 1. Сопоставление исследуемого теста с другими методиками, конструктное содержание которых известно; 2. В этом случае исследователь формулирует ряд предсказательных гипотез о том, как будет коррелировать его новый тест с другими тестами, измеряющими родственные характеристики; 3. Факторный анализ - позволяет статистически проанализировать структуру связей исследуемого теста с другими известными и латентными факторами - факторную валидность; 4. Внутренняя согласованность пунктов теста также является важным аспектом конструктной валидности; 5. Введение экспериментальной переменной.

    Содержательная валидность - характеризующей степень репрезентативности содержания заданий теста измеряемой области психических свойств.

    Другие виды валидности: синтетическая валидность, очевидная валидность, экологическая валидность

    studfiles.net


    Смотрите также