Психометрические характеристики теста. Характеристики теста


Тестологические характеристики

Поиск Лекций

Одной из важнейших составляющих современного теста являются его тестологические характеристики. Тестологические характеристики – это измерительные качества теста, которые появляются только в процессе использования его на апробационных выборках тестируемых. Создание так называемого качественного теста, обеспеченного соответствующими тестологическими характеристиками, – процесс сложный и длительный, связанный с выбором математической модели конструирования теста, наполнением ее заданиями, проведением апробационного тестирования, параметризацией, последовательным совершенствованием для достижения соответствия заданным целям и тестологическим свойствам методами последовательных итераций.

Важной характеристикой тестирования является различие тестовых баллов у разных испытуемых – вариация тестовых баллов. Отсутствие вариации свидетельствует либо о том, что все обладают одинаковыми знаниями, либо о несостоятельности теста в дифференцировке знаний испытуемых. Так, при традиционных экзаменах пятибалльная шкала снижает вариацию даже там, где она есть (например, на вступительных испытаниях сотни абитуриентов получают тройки, хотя качество знаний таких абитуриентов может сильно отличаться), в то время как тесты ее заметно повышают (на 100–балльной шкале вариация результатов достаточно высока). Удобной мерой вариации результатов тестирования является дисперсия. Это особенно важно для организации адаптивного компьютерного тестирования. Сопоставление в ло–гитах (на единой шкале переменной) уровня знаний испытуемого и трудности задания позволяет ЭВМ из любого множества заданий для любого числа испытуемых подбирать индивидуальные задания и соответственно оценивать результаты ответов. Эффективность этого метода оказала огромное влияние на развитие зарубежной и отечественной педагогической теории и практики.

Согласно теории педагогических измерений тесты могут быть качественными и давать достоверные результаты только в том случае, если они предварительно апробированы на типичных выборках испытуемых и показывают соответствие заложенным при разработке взаимосвязанным свойствам надежности и ва–лидности. В трудах теоретиков–тестологов валидность трактуется как многомерная характеристика теста, включающая сведения об области исследуемых явлений и репрезентативности тестовой методики по отношению к ней [93-95]. Валидность теста можно определить как совокупность характеристик, определяющих соответствие теста поставленной цели. Нередко процесс создания теста носит многоцелевой характер, поэтому часто стараются проверить валидность с разных позиций, основываясь на различных критериях целевой адекватности теста.

Надежность теста понимается как способность давать одни и те же результаты при его применении к одинаковым выборкам тестируемых и характеризуется устойчивостью результатов тестирования. Идея достижения требуемой точности педагогических измерений заданиями теста теоретически задается надежностью теста. Это вытекает из известного постулата о неизбежности погрешности любых измерений: имеряемая величина Х не равна истинному значению Т [1]. В практическом смысле надежность понимается как мера одинаковости, повторяемости и связанности двух измерений одного и того же качества одним и тем же тестом или его параллельными вариантами [219]. Выделяется несколько типов надежности:

• реестровая надежность, определяемая посредством повторного тестирования испытуемых с помощью одного и того же теста;

• надежность параллельных форм, которая определяется с помощью тестирования одной и той же группы испытуемых параллельными тестами;

• надежность частей теста – анализ устойчивости результатов отдельных блоков теста (в практике обычно для определения надежности прибегают к комбинированию различных типов).

Значение надежности наиболее просто рассчитывается по коэффициентам корреляции между результатами двукратного тестирования одного и того же контингента испытуемых по эквивалентным вариантам тестов. О надежности тестов судят по степени сохранения ранговых позиций испытуемых. На практике по ряду причин это используется редко. Иногда для определения надежности гомогенных тестов по коэффициенту корреляции используется метод расщепления, описанный и использованный в работах А. Анастази и С. Урбина [9], Ю.М. Неймана и В.А. Хлебникова [134], М.Б. Челышковой [199]. Для этого тест разделяют на две эквивалентные половины. Затем стандартным способом вычисляют коэффициент корреляции r ' между результатами тестирования по двум половинам теста. При этом получается значение корреляции только половины теста, для целого теста она получается из соотношения r = 2r '/(1 + r ' ).

Способность теста соответствовать поставленным задачам, т.е. пригодность тестовых результатов для определенной цели, задается валидностью. Валидность – это методологическая характеристика способности теста измерять то, для чего он был создан. Она зависит от качества заданий, их числа, степени полноты и глубины охвата содержания учебной дисциплины в заданиях теста; баланса и распределения заданий по трудности; метода отбора заданий из общего банка, от интерпретации результатов тестирования; организации сбора данных, отбора выборки испытуемых [1]. Как отмечает Э. Стоунс, "валидность – ахиллесова пята тестирования" [173]. В понятие валидности входит самая разнообразная информация о тесте, которая анализируется различными типами валидности:

• диагностической (конкурентной), отражающей способность теста дифференцировать испытуемых по изучаемому признаку; это возможность по результатам тестирования судить о структуре знаний, умений и навыков испытуемых;

• прогностической, определяющей "степень обоснованности и статистической надежности исследования измеряемого качества в будущем; возможность отбора учащихся по определенным признакам, например абитуриентов, способных успешно обучаться в вузе" [219].

Различают понятия валидности по "содержанию, критериаль–ности, конкурентности и т.д." [134].

Эмпирическая валидность – независимый показатель, в котором используются экспертные оценки и характеристики теста, данные специалистами (педагогами, учеными–экспертами, сотрудниками центра тестирования и др.).

Конструктивная валидность используется при сложности или невозможности подобрать адекватные критерии валидизации. При этом используется комплекс характеристик, свидетельствующих о теоретической обоснованности методики, соответствии полученных с помощью теста результатов теоретическим ожиданиям и закономерностям.

Содержательная валидность отображает комплекс сведений о репрезентативности тестовых заданий как отражении всех важнейших составляющих контролируемых знаний. Содержательная валидность зависит от качества и числа заданий, степени полноты и глубины охвата содержания учебной дисциплины в заданиях теста по темам. Важно также распределение заданий по трудности.

К указанным выше типам валидности в педагогической литературе В.С. Аванесов, В.П. Беспалько, И.П. Подласый и многие другие добавляют:

• функциональную валидность, определяющую соответствие задания уровню усвоения контролируемых знаний;

• критериальную валидность, связанную с направленностью теста на измерение знаний по тем или иным заранее определенным критериям, например соответствие контролируемых знаний образовательному стандарту. Количественной мерой критериальной валидности служат коэффициенты ранговой и бисериальной корреляции между показателями теста и критериальной мерой, задаваемой при конструировании теста.

Построение числовой системы, в которой отношения между различными объектами тестирования выражены свойствами числового ряда, называется шкалированием. Для шкалирования результатов тестирования важное значение имеет структура нормативной выборки, представляющей группу тестируемых, содержащую представителей всех наиболее значимых страт, реально отражающих те же пропорции, что и выборка испытуемых. Преобразование шкал на основе анализа статистических результатов нормативной выборки "позволяет повысить качество педагогических измерений и выставить каждому испытуемому тестовый балл вне зависимости от того, в какой группе и над каким вариантом теста он работал" [190]. Эта процедура в настоящее время находится на стадии совершенствования и вызывает достаточно много споров.

В практике массового тестирования в качестве нормативной используется генеральная выборка, включающая всех обучающихся, участвующих в тестировании по данной учебной дисциплине. В сертификатах тестирования помимо тестового балла может быть указан рейтинг учащегося, который определяет место (ранг) тестируемого среди всех участников. Это, например, дает возможность выпускнику оценить свои конкурентные (конкурсные) возможности. При систематическом тестовом контроле появляется возможность по среднему рейтингу обучающихся формировать рейтинг образовательного учреждения, по рейтингу абитуриентов – рейтинг вузов. Все это может обеспечить условия для открытости всей системы образования. При этом пользователями результатов тестирования могут быть не только обучающиеся, но и родители, учителя, руководители общеобразовательных учреждений, органы управления образованием всех уровней и др.

Ежегодный статистический отчет, составляемый по итогам массового тестирования учащихся общеобразовательных учреждений, содержит детальную информацию о всех тестируемых, статистические данные о результатах тестирования по любой выборке учащихся, по каждому образовательному учреждению, району, городу, региону, стране в целом, по всем дисциплинам с указанием среднего тестового балла, средних оценок по пятибалльной шкале, процентов учащихся, правильно выполнивших задания. Материалы статистического отчета по результатам тестирования предоставляют уникальную возможность для анализа учебных достижений при независимом стандартизированном контроле знаний учащихся и являются основой образовательной статистики [129-131, 192]. Само понятие образовательная статистика может быть раскрыто как совокупность статистических показателей подготовленности различных выборок учащихся по результатам массового независимого тестирования.

В статистических отчетах массового тестирования, как правило, приводится несколько показателей, характеризующих интегральную подготовленность учащихся: средний тестовый балл по совокупности всех предметов по России, по отдельным регионам, территориям и общеобразовательным учреждениям, по каждой дисциплине для разных выборок учащихся, по видам тестирования, а также указывается процент правильно выполненных заданий теста, систематизируются другие показатели.

Рассмотренная выше систематизация понятий современного тестирования позволяет перейти к рассмотрению вопросов методологии тестирования, практики конструирования и параметризации контрольно–оценочных материалов, описанию форм, методов и процедур тестового контроля, а также методов анализа результатов, полученных на основе мониторинга учебных достижений школьников. Методологию современного педагогического тестирования можно определить как учение об основных положениях, формах, методах, принципах научного исследования и организации практики педагогического контроля и оценки уровня подготовленности обучающихся. Принципы научной организации тестового контроля, выработанные на основе обобщения зарубежного и отечественного передового опыта, формулируются в виде свода правил, способствующих повышению эффективности тестирования.

 

poisk-ru.ru

384Таблица 9.1 Описательные характеристики теста «Калифорния q», максимально положительно и максимально отрицательно определяющие оптимальную психологическую приспособленность1

378Глава 9

КОРРЕЛЯЦИОННЫЕ ИССЛЕДОВАНИЯ

Теперь вы очень хорошо знаете, что такое эксперимент. Вероятно, вы даже убедились, что эксперимент, несмотря на все проблемы контроля, предлагает наилучший путь проверки гипотез относительно переменной, влияющей на поведение. Экспериментатор активно меняет независимую переменную и соотносит значения зависимой переменной с различными уровнями независимой переменной.

С теми знаниями, которые вы приобрели, попробуйте спланировать эксперимент для каждой ид следующих трех гипотез, касающихся поведения.

1. Правильные методы воспитания детей приводят к тому, что, повзрослев, люди проявляют лучшую психологическую приспособленность; дети, в отношении которых использовались плохие методы, повзрослев, оказываются и плохо приспособленными. (Гипотеза кажется очевидной.)

2. Самый старший ребенок в семье будет иметь более высокий интеллект, следующий за ним по старшинству будет следующим и по интеллекту и т. д. (Кажется весьма сомнительной.)

3. Лица, получившие высокую оценку по специальному тесту на способности, преуспевают о работе контролера деталей машин более часто, чем лица с низкой оценкой. (Не лишена оснований.)

Если вы хотите сравнить результаты различных способов воспитания детей с помощью активного эксперимента1, вам придется убедить одну группу родителей использовать «хорошие» методы воспитания, например спокойные разъяснения (что не очень трудно), а другую 379группу — «плохие» методы воспитания, например, бессмысленную ругань. Конечно, обе группы семей должны быть тщательно уравнены но другим параметрам. Ну что же, желаю удачи!

И все-таки задача такого эксперимента значительно легче, чем задача провести активный эксперимент на тему о порядке рождения. С чего здесь начать? Ведь вы захотите проконтролировать не только количество детей в семье, но и интервалы между их рождениями. Если на то пошло, почему бы не проконтролировать и пол ребенка? Эти намерения уже приближают нас к футуристически планируемому миру, описанному с такой удручающей подробностью Джорджем Орвелом в его романе «1984 год». И при всем этом мы еще оказываемся далеки от эффективного эксперимента.

В принципе вышеописанные эксперименты возможны. Однако, в зависимости от вашего отношения к ним, они оказываются либо практически неосуществимыми, либо неэтичными. И тем не менее исследования этих гипотез были реально проведены. Только в них использовался не активный эксперимент, а корреляционный подход. Это значит, что в данных исследованиях не производилось активных действий с целью вызвать различия в поведении, а лишь отыскивалась корреляция между существующими различиями.

Для проверки первой гипотезы сравнивались психологически хорошо приспособленные взрослые и плохо приспособленные взрослые с учетом информации об их детстве, полученной путем объективных записей, а также с помощью опросов, которые были сделаны много лет назад, и, наконец, воспоминании. И мы увидим ниже, что хотя гипотеза кажется очевидной и правильной, возникают проблемы в ее доказательстве. Здесь мы столкнемся с теперь уже знакомым нам злом — смешением с сопутствующей переменной.

Во втором случае была взята большая группа молодых людей, родившихся примерно в одно и то же время, которая в возрасте 19 лет прошла испытания по тесту на интеллект. Затем были вычислены отдельно средине для рожденных первыми, вторыми и т. д. И вот было обнаружено, что, действительно, существует 380корреляция между порядком рождения и интеллектом. Хотя это звучит неправдоподобно, но это так.

Обстоятельства этого исследования — главное, очень большое число испытуемых — дали возможность его авторам применить статистические методы контроля для выявления смешения с побочными переменными. Однако, как мы увидим, контроль в корреляционных исследованиях никогда не бывает таким же убедительным, как в активных экспериментах.

Гипотеза о том, что тест на способности позволит выбрать хороших контролеров, не может быть исследована с помощью эксперимента по иной причине. В этом случае не существует независимой переменной, о воздействии которой на поведение могла бы идти речь. Здесь перед нами просто две различные оценки поведения одного и того же испытуемого. Индивидуальные различия испытуемых по данным теста на способности соотносятся с их индивидуальными различиями в способности приобретать профессиональные навыки. И тестовые оценки, и оценки качества работы аналогичны зависимой переменной из предыдущих глав. Однако когда нет независимой переменной, то нет оснований использовать и термин «зависимая переменная».

Эта глава будет особенно полезна тем из вас, кому в психологии более интересна работа с конкретными личностями, чем лабораторные исследования. Активные эксперименты имеют дело со сходными реакциями испытуемых, причем не обязательно людей, тогда как предметом корреляционных исследований, как правило, являются различия между людьми — по интеллекту, способностям или по отдельным чертам личности. Понятие личность полезно только потому, что люди различаются по многим параметрам. И тем не менее индивидуальные различия могут быть лучше изучены с помощью активного экспериментирования. Мы уже отмечали, что некоторые корреляционные исследования в принципе могли бы быть проведены, как активные эксперименты. Однако, ввиду того что это практически неосуществимо, здесь возникают новые проблемы внутренней валидности. Далее мы увидим, что корреляционное исследование так же, как и активный эксперимент, 381внутренне валидно в зависимости от того, насколько оно близко к идеальному эксперименту.

Ваше знакомство с этой главой значительно продвинет вас в понимании статей по корреляционным исследованиям. Прежде всего вы сможете увидеть, пытался ли исследователь проконтролировать смешивающиеся переменные. Вы сможете оценить, достаточно ли эффективны были использованные методы контроля. Вы даже окажетесь способны сами проводить определенные виды корреляционных исследований. Для этого вам достаточно будет познакомиться с примером исследования, где производится предсказание по тесту, и научиться по статистическому приложению вычислять коэффициент корреляции.

Читая эту главу, приготовьтесь ответить на вопросы по следующим темам.

1. Что понимается под корреляционным исследованием?

2. Почему в корреляционном исследовании всегда присутствует сопутствующее смешение?

3. Методы контроля сопутствующего смешения.

4. Условия, делающие возможным вычисление коэффициента корреляции.

5. Параметры, по которым корреляционные исследования отличаются друг от друга.

Исследование предпосылок оптимальной психологической приспособленности

Вы только что прочитали название статьи, написанной четырьмя исследователями: Эллен Сигельман, Джеком Блоком, Джин Блок и Анной ван дер Липпе (1970). Под предпосылками здесь подразумеваются некоторые факторы на ранней стадии жизни, которые впоследствии сказываются на способности к психологической адаптации. Не относитесь слишком строго к термину «оптимальная» приспособленность. Этот термин вовсе не означает, что исследователям удалось найти людей, которые достигли совершенства в этом отношении. Просто они обнаружили несколько человек в возрасте за 38230 лет, которые подошли к оптимальному уровню гораздо ближе, чем другие. В этом исследовании проводилось сравнение групп хорошо и плохо приспособленных лиц с точки зрения того, в каких семейных условиях они провели детство.

Удивительно, что исследование такого рода оказалось вообще возможным. Предположим, что вы нашли хорошо и плохо приспособленных взрослых. Как получить полноценные данные о способах их воспитания и тем более выяснить общие установки родителей, которые могли повлиять на эту приспособленность? Исследование действительно было необычным, поскольку требовало фундаментальной подготовительной работы более чем за 30 лет до того, как были идентифицированы обе группы.

Всего в исследовании был оценен 171 взрослый испытуемый с точки зрения психологической приспособленности. Затем для них искались корреляции с факторами-предпосылками.

Испытуемые

Получить детальную информацию о ранней стадии жизни стольких взрослых людей оказалось возможным в результате того, что все они в свое время были испытуемыми в двух «продолженных» исследованиях, проведенных Институтом благосостояния детей при Калифорнийском университете в Беркли. Продолженным называется такое исследование, в котором периодически возвращаются к изучению испытуемого в течение длительного периода времени. Исследовались дети, рожденные в конце 20-х годов в двух городах Беркли и Окленд в Калифорнии. Конечно, здесь требовалась помощь родителей. Хотя многие из первоначального набора испытуемых впоследствии оказались недоступны для обследования и некоторые вообще окончились, оставшееся число согласившихся участвовать в исследовании — 171 человек — было достаточно большим.

383Оценка психологической приспособленности

Большинство теперь уже взрослых испытуемых опрашивались тремя разными психологами, а остальные — только двумя. После опроса психолог составлял личностную характеристику испытуемых. Для этого он раскладывал набор стандартных описательных карточек по девяти классам, руководствуясь тем, в какой мере свойство личности, записанное на карточке, выражено у данного индивида. Например, на карточке могло значиться: «ищет оправдания своим ошибкам». Если психолог сталкивался с большим числом алиби, которые то и дело приводил для себя испытуемый, он помещал эту карточку в класс 1. Если эта особенность была присуща испытуемому лишь в небольшой мере, он помещал карточку в класс 4 или 5. Если же это свойство было совсем не характерно для испытуемого, он откладывал карточку в класс 9.

Всего использовалось 90 карточек из набора «Калифорнийский Q-набор» (Блок, 1961). Экспериментатор предварительно тренировался в том, чтобы в результате его оценок карточки распределялись по классам в соответствии с законом нормального распределения, с наибольшим количеством карточек в средних классах.

До начала основного исследования (Сигельман и др., 1970) отдельная группа психологов-клиницистов (всего 9 человек) также классифицировала описательные карточки. Но это делалось не для характеристики какого-то определенного индивида, а для получения общей картины оптимальной психологической приспособленности. Давайте посмотрим сначала на характеристики, которые в среднем были оценены как наиболее определяющие (положительно) оптимальную приспособленность. На табл. 9.1 слева представлены 13 карточек, которые были помещены в наивысшую категорию.

Каждого, кто произвел бы на интервьюирующего впечатление человека, отвечающего всем этим пунктам, несомненно, можно было бы считать образцом психологической приспособленности. Такой человек доводит дело до конца, остается спокойным, этичным и т. д.

№ карточки

Максимально положительные характеристики

№ карточки

Максимально отрицательные характеристики

1

2

3

4

35

Дружественный, способен к близкому общению, к сочувствию.

45

Имеет хрупкую систему эгозащиты; слабая интеграция, в условиях стресса или травмы дезорганизуется и снижает адаптивность.

2

Исключительно надежный и ответственный человек.

78

Чувствует себя жертвой и неудачником в жизни; жалеет себя.

60

Рефлексирует свои мотивы и поведение.

86

Преодолевает тревожность и конфликты (подавляет их), отказываясь признавать их; склонен к подавленности, избегает общения.

26

Продуктивный, доводит дело до конца.

22

Не чувствует личной значимости в жизни.

64

Социально восприимчив в широком смысле.

55

Склонен к самоуничижению.

70

Поведение этически выдержано. Не противоречит собственным личностным нормам.

40

Уязвим как для реальных, так и для воображаемых опасностей; вообще, труслив.

96

Ценит свою независимость и самостоятельность.

48

Держится с людьми на значительном расстоянии, избегает близкого межличностного общения.

77

Откровенен и искренен в общении с другими людьми.

68

Высоко тревожен.

53

Способен проникнуть в суть важной проблемы.

37

Лживый и лукавый, ненадежный.

51

Искренне ценит интеллект и знание1.

36

Склонен к негативизму, противоречиям, созданию препятствий, любит «совать палки в колеса»

33

Спокоен, мягок в обращении.

38

Враждебен к другим лицам4.

17

Ведет себя тактично и участливо.

76

Склонен проецировать свои чувства и мотивы на других.

3

Имеет широкий круг интересов3.

97

Эмоционально слеп. Имеет сглаженные, слабые аффекты.

1. Ссылка на Е. Сигельман и др. (1970).

2. Способности или собственные достижения здесь не рассматриваются.

3. Здесь не существенно, глубокие это интересы или поверхностные.

4. Здесь имеется в виду враждебность вообще, формы выражения указаны в других карточках.

385Свойства, определяющие отрицательный полюс приспособленности, расположены в правой части таблицы. Трудно быть ущербным одновременно по всем указанным здесь пунктам. Так, например, трудно представить себе человека, очень тревожного и в то же время со сглаженными эмоциями.

Для целей же настоящего исследования реально полезным оказался только положительный набор черт. По нему вычислялась степень приближения данного испытуемого к идеальной оптимальной приспособленности. Из общего числа — 171 человек — было выделено 2 группы: хорошо и плохо приспособленных лиц. В первую грунту было отнесено 30% всех испытуемых с наилучшими оценками, а во вторую группу — тоже 30% от всей выборки испытуемых, получивших наихудшие оценки по суммарному показателю оптимальной приспособленности. Всего 24 мужчины и 24 женщины были оценены как имеющие высокую оптимальную приспособленность, 24 мужчины и 24 женщины — как имеющие низкую оптимальную приспособленность (Сигельман и др., 1970, с. 285). Обратите внимание: средняя группа испытуемых далее не фигурировала в этом исследовании!

Оценка предпосылок

В активном эксперименте психологическая приспособленность выступала бы как зависимая переменная. Давайте рассмотрим теперь факторы-предпосылки, которые соответствовали бы независимой переменной.

Оценка атмосферы родительской семьи. Когда самим испытуемым было от 21 до 36 месяцев от роду, некоторых, хотя не всех, родителей посещали психологи и работники социальных учреждений. Они наблюдали «обращение родителей с ребенком». В результате по ряду пунктов была получена средняя балльная оценка. Среди них, например, готовность к браку или раздражительность, проявляемая как матерью, так и отцом.

Оценка матерей. Когда испытуемым было от 1 до 5 лет, психолог опрашивал всех матерей от двух до 386четырех раз. Были подвергнуты оценке как интеллектуальные, так и эмоциональные их свойства.

Воспоминания об окружающей обстановке детства. Взрослые испытуемые интенсивно опрашивались психологом. При этом «их поощряли вспоминать о характере родителей, их семейной жизни и вообще обо всей атмосфере в семье» (Сигельман, 1970, с. 185). После каждого опроса психолог классифицировал 93 карточки с описанием свойств окружающей обстановки: например, теплая и ориентированная на чувства; воспитание с помощью угроз или физических наказаний; придание большого значения положению в обществе, власти, материальным ценностям и т. д. Как и при измерении психологической приспособленности, карточки с обозначением обстоятельств, наиболее соответствовавших данному испытуемому, помещались в первые несколько классов, а наименее соответствующие — в классы 8 и 9.

Прочие данные. И наконец, была получена информация об IQ (коэффициенте интеллектуальности) испытуемого, социально-экономическом положении семьи, числе браков каждого родителя и т. д.

Результаты

Мы рассмотрим только главные результаты, чтобы не потеряться в деталях. Как утверждают авторы (Сигельман, 1970, с. 287), «в целом как для мужчин, так и для женщин семьи, порождающие высокую степень оптимальной приспособленности испытуемых, были более демократичными, более открытыми, с большей сексуальной совместимостью родителей, с более свободным обсуждением проблем и открытым выражением чувств (например, отцы у мужчин с высокой приспособленностью даже во время гнева были более откровенными), с большей согласованностью мировоззрения и с большей ориентацией на нематериальные и высшие культурные ценности. Эта значительная откровенность, так же (как и интеллектуальная направленность и большое удовлетворение от своей материнской роли, особенно проявлялась у матерей. Семьи испытуемых с низ

studfiles.net

Психометрические характеристики теста — Мегаобучалка

Конструктная валидностъ. Логика построения методики определялась теоретико-методологическим смыслом используемого понятия. Содержание измерений психологического пространства выделялось на протяжении более чем десяти лет нашей практической работы, а утверждения для опросника собирались в течение четырех лет; основанием для их включения была частота актуализации данной ситуации в психологической практике. В ходе практической работы обнаружилась различная частота жалоб, затрагивающих разные аспекты сохранности границ личности, поэтому количество пунктов, впоследствии отнесенных к тем или иным шкалам, также не совпадает. Эта картина сохранилась и после исключения утверждений со слабой силой различения. Естественно, что «вес» каждого утверждения неодинаков внутри как шкалы, так и опросника в целом, поэтому возникла необходимость нормализовать и перевести «сырые» баллы в стандартные единицы. Все пункты теста обсуждались с экспертами-психологами, имеющими богатую психотерапевтическую практику, и многократно редактировались.

Особенность опросника — содержание пунктов-утверждений, представляющих собой «единицы» суверенности психологического пространства, в качестве которых могут рассматриваться реакции субъекта в жизненных ситуациях «вызова» или внедрения. В качестве примера рассмотрим утверждение опросника № 69: «Меня раздражало, когда приходилось в детстве носить вещи старшей сестры или брата». Объективный смысл ситуации очевиден: ребенку предлагают надеть не свою вещь, тем самым потенциально ущемляя его. Это может вызывать у него переживание своей незначительности, подчиненности старшему по рангу — эти варианты отражаются в случае выбора респондентом ответа

«Да», соответствующего положению дел, при котором он, внутренне сопротивляясь, все же донашивает вещи старшего. Возможны и другие исходы: ребенок избегает носить чужое, потому что в семье есть материальный достаток, или он в семье единственный ребенок, или он носит вещи старшего с удовольствием. В этих случаях, конечно же, «удара» по границам психологического пространства респондент переживать не будет и выберет ответ «Нет», прибавляющий к показателю суверенности одну единицу.

Репрезентативность теста. Первоначальный вариант опросника включал в себя 100 утверждений, формулировка каждого из которых осуществлялась таким образом, чтобы соотношение положительных и отрицательных ответов приближалось к теоретическому, то есть составляло бы по 50%, что, однако, на практике достигается редко [36, 132, 40, 76, 152]. Исходя из этого, многие утверждения были отредактированы и смягчены. Мы приняли решение исключить те пункты, ответы на которые были бы одинаковыми более чем в 80% случаев, чтобы иметь возможность совершенствовать тест в дальнейшем (Таблица 2.3.1). Проанализировав соотношение ответов «Да» и «Нет» на выборке из 134 человек, 20 утверждений мы исключили из перечня как не дающие разброса ответов. Слабость этих пунктов объясняется недостаточной репрезентативностью обследуемой выборки, ограниченной по генерационному признаку (возможно, люди старшего возраста ответили бы иначе).

Таблица 2.3.1

Количество ответов «Да» на каждое утверждение теста(n=134, в %)

№ пункта
«Да»
№ пункта
«Да»
№ пункта
«Да»
№ пункта
«Да»

Содержательная валидность. Для содержательной валидности теста использовался метод контрастных групп [108, 110]. В исследовании приняло участие 102 респондента: 43 ученика школы № 57 (21 девочка, 22 мальчика), 19 учеников школы № 130 (12 девочек, 7 мальчиков), 11 воспитанников детского дома № 17 (5 девочек, 6 мальчиков) и 29 подростков, находящихся в Центре временного содержания несовершеннолетних преступников (ЦВСНП) (8 девочек, 21 мальчик), средний возраст которых составил 14,9 года.

Мы предположили, что различия показателей СПП будут наибольшими в случае изучения подростков, испытывающих максимально дружелюбное или максимально формальное к себе отношение, то есть опирались на социальный признак. Группу подростков, предположительно обладающих высокой суверенностью, мы обследовали в московских школах №№ 57 и 130.

Школа № 57 — одна из старейших в Москве; она известна своими богатыми традициями, высококвалифицированным коллективом преподавателей, среди которых много выпускников МГУ, специалистов, ведущих активную научно-исследовательскую работу. В отличие от большинства других школ, в ней трудится значительное количество преподавателей-мужчин. В соответствии с индивидуальными склонностями учеников в ней можно выбрать специализацию по математике или предметам гуманитарного цикла. В школе преобладают интеллектуальные ценности.

Вторая подгруппа предположительно суверенных подростков была отобрана в школе № 130 района «Хорошево-Мневники», где в основном живут представители рабочих и смешанных профессий. Класс, в котором предполагалось вести опрос, по мнению педагогов, относится к обычным. В школе работает психолог, отметивший достаточный уровень самосознания подростков и их интерес в психологическим исследованиям.

Группа предположительно депривированных была набрана из числа воспитанников детского дома № 17 Западного округа Москвы и Центра временного содержания несовершеннолетних преступников. В детском доме работает квалифицированный, сензитивный к состоянию и потребностям детей педагогический коллектив. В детском доме проживают преимущественно дети родителей-алкоголиков, которые лишены родительских прав или уже умерли: таким образом, жизнь детей тоже была очень

megaobuchalka.ru


Смотрите также