А-П

П-Я

А  Б  В  Г  Д  Е  Ж  З  И  Й  К  Л  М  Н  О  П  Р  С  Т  У  Ф  Х  Ц  Ч  Ш  Щ  Э  Ю  Я  A-Z

 


Таким образом, должно быть ясно, что аналогичные приемы под-
бора стимулов могут быть применены для любой переменной, кото-
рая была достаточно полно описана либо в клинических, либо в
научно-исследовательских публикациях. Однако, как показывает
наш пример, это совсем не простое занятие - найти адекватные
стимулы.
Конструирование других тестов мотивов
Основные тесты мотивов, тесты динамики, являются либо объек-
тивными, либо проективными. Но существуют и другие виды тестов
мотивов, и я уделю им лишь немного места, так как в принципе при
их конструировании не используется ничего такого, что бы не обсуж-
далось ранее.
Опросники на выявление динамики
Были разработаны некоторыеопросникинавыявлениединамики,
в которых измерялись не черты темперамента, как в большинстве
151
личностных опросников, а мотивационные цели. "Список личност-
ных предпочтений" Эдвардса (Personal Preference Shedule - EPPS,
Edwards, 1959) является примером такого опросника. За исключени-
ем того, что делается попытка формулировать задания, относящиеся
к побуждениям (drives), а не к чертам, методы конструирования
таких опросников ничем не отличаются от таковых при конструиро-
вания тестов темперамента. В самом деле, если вы помните, в обсуж-
дении типов заданий для личностных опросников мы уже использо-
вали EPPS в качестве примера. Таким образом, более нечего доба-
вить о конструировании тестов такого типа.
Опросники интересов
Были разработаны некоторые интересные тесты, в которых пред-
ставлены перечни интересов, а испытуемые должны ранжировать
или оценить их; затем вычисляются показатели для различных ин-
тересов. Примером такого подхода к измерению интересов может
быть тест Rothwell- Miller (Miller, 1968). Как и в предыдущем случае,
эти тесты конструируются так же, как и личностные опросники.
Часто используются критериально-ключевые признаки (criterion-
keying) , хотя возможно применение и факторно-аналитических ме-
тодов для проверки и обеспечения того, чтобы показатели теста были
независимы друг относительно друга.
Тест длящейся реакции (The Brook-Reaction Test)
В Великобритании был разработан один тест интересов, называе-
мый The Brook-Reaction Test (Heim и др., 1969), в котором испытуе-
мые вовлекаются в процесс свободного ассоциирования, а в качестве
стимулов используются неоднозначные слова, предъявляемые устно,
одно слово в двенадцать секунд. Оценка результатов строится на том,
что слова могут вызывать интерес, а могут быть пропущены, а также
отмечаются причудливые ассоциации. По этому описанию читате-
лям ясно, что The Brook-Reaction Test является объективным тестом.
В нем используются некоторые принципы из указанных в табл.4.1,
такие как свободная ассоциация и воображение при наличии интере-
са.
Шкалы настроений и состояний
Эти шкалы - тесты временных, преходящих состояний, таких
как гнев или печаль, в отличие от более устойчивых, относительно
стабильных черт темперамента. Теперь мы изучим процесс создания
таких тестов, но это будет сделано кратко, поскольку здесь примени-
мы все методы, которые рекомендовались для конструирования лич-
152
ностных опросников как тестов темперамента. В качестве примера,
для простоты, будет использовано состояние усталости. Основные
шаги конструирования могут быть представлены следующим обра-
зом.
Формулирование заданий
СОДЕРЖАНИЕ
Перечислите все особенности поведения и чувства, имеющие от-
ношение к состоянию усталости.
ФОРМА
Преобразуйте их в задания так, как описано для заданий опрос-
ников в главе 3 (стр.93). Здесь уместны все наши замечания, касаю-
щиеся преимуществ или недостатков различных типов заданий, как
и все советы по формулированию заданий и рекомендации по избега-
нию проявления основных установок на ответы.
Действительно, с точки зрения формулирования заданий разра-
ботка шкал настроений и шкал черт личности ничем не отличаются.
Фактически различия проявляются в содержании: задания для шка-
лы настроений будут с очевидностью относиться к временным, неста-
бильным чувствам и особенностям поведения. Шкалы настроений и
состояний могут иногда наиболее явно отличаться от шкал черт тем-
перамента по инструкции.
ИНСТРУКЦИИ
Для шкал настроений и состояний существенно, чтобы испытуе-
мые понимали, что они выполняют каждое задание в соответствии со
своими настоящими, имеющими место в данное время, а не обычны-
ми ощущениями и чувствами. Чтобы быть уверенным, что это дейст-
вительно так, очевидно полезно включать такое условие в формули-
ровку заданий. Например:
СОСТОЯНИЕ: Я действительно устал сейчас
Мои ноги болят от усталости
В данный момент у меня просто слипаются глаза
Только что я чуть не провалился в сон
ЧЕРТА: Я обычно устаю до предела
Мои ноги часто болят от усталости
Очень часто у меня просто слипаются глаза
Очень часто я ловлю себя на том, что проваливаюсь в сон
Можно посоветовать использовать такие инструкции, как: "Отве-
чайте на вопросы о своем настроении и ощущениях", или "Отвечайте
153
так, как вы чувствуетесебя сейчас, в настоящий момент, даже если
обычно вы себя чувствуете иначе".
Анализ заданий
Здесь мы должны помнить обо всех замечаниях, касающихся ана-
лиза заданий для шкал темперамента. Я не буду повторять их, за
исключением того, что подчеркну наиболее существенное.
ОЦЕНИВАНИЕ ЗАДАНИЙ
Для всех показателей значение статистической погрешности дол-
жно находиться в разумных пределах.
ФАКТОРНЫЙ АНАЛИЗ ЗАДАНИЙ
Если используется факторный анализ, придется преодолевать те
же трудности, что и с тестами темперамента.
БИСЕРИАЛЬНАЯ КОРРЕЛЯЦИЯ ЗАДАНИЯ И ОБЩЕГО ПО-
КАЗАТЕЛЯ ПО ТЕСТУ
Этот метод явно подходит для данного случая и чрезвычайно
полезен как соответствующий классической модели погрешностей
измерения и простой в использовании.
МЕТОДИКА КРИТЕРИАЛЬНЫХ КЛЮЧЕВЫХ ПРИЗНАКОВ
Для шкал настроений и состояний это вполне жизнеспособная
методика, с помощью которой можно получать экспериментально
выделенные критериальные группы (criterion groups) испытуемых.
Обычно указываемый недостаток конструирования тестов с помо-
щью методики критериальных ключевых признаков - невозмож-
ность обеспечения одномерности тестовой переменной. Однако, если
группы подобраны другими способами, или может быть выдвинуто
некоторое рациональное предположение для их комплектования, то
это замечание неуместно.
Это утверждение поясним на примере. Мы можем вызвать состо-
яние утомления у нашей критериальной группы, давая испытуемым
батарею трудных тестов и другие задания и, тем самым заставив их
выполнить ряд трудных действий, требующих концентрации сил. А
последним заданием будет заполнение нашего опросника усталости.
Должны быть отобраны те задания, с помощью которых достигалось
разделение данной группы и контрольной, или те показатели, ре-
зультаты по которым отличали пост-экспериментальныеот получен-
ных до или через некоторое время после того исследования, в котором
была вызвана усталость. Следует отметить, что описанный метод
конструирования теста при помощи методики критериальных клю-
154
чевых признаков является также демонстрацией валидности, так как
валидный тест должен быть дискриминативным по отношению к
созданным экспериментальным ситуациям. Эта процедура требует,
конечно, повторной проверки на других группах.
ВАЛИДИЗАЦИЯ ТЕСТА
Если мы конструировали тест усталости с помощью бисериальной
корреляции и методики критериальных ключевых признаков, то тог-
да для его валидизации необходимо, чтобы мы продемонстрировали,
помимо очевидной валидности заданий и факта измерения ими опре-
деленной переменной, что этим тестом определяется чувство или
состояние усталости. Лучшей проверкой этого был бы специальным
образом спланированный эксперимент, что говорит в пользу отбора
заданий по методике критериальных ключевых признаков. Так,
можно было бы предположить, что значение показателей после экс-
периментальных процедур возрастет. Аналогично, мы могли бы пол-
учить показатели индивидуумов, которых мы считаем уставшими
после экзаменов или экспедиций, а затем сравнить их с показателями
не уставших (контрольных) испытуемых или с их собственными по-
казателями, но полученными несколько позже.
И наконец, следовало бы обратить внимание на один аргумент,
приводимый Cattell (1973) и Cattell и Kline (1977). В их работах
указывалось, что даже если факторный анализ уже разработанного
теста настроения показывает, что некоторый фактор присутствует,
то это еще не означает, что с его помощью обязательно будет изме-
ряться настроение или состояние. Такой Л-анализ может обнаружить
как черты, так и состояния. Целесообразно применение либо Р-ана-
лиза, в котором выявляются колебания значений некоторого фактора
у одного человека с течением времени, либо -анализа, позволяю-
щего факторизировать ретестовые изменения показателей индиви-
дуумов. В то же время справедливо и то, что если тест показал себя
валидным в процессе экспериментальной валидизации, описанном
выше, при обсуждении методики критериальных ключевых призна-
ков, то тогда не имеет смысла подвергать его Р- или -анализу.
Однако это не означает, что не стоит использовать Р- и -анализ в
исследовании настроений.
Для многих состояний (таких как депрессия или злость) экспери-
ментальные манипуляции не так просты, как в случае с усталостью,
по практическим, а иногда и по этическим соображениям. В таких
случаях -анализ больших выборок, протестированных в двух си-
туациях без экспериментального манипулирования, должен позво-
лить продемонстрировать валидность теста.
155
Краткий обзор
Шкалы состояний могут конструироваться точно так же, как шка-
лы темперамента, за исключением содержания заданий и точных
инструкций к тесту, в которых всегда подчеркивается то, что ответы
испытуемых должны касаться их состояния на момент обследования.
Валидизация лучше всего достигается путем экспериментального
создания настроения или состояния, если это возможно, в противном
случае необходим факторный Р- или -анализ, -анализ сам по
себе, без дальнейших свидетельств валидности, не эффективен.
Измерение аттитюдов
Существует три обычно используемых типа шкалы аттитюдов:
шкалы Терстоуна, шкалы Гутмена и шкалы Лайкерта. Однако я
намереваюсь обсудить полностью только конструирование шкал
Лайкерта, поскольку для двух других существуют серьезные пробле-
мы, из-за которых возможность их использования подвергается со-
мнению. Мы кратко упомянем об этих трудностях.
Шкалы Терстоуна
Основной метод конструирования шкалы аттитюдов Терстоуна
состоит из трех шагов: (1) собирается большое количество утвержде-
ний, относящихся к данному аттитюду (полезным источником могут
быть газеты); (2) эти утверждения оцениваются экспертами по 11-
балльной шкале, от "очень расположен" до "очень не расположен";
(3) отбираются те задания, относительно которых мнения экспертов
не разошлись. Кроме того, отобранные задания должны располагать-
ся по всей 11-балльной шкале. Показателем испытуемого будет ме-
дианная шкальная цена высказываний, с которыми он согласился,
или наибольшая оценка на шкале для заданий, которые он подтвер-
дил. ,
Поскольку, как утверждает Edwards (1957), необходимо около
100 экспертов, если мы хотим получить надежное шкалирование, то
существуют очевидные трудности с подбором этих экспертов. Поми-
мо этого, если эксперты не отражают в точности ту выборочную
совокупность (популяцию, группу лиц), для которых предназнача-
ется средство измерения, то, конечно же, вся процедура будет некор-
ректной.
Nunnally (1978) весьма обоснованно подвел итог тем возражени-
ям, которые выдвигались против использования шкал Терстоуна. По
его мнению, основной трудностью в данной модели является то, что
задания очень редко к ней подходят. Сутью этой модели является то,
156
что на каждое задание имеется ключевой ответ только в одной облас-
ти значений измеряемого свойства. Так, если имеется утверждение:
"Я ненавижу войну,"- то его должны подтвердить только, те, кто
получат средний балл на шкале аттитюда к войне. Однако испытуе-
мые с сильными антивоенными настроениями также, вероятно, отве-
тят на это задание утвердительно. Таким образом, данная модель не
отражает правильно структуру аттитюдов. Другими словами, эти
задания монотонны , и это существенно для большинства заданий
для измерения аттитюдов. Однако данная модель шкалирования не
является монотонной. В ней предполагается континуальность изме-
ряемого свойства и нормальное распределение ответов на задания.
Практические проблемы, связанные с подбором экспертов, вместе с
тем фактом, что трудно подобрать задания так, чтобы они соответст-
вовали предположениям данной модели, являются вескими противо-
показаниями для использования шкал Терстоуна при измерении ат-
титюдов.
Шкалы Гутмена
Шкалы Гутмена уже упоминались в главе 1, когда было указано,
что модель Раша (в случае, если задания не различимы по трудности)
порождает вероятностную версию шкалы Гутмена. Это, однако, не-
обычный взгляд на шкалы Гутмена, который заслуживает здесь не-
сколько более подробного описания.
Шкалы Гутмена попадают в класс моделей, известных как детер-
минированные, в которых предполагается, что кривые, описываю-
щие зависимость "задание-ответ" лишены погрешностей. По шкале
Гутмена предполагается, что в случае, когда задания упорядочены по
трудности, скажем, от 1 до 20, если испытуемый выполнил задание
8, он в состоянии выполнить и задания от 1 до 7. Если же он не смог
выполнить задание 9, то он также не сможет выполнить и задания от
10 до 20.
На основе кривых, описывающих зависимости "задание-ответ", в
данной модели предполагается, что для всех значений, превышаю-
щих некоторую точку на оси измеряемого свойства, вероятность от-
вета О. равна 0, а для всех меньших значений вероятность равна +1.
Это означает, что каждое задание имеет высокую бисериальную кор-
реляцию с общим показателем, и является весьма дискриминатив-
ным в некоторой точке на континуальной оси измеряемого свойства.
Под монотонностью понимается, во-первых, то, что задание допускает как поло-
жительный, так и отрицательный ответ, во-вторых, вероятность утвердительного
ответа возрастает по мере роста значимости данной черты (свойства) и наоборот
(Прим.ред.)
157
При конструировании шкал Гутмена (уже существуют компью-
терные программы для выполнения необходимых при этом задач
сортировки больших объемов) основной целью является создание
заданий, так отобранных в порядке их трудности, что выполнение
некоторого задания означало бы, что будут выполнены и все предше-
ствующие ему задания, а неспособность выполнить некоторое зада-
ние означала бы и неспособность выполнить все последующие. Это
очевидно проще для заданий, применительно к которым такой поря-
док устанавливается относительно легко, таких как задания по мате-
матике или по теории музыки, нежели тех, что относятся к менее
структурированным дисциплинам.
По этому типу шкал высказано много критических замечаний.
Первым и наиболее важным, с нашей точки зрения, является заме-
чание, сделанное Levy (1973), хотя и не в связи со шкалами Гутмена.
Леви подчеркивает важность того, что базовая модель психологиче-
ского теста должна соответствовать объекту измерения. В данном
случае, представляется маловероятным, чтобы кривые, описываю-
щие зависимость "задание-ответ" из шкалы Гутмена, соответствова-
ли каким-либо реальным психологическим данным. Задания далеко
не всегда коррелируют на соответствующем уровне значимости с
общими показателями по измеряемому свойству; таким образом,
модель, в которой предполагается такая корреляция, не пригодна для
обработки имеющихся данных.
Еще одно критическое замечание состоит в том, что задания для
шкалы Гутмена могут отбираться просто выбором заданий, имеющих
широкий диапазон по трудности или скорости выполнения. Однако,
кривые, описывающие зависимость "задание-ответ", являются не
такими, какими они должны быть для того, чтобы удовлетворять
требованиям данной модели. Отсутствие широкого диапазона изме-
нения заданий по трудности означает, что шкалы являются коротки-
ми и, следовательно, слабо дискриминативными.
Аналогичное возражение было выдвинуто Nunnally (1978), кото-
рый указывал, что построение шкалы Гутмена в аспекте трудности
заданий не гарантирует ее одномерность.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39