Анастази А.

Седьмой Ежегодник по изме-
рению умственных способностей указывает примерно 400 работ, многие
из которых посвящены применению этого теста к пациентам, находя-
щимся в клинике.
Надежность, определенная методом ретеста в достаточно одно-
родных группах детей старшего возраста и взрослых, колеблется при-
близительно от 0,70 до 0,90. Для более низких тестовых результатов на-
дёжность оказывается значительно меньше этих значений. Корреляции
с тестами интеллекта, как вербальными так и действия, изменяются от
0,40 до 0,75, при этом корреляции с тестами действия выше. Исследова-
ния с группами умственно отсталых испытуемых и людьми, отличающи-
мися по уровню образования и профессии, отмечают хорошую текущую
валидность. Коэффициенты прогностической валидности относительно
критериев успеваемости оказываются ниже, чем эти же коэффициенты
у обычных вербальных тестов интеллекта. Некоторые исследования
с применением факторного анализа свидетельствуют о том, что прогрес-
сивные матрицы заметно перегружены фактором, общим большинству
тестов интеллекта, обозначенного британскими психологами как фактор
дпо Спирмену, но на выполнение теста влияют также пространственные
способности, индуктивное мышление, точность восприятия и другие
групповые факторы (Н. R. Burke, 1958).
Более легкая форма-цветные прогрессивные матрицы-пригодна
для детей от 5 до II лет и для умственно отсталых взрослых. Более
сложная форма подготовлена для взрослых с высоким уровнем интел-
лекта, но применять ее могут только опытные и официально признанные
260 ТЕСТЫ ОБЩЕГО ИНТЕЛЛЕКТУАЛЬНОГО РАЗВИТИЯ
Еще один подход характеризует тест Гудинаф <нарисуй человека>,
в котором испытуемого просят изобразить мужчину и постараться сде-
лать это как можно лучше. Этот тест употреблялся без изменений с мо-
мента его первоначальной стандартизации в 1926 г. до 1963 г. В 1963 г.
тест был пересмотрен, расширен и опубликован под названием тест Гу-
динаф-Харриса <рисование> (D.B. Harris, 1963). В нем, как и в исходном
варианте, акцент делался на точности детской наблюдательности, на раз-
витии понятийного мышления, а не на умении рисовать. Оценка дава-
лась на основе того, какие части тела и детали одежды изображает ребе-
нок, как учтены пропорции, перспектива и другие особенности.
Суммарный показатель определяется 73 оцениваемыми элементами, ото-
бранными на основе возрастных различий, отношения к суммарным ре-
зультатам теста и отношения к показателям группового теста интеллек-
та. Данные по результатам теста были получены на выборках,
состоявших из 50 мальчиков и 50 девочек каждого возрастного уровня,
начиная от детского сада и до IX класса школ, находящихся в городской
и сельской местности штатов Миннесота и Висконсин. Выборки были
стратифицированы в соответствии с профессиями отцов.
В новом варианте теста испытуемого просили нарисовать женщину
и свой портрет. Выполнение теста на изображение женщины оценивалось
в единицах, сходных с теми, которые применялись при изображении
мужчины, но учитывался 71 элемент. Шкала по изображению самого се-
бя разрабатывалась как проективный личностный тест, но имеющиеся
данные об использовании этого метода нельзя назвать многообещающи-
ми. Нормы по шкалам изображения мужчины и женщины были установ-
лены на новой выборке, состоявшей из детей в возрасте от 5 до 15 лет.
Каждая группа с возрастным интервалом в 1 год включала 300 детей.
Выборка была репрезентативной по отношению к географическим райо-
нам США и профессиям отцов. Показатели по каждой шкале переводи-
лись в стандартные показатели с М = 100 и о- = 15. На рис. 35 приве-
дены изображения мужчины, выполненные детьми в возрасте 5 лет
8 мес, 8 лет 8 мес и 12 лет II мес, и соответствующие показатели выпол-
нения теста: первичные и стандартные. Более простой способ обработки
результатов теста дают шкалы качества изображений мужчины или жен-
щины. Вместо подсчета отдельных элементов в шкалах качества исполь-
зуется общая качественная оценка рисунка как целого посредством сопо-
ставления изображения, сделанного ребенком, с серией из 12 располо-
женных в определенном порядке образцов и выявления наиболее
похожего из них на оцениваемый рисунок.
Надежность теста <нарисуй человека> неоднократно исследовалась
различными методами. В одной тщательно выполненной работе первый
вариант теста предъявлялся 386 учащимся III и IV классов, коэффициент
корреляции при повторном тестировании с интервалом в 1 нед составил
0,68, а коэффициент корреляции, полученный методом расщепления те-
ста, оказался равным 0,89 (W.A. Me Carthy, 1944). Коэффициент надежно-
сти, определенный-методом переоценки теста другими лицами, равнялся
0,90, а определенный переоценкой рисунков теми же лицами, равнялся
0,94. Исследования норой формы теста дали сходные результаты
(J.A. Dunn, 1967; D.B. Harris, 1963).
Повторное проведение теста в группе детей из детского сада в тече-
ние ряда дней не обнаружило значимых различий в выполнении теста
261
ТЕСТЫ ДЛЯ СПЕЦИФИЧЕСКИХ ПОПУЛЯЦИЙ
ние рисованию в школе не сказываются существенным образом на ус-
пешности выполнения теста.
Очевидно, старая и новая шкалы полностью подобны друг другу, их
показатели в группах, однородных по возрасту, коррелируют где-то ме-
жду 0,91 и 0,98. Корреляции между шкалами, требующими изобразить
мужчину или женщину, почти так же высоки, как коэффициенты надеж-
ности, полученные методом расщепления теста на изображение муж-
чины. Основываясь на этих данных, Д. Харрис рекомендует рассматри-
вать обе шкалы как взаимозаменяемые варианты теста, а среднее
значение их стандартных показателей использовать для увеличения на-
дежности. Для шкал качества, представляющих более быстрый, но менее
точный метод обработки результатов, коэффициенты надежности, опре-
деленные методом сравнения исходных и повторных оценок выполнения
теста разными лицами, колеблются на уровне 0,80. Корреляции почти
такой же величины были установлены между субъективными оценками
по шкале качества и оценками по элементам одних и тех же рисунков.
Помимо данных по анализу заданий, собранных при разработке
шкал, сведения о конструктной валидности дает корреляция с результа-
тами других тестов интеллекта. Значения этих корреляций меняются
в достаточно широких пределах, но в основном они превышают 0,50.
В исследовании, проведенном с 100 учащимися четвертых классов, было
установлено, что тест <нарисуй человека> коррелирует с рядом тестов
с уже известной факторной структурой (Н. L. Ansbacher, 1952). Такие кор-
Рис. 35. Образцы рисунков, полученных в тесте Гудинаф-Харриса <рисование>.
С любезного согласия Дейла Б. Харриса
Мужчина: первичный показатель 7, возраст 5-8, стандартный показатель 73.
Женщина: первичный показатель 31, возраст 8-8, стандартный показатель 103.
Мужчина: первичный показатель 66, возраст 12-11, стандартный показатель 134.
262 ТЕСТЫ ОБЩЕГО ИНТЕЛЛЕКТУАЛЬНОГО РАЗВИТИЯ
реляции были особенно высоки для исследовавшегося возрастного диа-
пазона с тестами мышления, пространственных способностей и точности
восприятия. Моторная координация играет в этом возрасте незначитель-
ную роль. При исследовании детей, посещающих детский сад, оказалось,
что результаты теста <нарисуй человека> коррелировали по сравнению
с группой четвероклассников больше с арифметическими способностями
и меньше со скоростью и точностью восприятия (D.B. Harris, 1963). Все
это свидетельствует о том, что этот тест в разные возрастные периоды
измеряет разные функции.
Исходный вариант теста <нарисуй человека> широко применяется
в клинике для получения дополнительных данных об испытуемых, про-
шедших исследование по тесту Станфорд-Бине и другим вербальным
шкалам. Этот тест часто используется и при изучении различных куль-
тур и этнических групп, в том числе некоторых племен американских ин-
дейцев. Такие исследования показали, что выполнение этих тестов
в большей степени зависит от различий в культурном окружении, чем
это предполагалось. В обзоре исследований, относящихся к этому тесту,
Ф. Гудинаф и Д. Харрис (F.L. Goodenough, D.B. Harris, 1950) выразили
мнение, что <поиск теста, свободного от влияния культуры, независимо
от того, измеряет ли он интеллект, художественные способности, со-
циально-личностные характеристики или любые другие черты, является
иллюзорным>. Эта точка зрения была еще раз подтверждена Д. Харри-
сом в его книге 1963 г. Позднее В. Деннис (W. Dennis, 1966) проанализи-
ровал сравнительные данные, полученные с помощью этого теста на
группах 6-летних детей, принадлежащих к 40 самым различным культу-
рам. Средние групповые показатели оказались весьма связанными с сте-
пенью представленности искусства в каждой из культур. Для культур
с неразвитым искусством была выдвинута гипотеза, что тест действия
отражает степень приобщения такой культуры к западной цивилизации.
Культурные различия в жизненном опыте были выявлены и в доста-
точно продуманном сравнительном исследовании мексиканских и амери-
канских детей с помощью теста Гудинаф -Харриса (L.M.Laosa,
J.D. Swartz, R. Diaz-Guerrero, 1974). В исследованиях по этому тесту, про-
водившихся в Нигерии (C.G. Bakare, 1972) и Турции (P. Uman, 1972), бы-
ло установлено, что средние показатели постоянно и значительно увели-
чиваются с увеличением социоэкономического уровня семей обсле-
дуемых детей. Следует также добавить, что подобные результаты
характерны для всех тестов, задуманных как тесты, безразличные к куль-
туре или свободные от ее влияния.
Методы тестирования межкультурных различий. Тео-
ретически можно указать три способа разработки тестов для лиц, воспи-
танных в разных культурах или субкультурах, хотя на практике эти ме-
тоды могут комбинироваться. Первый способ связан с подбором
заданий, общих для многикультур, и валидацией окончательного теста
по локальным критерияйв этих культурах. Это основной метод, приме-
няемый для тестов, свободных Ьт влияния культуры, хотя их повторная
валидация в разных культурах зачастую либо упускается из виду, либо
выполняется неадекватно. Однако без такого этапа нельзя быть уве-
ренным в том, что тест относительно свободен от элементов, свой-
ственных определенной культуре. Более того, маловероятно, чтобы лю-
бой единичный тест мог быть разработан в полном соответствии
с этими требованиями без выявления диапачоня гл/ггт-"---
263 ТЕСТЫ ДЛЯ СПЕЦИФИЧЕСКИХ ПОПУЛЯЦИЙ
Вместе с тем методы оценки межкультурных различий нуждаются
в основательном изучении некоторых фундаментальных аспектов. Один
из таких аспектов связан с общностью психологических принципов
и конструктов, свойственных каждой культуре (A. Anastasi, 19580, гл. 18).
Еще один аспект имеет отношение к роли условий жизни и воспитания
в формировании индивидуальных различий в поведении-проблема, ко-
торая может более эффективно изучаться при выявлении диапазона из-
менений окружения как следствия сильно отличающихся друг от друга
культур. В исследованиях подобного типа необходимо использовать ме-
тодики, которые могут применяться по крайней мере в частично срав-
нимых условиях существования разных культур. Меры предосторожно-
сти против неправильных интерпретаций результатов, полученных
с помощью таких методик, следует искать в самих построениях экспери-
мента и в том, насколько близко экспериментаторы знакомы с иссле-
дуемыми культурами или субкультурами.
Второй способ состоит в том, чтобы создать тест внутри одной
культуры и предъявить его индивидам с различным культурным опы-
том. Такой метод полезен, когда целью тестирования является прогноз
локального критерия в конкретной культуре. В этом случае с уменьше-
нием специфической культурной нагрузки теста может снижаться и его
валидность, поскольку сам по себе критерий <нагружен> специфической
культурой. Правда, при этом не следует рассматривать любой тест, раз-
работанный в рамках одной культуры, как универсальное средство изме-
рения интеллекта. Не следует забывать, что низкий результат по этому
тесту, полученный представителями иной культуры, объясняется совсем
иными причинами, нежели получение низкого показателя испытуемым,
принадлежащим к той культуре, в которой был разработан тест. С по-
мощью такого подхода могут быть выявлены культурные расхождения
между группами или степень приобщения индивида к культуре, его го-
товность к получению образования и профессиональной деятельности,
специфичной для данной культуры.
Третий способ состоит в разработке разных тестов внутри каждой
культуры и установлении их валидности только по локальным крите-
риям. Примерами этого подхода являются большинство вариантов
первых шкал Бине для использования в разных странах Европы, Азии
и Африки и подготовка тестов для отбора военного и промышленного
персонала в определенных культурах. В настоящее время программы по
разработке тестов осуществляются в некоторых развивающихся странах
Азии, Африки и Латинской Америки Американским институтом исследо-
ваний при агентстве США по международным связям (P. A. Schwarz,
19640, b, P. A. Schwarz, R.E. Krug, 1972). Еще одним примером является
программа длительнЪо тестирования Национального института по ис-
следованию профессиональных кадров в Иоганнесбурге (R.H. Blake,
1972).
В исследованиях подобного рода тесты валидны относительно кон-
кретных критериев образования и профессии, предназначены они для
прогноза, а выполнение теста оценивается в терминах локальных норм.
Каждый тест применим только в той культуре, где он был разработан,
и никак не используется для сравнения межкультурных различий. Одна-
ко если критерии, относительно которых должно быть сделано предска-
-""""" " техническими специальностями, вероятно, необходим
" ~~"" "WT птпажатьнаправле-
264 ТЕСТЫ ОБЩЕГО ИНТЕЛЛЕКТУАЛЬНОГО РАЗВИТИЯ
ние, в котором развивается конкретная культура, а не свойственные ей
в настоящее время особенности (P.E.Vernon, 1969).
Следует обратить внимание на опубликованные в конце 60-х-начале
70-х гг. справочники по проблемам изучения и тестирования межкуль-
турных различий и использования тестов в развивающихся странах
(S.Biesheuvel, 1969; R.W.Brislin, W.J.Lonner, R.M.Thomdike, 1974;
P.A.Schwarz, R.E.Krug, 1972). Все они содержат информацию о реко-
мендуемых тестах, адаптации стандартизованных тестов и методические
указания по разработке и применению тестов. Еще одним свидетель-
ством всевозрастающего интереса к тестированию межкультурных раз-
личий являются доклады, прочитанные на международной конференции
по тестам умственного развития и культурной адаптации, проводившей-
ся в 1971 г. в Стамбуле (L.J.Cronbach, P.J.Drenth, 1972). В предста-
вленных докладах затронуты методологические проблемы и оценки кон-
кретных методик с точки зрения как теоретических вопросов, так
и конкретных эмпирических исследований.
И в справочниках, и в материалах конференции главное внимание
сосредоточено на культурных различиях, свойственных как разным наро-
дам, так и людям, находящимся на разных ступенях культурного разви-
тия. Кроме того, в 60-70-х гг. появилась обширная литература по вопро-
сам психологического тестирования меньшинств США, главным образом
с целью определения профессиональной пригодности и пригодности
к обучению.
В заключение следует напомнить, что, хотя некоторые из методик
первоначально предназначались для тестирования межкультурных разли-
чий, они все больше применяются психологами-клиницистами для полу-
чения дополнительной информации к результатам выполнения шкал
Станфорд-Бине и Векслера и при тестировании лиц с разными физиче-
скими недостатками. Это особенно справедливо относительно теста Гуд-
инаф-Харриса <рисование>, прогрессивных матриц и адаптации Артура
шкалы Лейтер.
ГЛАВА II. ГРУППОВОЕ ТЕСТИРОВАНИЕ
В то время как индивидуальные тесты, такие, как шкалы Станфорд-Би-
не и Векслера, находят свое основное применение в клинике, групповые
тесты используются преимущественно в системе образования, граждан-
ских службах, в промышленности и армии. Напомним, что массовое те-
стирование началось в CffiABO время первой мировой войны с разра-
ботки армейских тестов альса и бета. Армейский альфа представлял
собой вербальный тест, предИазначенный для отбора и распределения
новобранцев. Армейский бета был неязыковым тестом и предназначался
для людей, не говорящих по-английски и неграмотных. Эти тесты яви-
лись своего рода образцом для последующего развития большого числа
групповых тестов для гражданского населения.
Варианты обоих армейских тестов для гражданского населения ис-
пользуются до сих пор и известны как проверочный альфа, или модифи-
цированная форма 9 (более распространено название альфа 9), и пере-
265 ГРУППОВОЕ ТЕСТИРОВАНИЕ
средством предварительного отбора с последующим использованием
классификационных батарей, предназначенных для распределения воен-
нослужащих по соответствующим армейским службам.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58

А-П

П-Я

Психологическое тестирование