Анастази А.

Значение стандартизованной процедуры тестирования с точки зре-
ния экспериментатора будет обсуждаться в этой главе в связи с пробле-
мами проведения теста.
Другим важным этапом в стандартизации теста является определе-
ние норм. Психологические тесты не имеют заранее определенных стан-
дартов успешности или неудачи в выполнении теста, индивидуальные по-
казатели оцениваются в сравнении с показателями, полученными
другими. Сам термин <норма> уже указывает на нормальное, или сред-
нее, выполнение. Поэтому, если обычные 8-летние дети правильно ре-
шают 12 задач из 50 в тесте на типичное арифметическое рассуждение,
значит, норма для 8-летнего в этом тесте соответствует показателю 12.
Такой показатель принято называть первичным (необработанным, сы-
рым) показателем. Он может выражаться числом правильно решенных
заданий, временем, необходимым для их выполнения, числом ошибок
и другими объективными единицами измерения, соответствующими со-
держанию теста. Такой первичный показатель ни о чем не говорит до
тех пор, пока не оценивается в соответствующей системе норм.
Стандартизация теста осуществляется его проведением на большой
репрезентативной выборке испытуемых того типа, для которого он пред-
назначен. Относительно этой группы испытуемых, называемой выборкой
стандартизации, вырабатываются нормы, указывающие не только сред-
ний уровень выполнения, но и его относительную вариативность выше
и ниже среднего уровня. Поэтому можно оценить разные степени успеш-
ности и неуспешности в тесте. Это позволяет определить положение ин-
дивида относительно нормативной выборки или выборки стандартиза-
ции. Конкретные способы получения таких норм рассматриваются
в гл. 4.
Следует отметить, чт" ,жы для личностных тестов устанавли-
ваются в сущности точ -ке, как и для тестов способностей. Для те-
стов обоих типов нор соответствует их выполнению обычными, или
средними, индивидами. Например, в тесте на <лидерство-подчинение>
норма приходится на промежуточную точку, представляющую собой
уровень авторитарности или подчинения, характерный для среднего ин-
дивида. Подобным же образом в опроснике на эмоциональную устойчи-
вость норма не просто соответствует полному отсутствию неблаго-
приятных или недостаточно приспособленных ответов, поскольку неко-
торое количество таких ответов свойственно большинству нормальных
индивидов из выборки стандартизации. Из этого ясно, что психологиче-
ские тесты любого типа опираются на эмпирически установленные
нормы.
Объективное измерение трудности. Обращаясь к определе-
нию психологического теста, с которого началось его обсуждение, пока-
жем, что тест был охарактеризован не только как стандартизованное, но
и как объективное измерение. Какими специальными приемами доби-
ваются объективности тестов? Некоторые аспекты проблемы объектив-
ности психологических тестов уже затрагивались при обсуждении стан-
дартизации. В связи с этим отмечалось, что получение первичных
35
ПРИРОДА ПСИХОЛОГИЧЕСКИХ ТЕСТОВ И ИХ ПРИМЕНЕНИЕ
висят от субъективных суждений экспериментатора. Теоретически для
любого индивида показатель должен быть одним и тем же независимо
от того, кто проводит тест. На самом деле это не совсем так, поскольку
полная стандартизация и объективность практически недостижимы. Но
объективность по крайней мере является целью создания теста, и для
большинства тестов ее уровень достаточно высок.
Имеются и другие не менее важные методы достижения объективно-
сти психологических тестов. Определение степени трудности одного за-
дания или теста в целом основывается на объективных эмпирических
процедурах. Когда А. Бине и Т. Симон в 1905 г. готовили свою первую
шкалу для измерения интеллекта, то расположили 30 заданий шкалы
в порядке возрастания трудности. Напомним, что степень трудности вы-
являлась сравнением выполнения заданий 50 нормальными и нескольки-
ми умственно отсталыми детьми. Задания, правильно выполненные по-
чти всеми детьми, естественно, определялись как наиболее легкие,
а задания, выполненные сравнительно небольшим числом детей, рассма-
тривались как более трудные. С помощью такой процедуры эмпирически
устанавливалась степень трудности задания. Этот пример из истории те-
стирования представляет типичный способ объективного измерения сте-
пени трудности, в настоящее время ставший общепринятым.
Не только расположение, но и отбор заданий для включения их
в тест может определяться числом испытуемых, в пробной выборке вы-
полнивших каждое задание. Так, если обнаруживается избыток легких
или трудных заданий, от некоторых из них можно отказаться. Аналогич-
но, если не хватает заданий какой-либо степени трудности, можно доба-
вить новые, чтобы заполнить пробелы. Более подробно способы анализа
заданий рассматриваются в гл. 8.
Надежность. Насколько пригоден данный тест? Действительно ли
он выполняет свои функции? Эти вопросы могут вызывать, и иногда вы-
зывают, длительные бесплодные дискуссии. Предубеждения, субъек-
тивные выводы, личные пристрастия могут вести, с одной стороны,
к переоценке возможностей конкретного теста, а с другой-к упорному
его неприятию. Единственный способ ответить на подобные вопросы-
эмпирическая проверка. Объективная оценка психологических тестов
прежде всего означает определение их надежности и валидности в кон-
кретных ситуациях.
В психометрии термин <надежность> всегда означает согласован-
ность. Надежность теста есть согласованность показателей, полученных
у тех же самых испытуемых при повторном тестировании тем же самым
тестом или эквивалентной его формой. Если у ребенка IQ в понедельник
равен 110, а в пятницу 80, то очевидно, что к такому показателю вряд ли
можно отнестись с доверием. Аналогично, если индивид в ряду из 50
слов правильно определил 40, а в другом считающемся эквивалентным
ряду-только 20, то ни один из этих показателей не может рассматри-
ваться в качестве меры его вербального понимания. Разумеется, в обоих
примерах возможно, что ошибочным является только один из двух пока-
зателей, но это может подтвердить лишь последующее тестирование; из
приведенных данных следует только то, что вместе показатели не могут
быть правильными.
Прежде чем психологический тест станет общим достоянием, необ-
ходимо провести тщательную объективную проверку его надежности.
36
СОДЕРЖАНИЕ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ
смериваются в гл. 5. Надежность может проверяться относительно вре-
менных изменений, выбора конкретных заданий, или тестовой выборки
поведения, роли индивидуальности экспериментатора или специалиста
по обработке тестовых показателей и других аспектов тестирования.
Очень важно точно указать тип надежности и способ ее определения, по-
скольку один и тот же тест может изменяться в различных аспектах. Же-
лательно также иметь сведения о численности и особенностях индиви-
дов, на которых проверялась надежность теста. Такая информация
позволит пользующемуся тестом решить, насколько надежен этот тест
для той группы, к которой он собирается его применить.
Валидность. Несомненно, самый важный вопрос относительно
всякого психологического теста-это его валидность, т.е. степень, в кото-
рой тест действительно измеряет то, для чего он предназначен. Валид-
ность обеспечивается непосредственным контролем за тем, насколько хо-
рошо тест выполняет свою функцию. Для определения валидности
обычно требуется независимый внешний критерий всего того, что тест
должен измерять. Например, если тест медицинских способностей ис-
пользуется при отборе поступающих в медицинское училище, критерием
будет являться успешность обучения в этом училище. Чтобы установить
валидность такого теста, его следует провести на большой группе сту-
дентов в то время, когда они поступают в училище. Показателями ре-
зультативности их обучения в медицинском училище будут служить по-
лучаемые каждым учащимся отметки, характеристики преподавателей,
какие-либо заметные успехи или неудачи в учебе и т. п. Совокупность та-
ких показателей и будет критерием, с которым следует соотнести ис-
ходные тестовые показатели студентов. Высокая корреляция, или высо-
кий коэффициент валидности, означала бы, что индивиды, имевшие
высокие показатели, добивались в медицинском училище заметных успе-
хов, а у имевших низкие показатели успехи были слабыми. При низкой
корреляции соответствие между тестовым показателем и критерием бы-
ло бы незначительным и, следовательно, валидность теста низкой. Коэф-
фициент валидности позволяет определить, насколько точно может быть
предсказана на основе тестовых показателей успешность критериальной
деятельности.
Подобным же образом устанавливается валидность тестов, предназ-
наченных для других целей. Например, для теста профессиональной при-
годности валидность можно установить, основываясь на результативно-
сти работы контрольной группы, составленной из вновь нанятого
персонала. Валидность батареи тестов, предназначенных для определе-
ния летных качеств, может быть установлена по результатам обучения
летному делу. Валидность тестов, применяющихся более широко, обыч-
но устанавливается относительно ряда критериев, благодаря постепенно-
му накоплению данных из множества различных исследований.
Читатель, может быть, обратил внимание на кажущуюся парадок-
сальность понятия тестовой валидности. Если так необходимо наблю-
дать за испытуемыми вне тестовой ситуации или как-то иначе получать
объективные данные о том, что пытается предсказать тест, почему же не
отказаться от самого теста? Ответ на этот вопрос нужно искать в разли-
чиях между группой, на которой определяется валидность теста, и груп-
пой, которой тест предъявляется практически. Валидность теста устана-
вливается на репрезентативной выборке испытуемых. Показатели этих
37
ПРИРОДА ПСИХОЛОГИЧЕСКИХ ТЕСТОВ И ИХ ПРИМЕНЕНИЕ
Если таким способом доказывается валидность теста, его можно приме-
нять на других выборках без измерений критерия.
В качестве довода в пользу тестирования можно сослаться и на тот
факт, что, прежде чем критериальные показатели могут быть получены,
приходится довольно долго ждать. Такая процедура настолько расточи-
тельна по затратам времени и энергии, что в большинстве случаев дол-
жна запрещаться. В самом деле, следуя ей, можно определить, кто из по-
ступающих на работу справится с ней или кто из студентов успешно
закончит колледж, только приняв всех желающих и дождавшись оконча-
тельных итогов! Самое страшное в такой процедуре-ее пагубное эмо-
циональное воздействие на индивидов, а именно его тесты предназна-
чены свести к минимуму. С их помощью можно заранее с известной
вероятностью определить актуальный уровень развития у индивида не-
обходимых навыков, знаний и других релевантных характеристик,
составляющих предпосылку будущей деятельности. И чем выше валид-
ность и надежность теста, тем меньше будет вероятность ошибки.
Конкретные проблемы, с которыми сталкиваются при определении
валидности тестов разных типов, а также используемые при этом спе-
циальные критерии и статистические методы рассматриваются в гл. 6
и 7. Однако один момент необходимо обсудить сейчас. Валидность гово-
рит не только о степени соответствия теста своим функциям. В действи-
тельности она указывает на то, что именно измеряется данным тестом.
Поэтому было бы более точным определение валидности как той меры,
с помощью которой устанавливается, что измеряется тестом. Несомнен-
но, интерпретация тссювых показателей была бы более ясной и одно-
значной, если бы тесты все время назывались в соответствии с крите-
риальными данными, с помощью которых оценивалась их валидность.
Примером такого соответствия могут служить названия таких тестов,
как тест способностей к обучению и тест распределения персонала вме-
сто неопределенного-тест интеллекта.
ПОЧЕМУ НЕОБХОДИМ КОНТРОЛЬ ЗА ИСПОЛЬЗОВАНИЕМ
ПСИХОЛОГИЧЕСКИХ ТЕСТОВ?
<Могу ли я получить бланки теста Станфорд-Бине? Мой племянник на следующей
неделе поступает в школу, и мне бы хотелось немного попрактиковать его, чтобы он смог
поступить>.
<Чтобы усовершенствовать чтение лекций в нашей школе, нам нужен IQ-ec, не
учитывающий влияния межкультурных различий и позволяющий измерять врожденный
потенциал ребенка>.
<Вчера вечером я ответил на вопросы интеллектуального теста, опубликованного
в журнале, и получил IQ, равный 80, я думаю, что психологические тесты просто глупы>.
<Моя соседка по комнате изучает психологию. Она дала мне личностный тест, по
которому я оказалась невротичной. Я так расстроилась, что даже перестала ходить на
занятия>.
<В прошлом году вы давали нашим служащим с исследовательскими целями новый
личностный тест. Нам бы теперь хотелось иметь их тестовые показатели для картотеки
кадров>.
Эти высказывания не выдуманы. Каждое взято из реальных случаев,
перечисление которых легко может продолжить любой психолог. Эти
высказывания есть примеры возможного неправильного использования
или интерпретации психологических тестов, ведущих к представлению
- ---_".. ..",. "м-гп йм-ппттечном или даже вредящем обследуемому.
38
СОДЕРЖАНИЕ ПСИХОЛОГИЧЕСКОГО ТЕСТИТОВДНИЯ
тесты, чтобы быть эффективными, должны правильно использоваться.
В руках недобросовестного или некоиицированного экспериментато-
ра тесты могут принести серьезный вред.
Две основные причины необходимости контроля за использованием
психологических тестов такоиы: а) предотвратить делающую тест нева-
лидным всеобщую доступное] ь его содержания, б) гарантировать ис-
пользование тестов только .пифицириванными экспериментаторами.
Ясно, что если индивид запилю..!.;[ праиильпые ответы в тесте на цве-
торазличение, то этим тестом уже нельзя измерить его цветовое зрение.
В этом случае тест полностью терист с.:"-40 валидность. Очевидно, что
сохранение содержания теста в тайне пооллет предотвратить предна-
меренное искажение показателей.
В иных случаях последствия знакомства с тестом могут быть не
столь очевидными, а тест yipaiiibaci СБОЮ валидиость благодаря дей-
ствиям малоосведомленных лиц. Школьный учитель, например, может
специально натренировать свой класс в решении задач, сходных с зада-
ниями теста интеллекта с тем, <-иооы ученики были хорошо подгото-
влены к проведению теста>. Такое отношение к тесту определяется отно-
шением к подготовке к школьным экзаменам. Однако в случае с тестом
интеллекта такая предварительная тренировка, или подготовка, скорее
всего повысит тестовые показатели, не повлияв сколь-нибудь заметно на
более широкую область поведения, которую тестом пытаются прове-
рить. При этих условиях валидность теста как средства прогноза
снижается.
Потребность в квалифицированном экспериментаторе на каждом из
трех основных этапов тестирования-выбор теста, его проведение, полу-
чение показателей и их интерпретация-очевидна. Тесты нельзя выби-
рать, подобно косилкам для газонов, по каталогу, высланному почтой.
Они не могут быть оценены по названию, автору или другим каким-то
признакам идентификации теста. Разумеется, 4iuubi оцепишь такие фак-
торы, как цена, объем, способ транспортировки тестовых материалов,
время, необходимое для проведения тестирования, легкость и быстрота
в получении показателей психологической подготовки не требуется, ин-
формация по этим вопросам обычно приводится в каталоге тестов, и ее
необходимо учитывать при составлении программы тестирования. Одна-
ко для того, чтобы тест выполнил свои функции, важно оценить такие
его технические характеристики, как валидность, надежность, степень
трудности и нормы. Только таким образом человек, пользующийся те-
стом, определит, насколько тест пригоден для его целей и соответствует
типу испытуемых, для которых он этот тест предназначил.
В кратком обсуждении стандартизации теста, уже приводившемся
в этой главе, обосновывалась необходимость опытного экспериментато-
ра. Точность в выполнении требований инструкции, а также основатель-
ное знакомство со стандартными инструкциями необходимы, если нужно
сравнить полученные разными экспериментаторами тестовые п эказатели
или же если индивидуальные показатели необходимо оценить в соответ-
ствии с опубликованными нормами. Столь же важен тщательный кон-
троль за условиями тестирования. Кроме того, неправильное или не со-
всем точное определение тестовых показателей может сделать их
бесполезными.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58

А-П

П-Я

Психологическое тестирование