Их переводы и адаптации появились
на многих языках. В Америке было опубликовано множество перерабо-
танных вариантов, самым удачным из/ которых был вариант, разрабо-
танный под руководством Л. М. Термина в Станфордском университете
и известный как шкала Станфорд-Бине (L.M.Tennan, 1916). Именно
в этом варианте был впервые использован коэффициент интеллектуаль-
ности (IQ), или отношение между умственным возрастом и фактическим
возрастом. Позднейшая переработка этой шкалы, используемая в наше
время достаточно широко, будет подробно рассмотрена в гл. 9. Особый
интерес представляет также вариант Кюльманна-Бине, в котором воз-
растной диапазон был сдвинут вниз до уровня 3 мес. (F. Kuhlmann, 1912).
Эта шкала-одна из наиболее ранних попыток разработки тестов интел-
лекта для младенцев и дошкольников.
ГРУППОВОЕ ТЕСТИРОВАНИЕ
Тесты А. Бине, как и их позднейшие переработки, являются индиви-
дуальными шкалами в том смысле, что они могут быть применены одно-
временно только к одному человеку. В большинстве этих тестов преду-
сматривается, что испытуемый или отвечает устно, или осуществляет
какие-то действия с предметами, причем в некоторых из них требуется
учитывать индивидуальное время ответа. По этим и другим причинам
такие тесты не приспособлены для группового использования. Для те-
стов типа теста Бине характерно и то, что они нуждаются в высококва-
лифицированном экспериментаторе. Такие тесты по существу являются
клиническими средствами, приспособленными к интенсивному изучению
конкретных случаев.
Групповое тестирование, так же как и первая шкала Бине, было со-
здано в ответ на настоятельную потребность практики. Когда Соеди-
ненные Штаты вступили в первую мировую войну в 1917 г., Американ-
ской психологической ассоциацией был назначен комитет для рассмотре-
ния тех средств, которыми психология может помочь ведению войны.
Этот комитет под руководством Р. М. Йеркса столкнулся с необходи-
мостью быстро определить интеллектуальный уровень полутора мил-
" Ф.Л. Гудинаф (F.L. Goodenough, 1949, р. 50-51) отмечает, что в 1887 г., за 21 год
до появления шкалы Бине-Симона 1908 г., С.Э. Шайе опубликовал в Ньюорлеанском ме-
дицинском журнале серии тестов для детей, распределив их в соответствии с возрастом,
в котором эти тесты обычно приводятся. Частично вследствие малой доступности журна-
ла, частично же из-за того, что ученый мир еще не был к этому готов, идея возрастной
шкалы в это время осталась незамеченной. На создание подобной шкалы самим А. Бине
повлияли работы таких его современников, как А. Блин и Г. Даме, подготовивших серию
вопросов, на основании которых они получали единый суммарный показатель по каждо-
му ребенку (Т.Н. Wolf, 1973).
25 ФУНКЦИИ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ
лионов новобранцев. Такая информация требовалась для принятия реше-
ний о признании негодными к военной службе, распределении по разным
родам войск, приеме в лагеря обучения офицеров и т.п. Военные психо-
логи привлекли все имеющиеся материалы, в частности неопублико-
ванный тест для группового тестирования интеллекта Артура С. Отиса.
Основным достоинством теста Отиса, который он составил, будучи ас-
пирантом Л. М. Термена, было введение различного типа объективных за-
даний, в том числе с множественным выбором ответов.
Тесты, которые в конце концов создали военные психологи, стали
называться армейский альфа и армейский бета. Первый предназначался
для общего обычного тестирования; второй, как шкала невербальная,
был рассчитан на неграмотных и новобранцев иностранного происхо-
ждения, которые не могли ответить на задания теста на английском язы-
ке. Оба теста можно было использовать в больших группах людей.
Вскоре после окончания первой мировой войны военные тесты стали
использоваться в гражданской службе. Армейские альфа и бета неодно-
кратно перерабатывались (последние их варианты употребляются даже
в наши дни) и стали образцом для большинства групповых тестов интел-
лекта. Тестирование получило сильнейший стимул для своего развития.
Вскоре были разработаны групповые тесты интеллекта для всех возра-
стов и уровней образованности-от дошкольников до аспирантов. Еще
совсем недавно невыполнимые, массовые программы тестирования зате-
вались с завидным оптимизмом. Поскольку групповые тесты создава-
лись как средства массового тестирования, то их инструкции и процеду-
ра проведения были достаточно просты, и экспериментатору требовался
минимум обучения. Школьные учителя начали использовать тесты ин-
теллекта в своих классах. Студенты колледжей перед зачислением прохо-
дили стандартную проверку. Предпринималось широкое обследование
особых групп взрослого населения, таких, как заключенные. Вскоре IQ
был признан общественностью.
Применение групповых тестов интеллекта значительно обогнало их
методические возможности. В погоне за показателями и практическими
результатами частенько забывалось, что тесты оставались достаточно
грубым инструментом. Когда же тесты не оправдывали необоснованных
ожиданий, то часто это приводило к скептицизму и враждебному отно-
шению ко всякому тестированию. Таким образом, тестовый бум 20-х гг.,
приведший к неразборчивому применению тестов, не только задержал,
но и способствовал прогрессу психологического тестирования.
ТЕСТИРОВАНИЕ СПОСОБНОСТЕЙ
Хотя тесты интеллекта как оценивающие общий интеллектуальный уро-
вень индивида первоначально рассчитывались на проверку самых раз-
личных функций, вскоре стало очевидным, что область применения таких
тестов, поскольку в них были представлены не все существенные функ-
ции, весьма ограниченна. Фактически, большинство тестов интеллекта
в основном измеряло вербальные способности и в какой-то мере способ-
ность оперировать числовыми, абстрактными и другими символически-
ми отношениями.
Несомненно, тесты охватывали способности, имеющие в нашей
26
СОДЕРЖАНИЕ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ
ряют эти тесты. Например, большинство тестов, названных в 20-х гг. те-
стами интеллекта, позднее стали называть тестами способностей
к учению. Такая смена терминологии была следствием осознания того
факта, что многие тесты интеллекта измеряют комбинацию способно-
стей, необходимых для учебной деятельности.
Еще до первой мировой войны психологи пришли к признанию не-
обходимости дополнить общие тесты интеллекта тестами специальных
способностей. Тесты специальных способностей разрабатывались частич-
но для использования в профориентации, а также при отборе и распреде-
лении промышленного и военного персонала. Самыми распространенны-
ми среди них были тесты способностей к технике, канцелярской работе,
музыкальных и художественных способностей.
Последовавшая вслед за необычным распространением и непрофес-
сиональным использованием критическая оценка тестов интеллекта выя-
вила еще один знаменательный факт: индивидуальное выполнение от-
дельных частей тестов весьма различно. Это особенно очевидно
в групповых тестах, в которых отдельные задания обычно подразде-
ляются на субтесты относительно однородного содержания. Так, человек
может иметь относительно высокие показатели по вербальному и низкие
по числовому субтесту и наоборот. В какой-то степени такая внутренняя
неоднозначность наблюдается и в тестах типа Станфорд-Бине, в ко-
торых для данного индивида могут оказаться трудными, например, зада-
ния, содержащие слова, а выигрышными задания, использующие картин-
ки или геометрические фигуры.
Люди, работающие с тестами, особенно клиницисты, часто, чтобы
лучше уяснить индивидуальную психологическую структуру, сравнивали
выполнение отдельных частей теста и при анализе конкретного случая
рассматривали не только IQ или иной суммарный показатель, но и пока-
затели субтестов. Но такая практика пригодна не всегда, поскольку
тесты интеллекта не рассчитаны на дифференциальный анализ способно-
стей. Часто сравниваемые субтесты содержат слишком мало заданий,
чтобы дать стабильную и надежную оценку той или иной способности.
В результате показатели отдельных субтестов при тестировании индиви-
да различными вариантами одного и того же теста или в разное время
могут значительно расходиться. Чтобы осуществлять такие внутриинди-
видуальные сравнения, необходимы тесты, специально предназначенные
для выявления различий в работе анализируемых функций.
Параллельно с этими исследованиями шло изучение структуры пси-
хики, давшее необходимый материал для построения тестов специальных
способностей. Статистические работы по природе интеллекта, по-
строенные на выявлении взаимосвязей показателей, полученных у раз-
личных испытуемых по широкому диапазону тестов, были начаты ан-
глийским психологом Чарлзом Спирманом (С. Spearman, 1904; 1927)
в первом десятилетии нашего века. Их методологическая разработка
в трудах английских и таких американских психологов, как Т. Л. Келли
(T.L. Kelly, 1928) и Л.Л. Терстоун (L.L. Thurstone, 1935; 1947), стала назы-
ваться факторным анализом.
27
ФУНКЦИИ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ
Факторный анализ подробно разбирается в гл. 13. Сейчас достаточ-
но сказать, что данные, собранные с его помощью, показали наличие ря-
да относительно независимых факторов или черт. Некоторые из этих
черт, особенностей, например вербальное понимание и оперирование
числами, были в той или иной мере представлены в традиционных те-
стах интеллекта.
Другие, такие, как пространственные, перцептивные и технические
способности, чаще выявлялись не тестами интеллекта, а тестами спе-
циальных способностей.
Одним из главных практических выходов факторного анализа была
разработка комплексных батарей способностей, предназначенных для из-
мерения степени выраженности у индивида той или иной особенности из
некоторой их совокупности. Вместо общего показателя или IQ берутся
показатели таких свойств, как вербальное понимание, пространственное
воображение, арифметические способности и скорость восприятия. Такие
батареи оказались подходящим средством для внутрииндивидуального
анализа, или дифференциального диагноза, который много лет клини-
цисты ставили, основываясь на приблизительных и часто ошибочных ре-
зультатах тестов интеллекта. Кроме того, эти батареи в полной про-
грамме тестирования несли значительную информацию, получаемую
ранее через тесты специальных способностей, поскольку комплексные ба-
тареи способностей охватывают некоторые свойства, обычно не затраги-
ваемые тестами интеллекта.
Комплексные батареи способностей представляют в тестировании
относительно позднее нововведение. В основном они разрабатывались
уже после 1945 г., но их появление во многом определили работы во-
енных психологов во время второй мировой войны. Большая часть те-
стовых исследований, проводившихся в военных организациях, исходила
из факторного анализа и направлялась на создание комплексных батарей
способностей. В воздушных войсках, например, такие батареи предназна-
чались для пилотов, стрелков, радистов, штурманов и множества других
военных специальностей.
Во избежание недоразумений следует разъяснить терминологию.
Термин <тест способностей> традиционно означал тесты, измеряющие
относительно простые способности; термин <тест интеллекта> обычно
объединяет достаточно разнородные серии тестов, дающие один сум-
марный показатель типа IQ. Тесты специальных способностей, ка.к пра-
вило, измеряют одну способность. Комплексные батареи способностей
измеряют ряд способностей и дают профиль, образуемый показателями
каждой способности.
тальных данных, но и как способ, позволяющий разрабатывать содержательные психоло-
гические концепции, в частности, в психологии индивидуальных различий. Вопрос о том,
в какой степени пригоден факторный анализ для этой цели, может решить только психо-
лог. Современный факторный анализ осуществляется относительно статистических рядов
(результаты тестирования, анкетирования и т.п.), находящихся между собой в линейной
зависимости. Насколько правомерна гипотеза, что психику человека достаточно адекватно
описывают линейные связи?
Известно, что такой гипотезы придерживался Ч. Спирман, но теперь она стала до-
-.,"-....".. "",." н пя1.п\л случае исследователь, намеревающийся применить фак-
28 СОДЕРЖАНИЕ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ
СТАНДАРТИЗОВАННЫЕ ТЕСТЫ ДОСТИЖЕНИЙ
По мере того как психологи разрабатывали тесты интеллекта и способ-
ностей, обычные школьные экзамены также технически усовершенствова-
лись (O.W.CaldweH, S.A.Courtis, 1923; R.L.Ebel, D.E.Damrin, 1960).
Важный шаг в этом направлении был сделан бостонскими общественны-
ми школами, заменившими в 1845 г. устные экзамены учащихся пись-
менными. Обоснование этого нововведения удивительно похоже на рас-
суждения более позднего времени, объяснявшие необходимость замены
местоименных вопросов выбором ответа из списка возможных. Пись-
менные экзамены ставят всех учеников в равное положение, позволяют
охватить большее содержание, уменьшают элемент случайности в выбо-
ре задаваемого вопроса и сводят на нет возможную необъективность
экзаменатора.
На рубеже этого столетия появились первые стандартизованные
тесты по измерению результатов школьного обучения. После работы
Р. Л. Торндайка (R.L. Thorndike, 1933) в этих тестах стали использовать-
ся принципы измерения, разработанные в психологических лаборато-
риях. В качестве примера таких тестов можно назвать шкалы оценки ка-
чества почерка и письменных сочинений, а также тесты на правописание,
арифметический счет и рассуждения. Несколько позднее, после выхода
в 1923 г. первого издания станфордского теста достижений, разработан-
ного ведущими тестологами того времени Труманом Л. Келли, Джайл-
сом М. Рачом и Льюисом М. Терманом, появились батареи достижений.
Предвосхищая многие особенности современного тестирования, эти ба-
тареи позволяли осуществлять сравнимые измерения выполнения зада-
ний по разным школьным предметам, оцениваемого относительно еди-
ной системы нормативов.
К этому времени стали очевидными разногласия среди учителей
в оценке результатов описательных тестов. К 1930 г. было признано, что
описательные тесты по сравнению с объективными заданиями <нового
типа> не только отнимают у экзаменаторов и экзаменующихся больше
времени, но и дают менее надежные результаты. По мере того как
объективные задания все шире применялись в стандартизованных тестах
достижений, росло их значение в тестах на понимание и применение зна-
ний и других общих целей обучения, 30-е гг. ознаменовались также по-
явлением машин по подсчету тестовых показателей, которые легко было
приспособить для новых объективных тестов.
Создание региональных и национальных программ тестирования
также способствовало его развитию. Вероятно, наибольшей извест-
ностью пользуется программа Совета по вступительным экзаменам
в колледжи. Принятая еще в конце прошлого века с целью уменьшить
дублирование экзаменов для поступающих в колледжи, эта программа
была основательно переработана, особенно используемые в ней методы
тестирования; были расширены также типы колледжей, в которых она
могла применяться. Происшедшие изменения отразили развитие не
только тестирования, но и образования, поскольку в 1947 г. тестирова-
ние, осуществлявшееся Советом по вступительным экзаменам в коллед-
жи, корпорацией Карнеги и американским Советом по образованию, бы-
Вопросы, требующие описательного ответа. См.: Русский язык: Эничкгч-пр
М" 1979, с. 45-46.
29
ФУНКЦИИ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ
ло передано вновь созданной Службе тестирования в образовании,
принявшей на себя ответственность за все программы тестирования для
университетов, профессиональных училищ, правительственных учрежде-
ний и других организаций. Следует также упомянуть не включенную
в программу Совета по вступительным экзаменам в колледжи американ-
скую программу тестирования в колледжах 1959 г. для отбора поступаю-
щих в колледжи и несколько национальных программ тестирования для
отбора на стипендии одаренных учащихся. -
Тесты достижений используются не только в учебных целях, но
и при отборе поступающих на работу в промышленность и государ-
ственные учреждения. Как уже сообщалось, систематические экзамены
при приеме на гражданскую службу в китайской империи были введены
еще в 1115 г. до н.э. В европейских странах это случилось в конце
XVIII-начале XIX в. Комиссия гражданской службы Соединенных Шта-
тов утвердила конкурсные экзамены в 1883 г.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58
на многих языках. В Америке было опубликовано множество перерабо-
танных вариантов, самым удачным из/ которых был вариант, разрабо-
танный под руководством Л. М. Термина в Станфордском университете
и известный как шкала Станфорд-Бине (L.M.Tennan, 1916). Именно
в этом варианте был впервые использован коэффициент интеллектуаль-
ности (IQ), или отношение между умственным возрастом и фактическим
возрастом. Позднейшая переработка этой шкалы, используемая в наше
время достаточно широко, будет подробно рассмотрена в гл. 9. Особый
интерес представляет также вариант Кюльманна-Бине, в котором воз-
растной диапазон был сдвинут вниз до уровня 3 мес. (F. Kuhlmann, 1912).
Эта шкала-одна из наиболее ранних попыток разработки тестов интел-
лекта для младенцев и дошкольников.
ГРУППОВОЕ ТЕСТИРОВАНИЕ
Тесты А. Бине, как и их позднейшие переработки, являются индиви-
дуальными шкалами в том смысле, что они могут быть применены одно-
временно только к одному человеку. В большинстве этих тестов преду-
сматривается, что испытуемый или отвечает устно, или осуществляет
какие-то действия с предметами, причем в некоторых из них требуется
учитывать индивидуальное время ответа. По этим и другим причинам
такие тесты не приспособлены для группового использования. Для те-
стов типа теста Бине характерно и то, что они нуждаются в высококва-
лифицированном экспериментаторе. Такие тесты по существу являются
клиническими средствами, приспособленными к интенсивному изучению
конкретных случаев.
Групповое тестирование, так же как и первая шкала Бине, было со-
здано в ответ на настоятельную потребность практики. Когда Соеди-
ненные Штаты вступили в первую мировую войну в 1917 г., Американ-
ской психологической ассоциацией был назначен комитет для рассмотре-
ния тех средств, которыми психология может помочь ведению войны.
Этот комитет под руководством Р. М. Йеркса столкнулся с необходи-
мостью быстро определить интеллектуальный уровень полутора мил-
" Ф.Л. Гудинаф (F.L. Goodenough, 1949, р. 50-51) отмечает, что в 1887 г., за 21 год
до появления шкалы Бине-Симона 1908 г., С.Э. Шайе опубликовал в Ньюорлеанском ме-
дицинском журнале серии тестов для детей, распределив их в соответствии с возрастом,
в котором эти тесты обычно приводятся. Частично вследствие малой доступности журна-
ла, частично же из-за того, что ученый мир еще не был к этому готов, идея возрастной
шкалы в это время осталась незамеченной. На создание подобной шкалы самим А. Бине
повлияли работы таких его современников, как А. Блин и Г. Даме, подготовивших серию
вопросов, на основании которых они получали единый суммарный показатель по каждо-
му ребенку (Т.Н. Wolf, 1973).
25 ФУНКЦИИ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ
лионов новобранцев. Такая информация требовалась для принятия реше-
ний о признании негодными к военной службе, распределении по разным
родам войск, приеме в лагеря обучения офицеров и т.п. Военные психо-
логи привлекли все имеющиеся материалы, в частности неопублико-
ванный тест для группового тестирования интеллекта Артура С. Отиса.
Основным достоинством теста Отиса, который он составил, будучи ас-
пирантом Л. М. Термена, было введение различного типа объективных за-
даний, в том числе с множественным выбором ответов.
Тесты, которые в конце концов создали военные психологи, стали
называться армейский альфа и армейский бета. Первый предназначался
для общего обычного тестирования; второй, как шкала невербальная,
был рассчитан на неграмотных и новобранцев иностранного происхо-
ждения, которые не могли ответить на задания теста на английском язы-
ке. Оба теста можно было использовать в больших группах людей.
Вскоре после окончания первой мировой войны военные тесты стали
использоваться в гражданской службе. Армейские альфа и бета неодно-
кратно перерабатывались (последние их варианты употребляются даже
в наши дни) и стали образцом для большинства групповых тестов интел-
лекта. Тестирование получило сильнейший стимул для своего развития.
Вскоре были разработаны групповые тесты интеллекта для всех возра-
стов и уровней образованности-от дошкольников до аспирантов. Еще
совсем недавно невыполнимые, массовые программы тестирования зате-
вались с завидным оптимизмом. Поскольку групповые тесты создава-
лись как средства массового тестирования, то их инструкции и процеду-
ра проведения были достаточно просты, и экспериментатору требовался
минимум обучения. Школьные учителя начали использовать тесты ин-
теллекта в своих классах. Студенты колледжей перед зачислением прохо-
дили стандартную проверку. Предпринималось широкое обследование
особых групп взрослого населения, таких, как заключенные. Вскоре IQ
был признан общественностью.
Применение групповых тестов интеллекта значительно обогнало их
методические возможности. В погоне за показателями и практическими
результатами частенько забывалось, что тесты оставались достаточно
грубым инструментом. Когда же тесты не оправдывали необоснованных
ожиданий, то часто это приводило к скептицизму и враждебному отно-
шению ко всякому тестированию. Таким образом, тестовый бум 20-х гг.,
приведший к неразборчивому применению тестов, не только задержал,
но и способствовал прогрессу психологического тестирования.
ТЕСТИРОВАНИЕ СПОСОБНОСТЕЙ
Хотя тесты интеллекта как оценивающие общий интеллектуальный уро-
вень индивида первоначально рассчитывались на проверку самых раз-
личных функций, вскоре стало очевидным, что область применения таких
тестов, поскольку в них были представлены не все существенные функ-
ции, весьма ограниченна. Фактически, большинство тестов интеллекта
в основном измеряло вербальные способности и в какой-то мере способ-
ность оперировать числовыми, абстрактными и другими символически-
ми отношениями.
Несомненно, тесты охватывали способности, имеющие в нашей
26
СОДЕРЖАНИЕ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ
ряют эти тесты. Например, большинство тестов, названных в 20-х гг. те-
стами интеллекта, позднее стали называть тестами способностей
к учению. Такая смена терминологии была следствием осознания того
факта, что многие тесты интеллекта измеряют комбинацию способно-
стей, необходимых для учебной деятельности.
Еще до первой мировой войны психологи пришли к признанию не-
обходимости дополнить общие тесты интеллекта тестами специальных
способностей. Тесты специальных способностей разрабатывались частич-
но для использования в профориентации, а также при отборе и распреде-
лении промышленного и военного персонала. Самыми распространенны-
ми среди них были тесты способностей к технике, канцелярской работе,
музыкальных и художественных способностей.
Последовавшая вслед за необычным распространением и непрофес-
сиональным использованием критическая оценка тестов интеллекта выя-
вила еще один знаменательный факт: индивидуальное выполнение от-
дельных частей тестов весьма различно. Это особенно очевидно
в групповых тестах, в которых отдельные задания обычно подразде-
ляются на субтесты относительно однородного содержания. Так, человек
может иметь относительно высокие показатели по вербальному и низкие
по числовому субтесту и наоборот. В какой-то степени такая внутренняя
неоднозначность наблюдается и в тестах типа Станфорд-Бине, в ко-
торых для данного индивида могут оказаться трудными, например, зада-
ния, содержащие слова, а выигрышными задания, использующие картин-
ки или геометрические фигуры.
Люди, работающие с тестами, особенно клиницисты, часто, чтобы
лучше уяснить индивидуальную психологическую структуру, сравнивали
выполнение отдельных частей теста и при анализе конкретного случая
рассматривали не только IQ или иной суммарный показатель, но и пока-
затели субтестов. Но такая практика пригодна не всегда, поскольку
тесты интеллекта не рассчитаны на дифференциальный анализ способно-
стей. Часто сравниваемые субтесты содержат слишком мало заданий,
чтобы дать стабильную и надежную оценку той или иной способности.
В результате показатели отдельных субтестов при тестировании индиви-
да различными вариантами одного и того же теста или в разное время
могут значительно расходиться. Чтобы осуществлять такие внутриинди-
видуальные сравнения, необходимы тесты, специально предназначенные
для выявления различий в работе анализируемых функций.
Параллельно с этими исследованиями шло изучение структуры пси-
хики, давшее необходимый материал для построения тестов специальных
способностей. Статистические работы по природе интеллекта, по-
строенные на выявлении взаимосвязей показателей, полученных у раз-
личных испытуемых по широкому диапазону тестов, были начаты ан-
глийским психологом Чарлзом Спирманом (С. Spearman, 1904; 1927)
в первом десятилетии нашего века. Их методологическая разработка
в трудах английских и таких американских психологов, как Т. Л. Келли
(T.L. Kelly, 1928) и Л.Л. Терстоун (L.L. Thurstone, 1935; 1947), стала назы-
ваться факторным анализом.
27
ФУНКЦИИ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ
Факторный анализ подробно разбирается в гл. 13. Сейчас достаточ-
но сказать, что данные, собранные с его помощью, показали наличие ря-
да относительно независимых факторов или черт. Некоторые из этих
черт, особенностей, например вербальное понимание и оперирование
числами, были в той или иной мере представлены в традиционных те-
стах интеллекта.
Другие, такие, как пространственные, перцептивные и технические
способности, чаще выявлялись не тестами интеллекта, а тестами спе-
циальных способностей.
Одним из главных практических выходов факторного анализа была
разработка комплексных батарей способностей, предназначенных для из-
мерения степени выраженности у индивида той или иной особенности из
некоторой их совокупности. Вместо общего показателя или IQ берутся
показатели таких свойств, как вербальное понимание, пространственное
воображение, арифметические способности и скорость восприятия. Такие
батареи оказались подходящим средством для внутрииндивидуального
анализа, или дифференциального диагноза, который много лет клини-
цисты ставили, основываясь на приблизительных и часто ошибочных ре-
зультатах тестов интеллекта. Кроме того, эти батареи в полной про-
грамме тестирования несли значительную информацию, получаемую
ранее через тесты специальных способностей, поскольку комплексные ба-
тареи способностей охватывают некоторые свойства, обычно не затраги-
ваемые тестами интеллекта.
Комплексные батареи способностей представляют в тестировании
относительно позднее нововведение. В основном они разрабатывались
уже после 1945 г., но их появление во многом определили работы во-
енных психологов во время второй мировой войны. Большая часть те-
стовых исследований, проводившихся в военных организациях, исходила
из факторного анализа и направлялась на создание комплексных батарей
способностей. В воздушных войсках, например, такие батареи предназна-
чались для пилотов, стрелков, радистов, штурманов и множества других
военных специальностей.
Во избежание недоразумений следует разъяснить терминологию.
Термин <тест способностей> традиционно означал тесты, измеряющие
относительно простые способности; термин <тест интеллекта> обычно
объединяет достаточно разнородные серии тестов, дающие один сум-
марный показатель типа IQ. Тесты специальных способностей, ка.к пра-
вило, измеряют одну способность. Комплексные батареи способностей
измеряют ряд способностей и дают профиль, образуемый показателями
каждой способности.
тальных данных, но и как способ, позволяющий разрабатывать содержательные психоло-
гические концепции, в частности, в психологии индивидуальных различий. Вопрос о том,
в какой степени пригоден факторный анализ для этой цели, может решить только психо-
лог. Современный факторный анализ осуществляется относительно статистических рядов
(результаты тестирования, анкетирования и т.п.), находящихся между собой в линейной
зависимости. Насколько правомерна гипотеза, что психику человека достаточно адекватно
описывают линейные связи?
Известно, что такой гипотезы придерживался Ч. Спирман, но теперь она стала до-
-.,"-....".. "",." н пя1.п\л случае исследователь, намеревающийся применить фак-
28 СОДЕРЖАНИЕ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ
СТАНДАРТИЗОВАННЫЕ ТЕСТЫ ДОСТИЖЕНИЙ
По мере того как психологи разрабатывали тесты интеллекта и способ-
ностей, обычные школьные экзамены также технически усовершенствова-
лись (O.W.CaldweH, S.A.Courtis, 1923; R.L.Ebel, D.E.Damrin, 1960).
Важный шаг в этом направлении был сделан бостонскими общественны-
ми школами, заменившими в 1845 г. устные экзамены учащихся пись-
менными. Обоснование этого нововведения удивительно похоже на рас-
суждения более позднего времени, объяснявшие необходимость замены
местоименных вопросов выбором ответа из списка возможных. Пись-
менные экзамены ставят всех учеников в равное положение, позволяют
охватить большее содержание, уменьшают элемент случайности в выбо-
ре задаваемого вопроса и сводят на нет возможную необъективность
экзаменатора.
На рубеже этого столетия появились первые стандартизованные
тесты по измерению результатов школьного обучения. После работы
Р. Л. Торндайка (R.L. Thorndike, 1933) в этих тестах стали использовать-
ся принципы измерения, разработанные в психологических лаборато-
риях. В качестве примера таких тестов можно назвать шкалы оценки ка-
чества почерка и письменных сочинений, а также тесты на правописание,
арифметический счет и рассуждения. Несколько позднее, после выхода
в 1923 г. первого издания станфордского теста достижений, разработан-
ного ведущими тестологами того времени Труманом Л. Келли, Джайл-
сом М. Рачом и Льюисом М. Терманом, появились батареи достижений.
Предвосхищая многие особенности современного тестирования, эти ба-
тареи позволяли осуществлять сравнимые измерения выполнения зада-
ний по разным школьным предметам, оцениваемого относительно еди-
ной системы нормативов.
К этому времени стали очевидными разногласия среди учителей
в оценке результатов описательных тестов. К 1930 г. было признано, что
описательные тесты по сравнению с объективными заданиями <нового
типа> не только отнимают у экзаменаторов и экзаменующихся больше
времени, но и дают менее надежные результаты. По мере того как
объективные задания все шире применялись в стандартизованных тестах
достижений, росло их значение в тестах на понимание и применение зна-
ний и других общих целей обучения, 30-е гг. ознаменовались также по-
явлением машин по подсчету тестовых показателей, которые легко было
приспособить для новых объективных тестов.
Создание региональных и национальных программ тестирования
также способствовало его развитию. Вероятно, наибольшей извест-
ностью пользуется программа Совета по вступительным экзаменам
в колледжи. Принятая еще в конце прошлого века с целью уменьшить
дублирование экзаменов для поступающих в колледжи, эта программа
была основательно переработана, особенно используемые в ней методы
тестирования; были расширены также типы колледжей, в которых она
могла применяться. Происшедшие изменения отразили развитие не
только тестирования, но и образования, поскольку в 1947 г. тестирова-
ние, осуществлявшееся Советом по вступительным экзаменам в коллед-
жи, корпорацией Карнеги и американским Советом по образованию, бы-
Вопросы, требующие описательного ответа. См.: Русский язык: Эничкгч-пр
М" 1979, с. 45-46.
29
ФУНКЦИИ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ
ло передано вновь созданной Службе тестирования в образовании,
принявшей на себя ответственность за все программы тестирования для
университетов, профессиональных училищ, правительственных учрежде-
ний и других организаций. Следует также упомянуть не включенную
в программу Совета по вступительным экзаменам в колледжи американ-
скую программу тестирования в колледжах 1959 г. для отбора поступаю-
щих в колледжи и несколько национальных программ тестирования для
отбора на стипендии одаренных учащихся. -
Тесты достижений используются не только в учебных целях, но
и при отборе поступающих на работу в промышленность и государ-
ственные учреждения. Как уже сообщалось, систематические экзамены
при приеме на гражданскую службу в китайской империи были введены
еще в 1115 г. до н.э. В европейских странах это случилось в конце
XVIII-начале XIX в. Комиссия гражданской службы Соединенных Шта-
тов утвердила конкурсные экзамены в 1883 г.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58