А-П

П-Я

 

п.). Поэтому данный метод применяется только тогда, когда име-
ется достаточное количество материала для анализа (т. е. или пред-
ставлено много отдельных однородных документов, автобиографий, пи-
сем, фотографий и т. д., или есть несколько и даже один документ,.
например дневник, но достаточного объема). При этом интересующие
нас элементы содержания (единицы анализа) также должны встре-
чаться в исследуемых документах с достаточной частотой. В против-
ном случае наши выводы будут лишены статистической достоверности.
Критерием здесь служит закон больших чисел.
Не все виды документов пригодны для контент-анализа и по причи-
не затруднений с формализацией их содержания. Иногда невозможно.
задать четкие однозначные правила для фиксирования нужных харак-
теристик содержания (например, трудно или совсем нельзя формали-
зовать описание лирического героя некоторых поэтических произве-
дений) .
Отсюда объекты анализа должны удовлетворять требованиям ста-
тистической значимости и формализации.
Квантификация в контент-анализе от простого подсчета частот
встречаемости тех или иных элементов-единиц содержания постепен-
но эволюционировала к более сложным статистическим средствам.
В частности, еще в 1942. г. А. Болдуином был предложен подсчет со-
вместной встречаемости слов в тексте (Baldwin А., 1942). В конце
50-х годов Ч. Осгуд с сотрудниками обогатил контент-анализ методи-
кой <связанности символов>, в которой развивается принцип Болдуи-
на, что позволяет обнаруживать неслучайные, связанные между со-
бой элементы содержания, представленные в специальных матрицах
(Семенов В. Е., 1983; Osgood Ch., 1959). В сущности, эта методика
была началом введения в контент-анализ корреляционной техники, а
затем и факторного анализа.
Новым этапом в развитии контент-анализа стала его компьютери-
зация в 60-х годах. В Массачусетском технологическом институте по-
явился <универсальный анализатор> (The General Inquirer) - ком-
плекс программ анализа текстовых материалов для ЭВМ, при помощи
которого можно, подсчитывать частоты категорий содержания текста,
получать азл<чйыенндёксы{га~осневе_ совместного появления этих
_-ктгоан и т. Д. (Stone Ph., Dunphy D., 1966). Подобным образом на
ЭВМ были исследованы речи двадцати американских президентов при
их вступлении на этот пост, редакционные статьи в газетах разных
стран, личные письма, сочинения, вербальное поведение психически
больных людей и прочие материалы. С 70-х годов в США разрабаты-
ваются стандартные программы анализа разнообразных документов
на ЭВМ, которые предлагаются организациям и частным лицам (Со-
хоп А" 1977), тогда же компьютерный контент-анализ развивается и
в других странах (Deichelsel А., 1975).
Естественно, что использование ЭВМ в контент-анализе обеспечи-
вает преимущества, заключающиеся в надежности получаемых данных
и быстроте анализа, по сравнению с ручным, выполняемым людьми-
кодировщиками, которые подвержены ошибкам из-за утомления и субъ-
51
STR.52
ективных факторов. Таким образом, трудоемкость составления про-
грамм окупается тем огромным объемом содержания, которое доста-
точно быстро и надежно можно проанализировать на компьютере, а
также освобождением кодировщиков от их чрезвычайно утомительного
труда. В целом проблемы использования машинного контент-анализа
близки общей стратегии применения ЭВМ в эмпирических социальных
исследованиях. Важно правильно определить, когда следует восполь-
зоваться машинным, а когда ручным анализом, что зависит от задач
исследования, от объема материалов, подлежащих анализу, от степе-
ни их формализуемости.
На основании данного обзора представляется, что качественно-ко-
личественный анализ документов в нашей психодиагностике несомнен-
но должен использоваться более широко и интенсивно.
STR.53
ГЛАВА 3
ПСИХОМЕТРИЧЕСКИЕ ОСНОВЫ ПСИХОДИАГНОСТИКИ
3.1. РЕПРЕЗЕНТАТИВНОСТЬ ТЕСТОВЫХ НОРМ
Основные статистические принципы построения тестов достаточно
полно освещены в появившейся в начале 80-х годов на русском языке
литературе по дифференциальной психометрике (Аванесов В. С., 1982;
Анастази А" 1982; Гайда В. К., Захаров В. П., 1982). Тем не менее в
указанных руководствах центральная проблема психометрики те-
стов - вопрос о тестовых нормах - еще не получила последователь-
ного освещения. Прежде всего это относится к руководству известной
представительницы американской тестологии А. Анастази.
В руководстве Анастази не получают достаточного критического об-
суждения две основополагающие предпосылки традиционной западной
тестологии: вопрос о применении статистических норм (квантилей рас-
пределения баллов) в качестве диагностических норм и вопрос о све-
дении всех эмпирических распределений к нормальной модели. Здесь
эти предпосылки будут проанализированы в контексте краткой рекон-
струкции системы основных понятий дифференциальной психометрики.
Статистическая природа тестовых шкал. Типичный измерительный
тест в психодиагностике - это последовательность кратких заданий,
или пунктов, дающая в результате ее выполнения испытуемым последо-
вательность исходов, которая затем подвергается однозначной количе-
ственной интерпретации. Примеры интерпретации в интеллектуальных
тестах, состоящих из отдельных задач: <правильное решение>, <оши-
бочное решение>, <отсутствие ответа> (пропуск задачи из-за нехватки
времени). Примеры интерпретации в случае личностных опросников,
состоящих из высказываний, предлагаемых для подтверждения испы-
туемым: <подтверждение> (ответ <верно>), <отвержение> (ответы <не
согласен>, <неверно>).
Суммарный балл по тесту подсчитывается с помощью ключа: ключ
устанавливает числовое значение исхода по каждому пункту. Напри-
мер, за правильное решение задания - <+1>, за неправильное или
пропуск - <О>. Тогда балл буквально выражает количество правиль-
ных ответов.
Исход по отдельному заданию подвержен воздействию не только со
стороны измеряемого фактора - способности или черты испытуемого,
но и побочных шумовых факторов, которые являются иррелевантными
по отношению к задаче измерения. Примеры случайных факторов: ко-
лебания внимания, вызванные неожиданными отвлекающими события--
ми (шум на улице, стук в дверь и т. п.), трудности в понимании смыс-
ла задания (вопроса), вызванные особенностями опыта данного кон-
кретного испытуемого, и т. п. Последовательность исходов оказывает-
ся последовательностью событий, содержащей постоянный и случайный
компоненты. Как известно, основным приемом, позволяющим устранить
искажающее влияние случайных факторов на результат (суммарный
балл), является балансирование этого влияния с помощью повторе-
ния. При этом фактически предполагается, что повторение обеспечива-
ет рандомизацию (случайное варьирование) неконтролируемого фак-
53
STR.54
тора, в результате чего при суммировании исходов положительные и
негативные эффекты случайных факторов взаимопоглощаются (о ме-
ханизме рандомизации см.: Готтсданкер P., 1982).
В оптимальном тесте набор и последовательность заданий органи-
зуются таким образом, чтобы повысить долю постоянного компонента
и сократить долю случайного в величине суммарного балла. Тем не ме-
нее, несмотря на различные статистические ухищрения, суммарный
балл в психологических измерениях содержит несравненно большугс
долю случайного компонента, чем в обычных физических измерениях.
В силу этого суммарный балл оказывается определенным лишь в из-
вестных пределах, заданных ошибкой измерения.
Для того чтобы оценить эффективность, дифференциальную цен-
ность всей процедуры измерения, необходимо соотнести размеры ошиб-
ки измерения с размерами разброса суммарных баллов, вызванных ин-
дивидуальными различиями в измеряемой характеристике между испы-
туемыми. В терминах статистики речь идет о сравнении так называе-
мой <истинной> дисперсии распределения суммарных баллов с диспер-
сией <ошибки>. Именно этим обусловлен необходимый интерес психо-
метристов к распределению суммарных баллов. Поэтому анализ рас-
пределения необходим не только при использовании статистически?!
норм, но и в случае абсолютных и критериальных норм.
Как известно, частотное распределение суммарных баллов имее1
удобную графическую иллюстрацию в виде кривых распределений: ги-
стограммы и кумуляты (см., в частности, удачное популярное введе-
ние в описание распределений в книге: Кимбл Г., 1982, с. 55-70)
В случае гистограммы по оси абсцисс откладываются <сырые очки> -
первичные показатели суммарных баллов, возможных для данного те-
ста, по оси ординат -- относительные частоты (или проценты) встреча
емости баллов в выборке стандартизации (Анастази А., 1982, с. 66)
Как известно, для <колоколообразной> кривой нормального распреде
ления дисперсия визуализируется как параметр, ответственный з;
<распластанность> графика плотности вероятности (теоретического ана
лога эмпирической кумуляты) вдол]
оси X. Чтобы визуализировать дис
Частота персию ошибки измерения, нужно бы
ло бы многократно провести тест
одним испытуемым и построить гра
фическое распределение частот ег
<персональных> баллов. В результат
получится схема, представленная н
рис. 1.
Очевидно, что дифференцирующая
способность теста сводится к нулк
если кривые, иллюстрирующие <и(
Суммарный Ват ТИННуЮ> И <ошибочную> ДИСПерСИ1
совпадают. Как видим, анализ ра(
Рис. 1. Графическая иллюстрация пределения тестовых баллов необхс
соотношений индивидуальной и меж- дим уже для анализа надежност
индивидуальной (общей) вариации теста (СМ. 3.2).
тестовых баллов Проблема, меры в психометр1
ке и свойства пунктов теста. В физ1
ческих измерениях калибровка шкалы производится на основе контр
ля за равномерным варьированием измеряемого свойства эталоннь
объектах. Носителем меры является эталон - физический объект, ст.
бильно сохраняющий заданную величину измеряемого свойства. В дис
STR.55
ференциальной психометрике такие физические эталоны отсутствуют:
мы не располагаем индивидами, которые были бы постоянными носи-
телями заданной величины измеряемого свойства. Роль косвенных эта-
лонов в психометрике выполняют сами тесты: в том смысле, в каком
трудность задач можно рассматривать как величину, прямо пропорцио-
нально сопряженную со способностью (чем труднее задача, тем выше
должен быть уровень способности, требуемый для ее решения). Анало-
гом понятия <трудность> для <ли-вопросов> опросника является <си-
ла>: более <сильные> высказывания (в логическом смысле) вызывают
подтверждение (согласие) у меньшего числа испытуемых. Ни труд-
ность, ни силу пунктов теста нельзя выявить иначе, чем с помощью про-
ведения теста. Операциональным определением трудности оказывает-
ся <процентильная мера>: процент испытуемых, справившихся с зада-
нием теста (или ответивших <верно> на <ли-вопрос>). Чем меньше про-
цент, тем выше трудность.
Кривая распределения тестовых баллов отражает свойства пунктов,
из которых составлен тест. Если кривая имеет правостороннюю асим-
метрию, то значит в тесте преобладают трудные задания; если кривая
имеет левостороннюю асимметрию, то значит большинство пунктов в
тестер-легкие (слабые) (рис. 2).
Тесты типа а) плохо дифференцируют испытуемых с низким уров-
нем способностей: все эти испытуемые получают примерно одинаковый
низкий балл. Тесты типа б), наоборот, хуже дифференцируют испытуе-
мых с высоким уровнем способностей.
Если пункты обладают оптимальным уровнем трудности (силы), то
кривая распределения зависит от того, насколько пункты однородны.
Если пункты разнородны (исход по одному пункту не предопределя-
ет исход по другому), то мы получаем тест в виде последовательности
независимых испытаний Бернулли. Как известно из математической
статистики, при достаточно большом количестве независимых испыта-
ний с двумя разновероятными исходами кривая биномиального распре-
деления (кривая суммарного балла) автоматически по закону боль-
ших чисел приближается к кривой нормального распределения (цент-
ральная предельная теорема Муавра - Лапласа). Если тест содержит
такие разнородные задания примерно равного уровня трудности (имен-
но такие задания и подбираются для измерения интегральных свойств
ПраИмторанняп
патжчтельнм
ассчиеприя
kTX
Рис. 2. Графики, иллюстрирующие
асимметрию распределения тестовых
баллов
Рис. 3. Графики, иллюстрирующие
положительный (а) и отрицательный
(а, б) эксцесс распределения тесто-
,вых баллов
личности - с широкой областью применения), то нормальность рас-
пределения суммарных баллов возникает автоматически - как арте-
факт самой процедуры подсчета суммарных баллов. При этом, конеч-
<Ли.-вопросы>-это вопросы, содержащие высказывания, с которыми испытуе-
мый должен либо согласиться, либо не согласиться.
55
STR.56
но, форма кривой распределения баллов не позволяет говорить о ре-
альной форме распределения измеряемого свойства, каким оно являет-
ся само по себе - в широкой популяции испытуемых. Нормальность
распределения есть артефакт, прямое следствие направленного отбора
пунктов с заданными свойствами.
Если подбираются пункты, тесно положительно коррелирующие
между собой (испытания не являются статистически независимыми), то
в распределении баллов возникает отрицательный эксцесс (рис. 3, а).
Максимальных величин отрицательный эксцесс достигает по мере воз-
растания вогнутости вершины распределения - до образования двух
вершин - двух мод (с <провалом> между ними - рис. 3, б). Бимо-
дальная конфигурация распределения баллов указывает на то, что вы-
борка испытуемых разделилась на две категории (с плавными пере-
ходами между ними): одни справились с большинством заданий (со-
гласились с большинством <ли-вопросов>), другие - не справились.
Такая конфигурация распределения свидетельствует о том, что в ос-
нове пунктов лежит какой-то один оощий им всем признак; соответс-
твующий определенному свойству испытуемых: если у испытуемых есть
это свойство (способность, умение, знание), то они справляются с
большинством пунктов, если нет этого свойства - то не справляются,
В некоторых редких ситуациях пункты могут отрицательно коррелиро-
вать друг с другом. В этом случае на кривой возникает положитель-
ный эксцесс (рис. 3, в): вся масса эмпирических точек скучивается
вблизи среднего значения. Такое возможно в двух случаях: когда ключ
составлен неверно - объединены при подсчете отрицательно связан-
ные признаки, которые обусловливают взаимоуничтожение баллов; во-
вторых, когда испытуемые применяют, разгадав направленность опрос-
ника, специальную тактику <медианного балла> - искусственно ба-
лансируют ответы <за> и <против> одного из полюсов измеряемого ка-
чества.
Итак, когда в качестве единственного эталона измерения психоди-
агностами рассматривается сам тест, то в качестве меры измеряемого
свойства выступает местоположение балла на кривой распределения.
Применяется процентильная шкала. В качестве универсальной меры,
пригодной для разных (по своей качественной направленности и ко-
личеству пунктов) тестов, используется <процентильная мера>. 77/70-
центиль - процент испытуемых из выборки стандартизации, которые
получили равный илц более низкий балл, чем балл данного испытуе-
мого. Таким образом, в качестве источника данной меры выступает
нормативная выборка (выборка стандартизации), на которой построе-
но нормативное распределении тестовых баллов. Процентильные шка-
лы лежат в основе всех традиционных шкал, применяемых в тестоло-
гии (Т-очки ММР1, баллы IQ, стены 16 PF я др.).
Подчеркнем, что с точки зрения теории измерений процентильные
шкалы относятся к порядковым шкалам: они дают информацию, у ко-
го из испытуемых сильнее выражено измеряемое свойство, но ничего
не позволяют говорить о том, насколько или во сколько раз сильнее.
Для того, чтобы строить на базе таких шкал количественный прогноз,
нужно повысить уровень измерения (популярное изложение представ-
лений о теории измерений GM.I в книге: Клигер С. А. и др., 1978). Пе-
реход к шкалам интервалов производят либо на базе эмпирического
распределения, л,ибо на базе произвольной модели теоретического рас-
пределения. В абсолютном большинстве случаев в роли такой теоре-
тической модели оказывается модель нормального распределения (хо-
тя в общем случае может быть использована любая модель).
STR.57
В целом кроме статистических, процентильных шкал следует отли-
чать нередко используемые в дифференциальной психсметрике еще 2
вида шкал (и соответственно 2 вида тестовых норм).
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58