А-П

П-Я

А  Б  В  Г  Д  Е  Ж  З  И  Й  К  Л  М  Н  О  П  Р  С  Т  У  Ф  Х  Ц  Ч  Ш  Щ  Э  Ю  Я  A-Z

 

Поэтому стандартный набор данных о тесте должен
включать в себя и меру надежности. Такая мера характеризует тест, ког-
да он применяется в стандартных условиях и проводится с испытуемы-
ми, похожими на тех, кто участвовал в нормативной выборке. Следова-
тельно, необходимо также приводить сведения об этой выборке.
Разновидностей надежности теста так же много, как и условий,
влияющих на результаты теста, поэтому любые такие условия могут
оказаться посторонними по отношению к какой-то цели, и тогда обусло-
вленная ими дисперсия должна войти в дисперсию ошибки. Однако
практическое применение находит лишь несколько типов надежности.
В этой главе мы обсудим важнейшие способы измерения надежности те-
стовых результатов, а также соответствующие им источники дисперсии
ошибки. Поскольку все типы надежности отражают степень последова-
тельности или согласованности двух независимо полученных серий пока-
зателей, то в качестве их меры может выступать коэффициент корреля-
ции. Соответственно в следующем разделе рассматриваются некоторые
из основных характеристик коэффициента корреляции, их назначение
и интерпретация. Более специальное обсуждение корреляции с под-
робным описанием вычислительных процедур приводится в элемен-
тарных учебниках по статистике для педагогов и психологов (J. P. Guil-
ford, В. Fruchter, 1973).
КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ
Понятие корреляции. Коэффициент корреляции (г) выражает сте-
пень соответствия или связи между двумя сериями показателей теста.
Например, если испытуемый, получивший высший результат по перемен-
ной 1, получает высший результат и по переменной 2, а испытуемый, по-
лучивший второй лучший результат по переменной 1, получает такой же
результат по переменной 2 и т.д. до самого низшего результата, то
имеет место полная корреляция между переменными 1 и 2. Коэффициент
корреляции будет при этом равен + 1,0.
Рис. 8 иллюстрирует гипотетический случай полной положительной
корреляции. На рисунке представлена диаграмма рассеяния, или двумер-
ное распределение. Каждая палочка на этой диаграмме отмечает резуль-
99
НАДЕЖНОСТЬ
тат испытуемого как по переменной 1 (горизонтальная ось), так и по
переменной 2 (вертикальная ось). Нетрудно заметить, что все 100 случаев
распределились вдоль диагонали, идущей из левого нижнего угла
в правый верхний угол диаграммы. Такое распределение означает по-
лную положительную корреляцию ( + 1,0), поскольку из него видно, что
относительное положение каждого испытуемого по обеим переменным
одинаково. Чем ближе двумерное распределение к этой диагонали, тем
выше положительная корреляция.
На рис. 9 изображена полная отрицательная корреляция ( -1,0).
В этом случае результаты по одной переменной полностью обратны ре-
зультатам другой: лучший индивидуальный результат по переменной
1 оказывается худшим по переменной 2, и наоборот, причем подобная
обратимость воспроизводится по всему распределению. Из диаграммы
видно, что все испытуемые распределяются по диагонали, идущей из ле-
вого верхнего в правый нижний угол, т. е. перпендикулярно направлению,
соответствующему полной положительной корреляции.
Нулевая корреляция указывает на полное отсутствие связи. Если ме-
сто каждого испытуемого по переменной 1 определить методом выта-
Рис. 8. Двумерное распределение для гипотетической корреляции (4-1.0)
90-99
80-89
70-79
(N
1 60-69
г
150-59
S
у
d 40-49
30-39
ill
Mi-ill
Wtwr ч
mm 4M-1
т-мг M-w 4М-
тм ш-iii
wtm
Wt 1
//
ст>
I
о
<Т>
It-
о
ю
сп ст>
in <о
о о
1Л и)
о
00
100
ПРИНЦИПЫ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ
скивания бумажек с именами из шляпы, а затем ту же процедуру повто-
рить (для переменной 2), то в итоге мы и получим примерно нулевую
корреляцию. В этих условиях, зная результат индивида по переменной 1,
невозможно предсказать его относительное положение по переменной 2.
Испытуемый, имеющий высший показатель по переменной 1, может по-
лучить высокий, средний или низкий показатель по переменной 2. Одни
индивиды могут случайно оказаться выше или ниже среднего показателя
по обеим переменным, другие будут выше среднего по одной перемен-
ной и ниже среднего по другой, иными словами, не будет никакой зако-
номерности в соответствии показателей у разных испытуемых.
Реальные значения коэффициента корреляции, получаемого практи-
чески, обычно больше 0, но меньше 1. Корреляция между показателями
способностей почти всегда положительна, хотя часто и невысока. Отри-
цательные значения коэффициента корреляции обычно объясняются спе-
цификой самих показателей. Если взять, скажем, время, затраченное ис-
пытуемым, и количество выполненных им заданий, то значение
коэффициента, по всей вероятности, будет отрицательным. Так, если ре-
зультат испытуемого по тесту арифметических вычислений регистрирует-
Рис. 9. Двумерное распределение для гипотетической корреляции (-1,0)
70-79
60-69
50-59
? 0-49
30-39
//
fM 1
Wtm
mm Mill
-wwt mm w
-Mtwt wt i
mwt ii
м-ill
ill
ст) (70) 0 0(7)0(7) -смгпгюиэоос" ill i Ull 000000000
i
0 0
in иэ
О
t
О
со
О
01
101
НАДЕЖНОСТЬ
ся в виде числа секунд, ушедших на решение всех примеров, тогда как
показателем теста на арифметическое мышление служит число правиль-
но решенных задач, то следует ожидать появления отрицательной корре-
ляции. В этом случае наименее успевающий (работающий медленнее
всех) индивид получит численно самый высокий результат по первому
тесту, в то время как по второму тесту самый высокий результат будет
у наиболее успевающего индивида.
Коэффициенты корреляции можно вычислять в зависимости от при-
роды данных разными способами. Наиболее распространен введенный
К. Пирсоном коэффициент корреляции произведения моментов. Этот
коэффициент учитывает не только положение результатов индивида
в группе, но и степень их отклонения от группового среднего значения.
Напомним, что когда положение каждого индивида выражается в терми-
нах стандартного показателя (z), то выше среднего располагаются поло-
жительные z, а ниже среднего-отрицательные. Следовательно, для инди-
вида, чьи результаты выше среднего в обоих вариантах, коррелируются
два положительных стандартных показателя, а тот, чей результат в обо-
их случаях ниже среднего, имеет два отрицательных z. Если теперь пере-
множить стандартные показатели по обеим переменным каждого из
двух индивидов, то оба произведения будут положительны. Пирсонов-
ский коэффициент корреляции есть среднее арифметическое всех таких
произведений. Его числовое значение бывает высоким и положительным,
если соответствующие стандартные показатели имеют по обеим пере-
менным одинаковые знаки и приблизительно равную величину. Когда
показатели испытуемых выше среднего по одной переменной, но ниже
среднего по другой, то со-
ответствующие произведе-
ния отрицательны. Если
сумма произведений отри-
цательна, то отрицатель-
ной будет и корреляция.
Когда же одни произведе-
ния отрицательны, а дру-
гие положительны, корре-
ляция близка к нулю.
При проведении рас-
четов нет необходимости
переводить каждый пер-
вичный показатель в стан-
дартный, так как это пре-
образование может быть
выполнено один раз уже
после суммирования всех
попарных произведений.
При расчете пирсоновско-
го коэффициента корреля-
ции можно пользоваться
различными приемами,
сокращающими объем вы-
числений. Метод, приме-
TTITTITT rtl Tt rrnhTT 7 T?Л ff\X~t_1TX
Таблица 7
Вычисление коэффициента корреляции произведения мо-
ментов Пирсона
Арифме-1
УчениктикиЧтениеуX.i\т
У1
Билл41171-4116-4
Карол3828-27449-14
Джефри4822816418
Энн3216-8-5642540
Боб3418-6-336918
Джейн3615-4-6163624
Эллен4124i3193
Рут43203-191-3
Дик47237249414
Мари4027060360
?4002100024418686
М4021
144 ет -= /-- " \1 10- = l/24,4 == 4,94;",-TM 10-1/18,6 =
= 4,31;
"Lxy8686f\ Л
"" Nc, (10) (4,94) (4,31)212,9
102 ПРИНЦИПЫ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ
раскрывает природу коэффициента корреляции. В табл. 7 приведе-
но вычисление r для результатов 10 детей по арифметическому тесту
и тесту чтения. Справа от имени ученика приведены его результаты по
первому (X) и второму (У) тесту. Суммы и средние значения 10 показате-
лей приведены под колонками. Далее следует колонка отклонений (х) по-
казателя арифметического теста от среднего значения и такая же колон-
ка для теста чтения (у). Квадраты этих отклонений даны в следующих
двух колонках, а суммы квадратов использованы для вычисления мето-
дом стандартных отклонений результатов обоих тестов, описанным
в гл. 4. Вместо того чтобы каждое х и у делить на соответствующее
о для определения стандартного показателя z, это деление выполняется
один раз, в конце, так, как показано в формуле вычисления коэффициен-
та корреляции, приведенной в нижней части таблицы. Попарные про-
изведения, стоящие в последней колонке, есть результат умножения со-
ответствующих отклонений х и у. Чтобы получить коэффициент r, сумма
этих произведений делится на число случаев (N) и на произведение обоих
стандартных отклонений (а,ст").
Статистическая значимость. Корреляция 0,40, найденная
в табл. 7, означает среднюю степень положительной связи между показа-
телями арифметического теста и теста чтения. Можно отметить некото-
рую тенденцию, выражающуюся в том, что ученик, хорошо показавший
себя в арифметическом тесте, скорее всего, неплохо справится и с те-
стом чтения. Если нас интересуют только эти 10 детей, то мы можем
принять полученный коэффициент корреляции в качестве адекватной ха-
рактеристики степени связи, существующей между двумя переменными
в данной группе. В психологических исследованиях, однако, обычно стре-
мятся распространить полученные результаты за пределы конкретной
выборки испытуемых, на популяцию, которую эта выборка представляет.
Например, нас может интересовать вопрос, существует ли связь между
арифметическими способностями и навыками чтения у американских
школьников того же возраста, что и наши испытуемые. Конечно, 10 ис-
следованных случаев-совершенно недостаточная выборка для такой по-
пуляции, ибо в другой сравнимой выборке с тем же числом случаев мож-
но получить как более низкую, так и более высокую корреляцию.
Существуют статистические процедуры оценки возможных колеба-
ний от одной выборки к другой коэффициентов корреляции, средних
значений, стандартных отклонений и любых других групповых единиц
измерения. Вопрос, чаще всего задаваемый по поводу коэффициента кор-
реляции: отличается ли он значимо от нуля? Иными словами, если в по-
пуляции этот коэффициент равен нулю, то могла бы полученная в вы-
борке корреляция быть следствием только выборочной ошибки? Когда
говорят, что корреляция значима <на 1Їо-ном уровне> или <на уровне
0,01>, то имеют в виду следующее: существует не более одного шанса из
ста, что в популяции данный коэффициент равен нулю. Из этого следует,
что обе переменные действительно коррелированы. Уровни значимости
указывают риск ошибки, на который мы вынуждены пойти, делая вы-
воды из полученных данных. Если корреляция значима на уровне 0,05, то
вероятность ошибки составляет 5 из 100. В большинстве психологиче-
ских исследований применяются уровни 0,01 и 0,05, хотя по некоторым
-опРшяжениям можно пользоваться и другими уровнями значимости.
103
НАДЕЖНОСТЬ
наличии 10 случаев трудно выявить общие закономерности. Для выбор-
ки такого размера самая малая корреляция, значимая на уровне 0,05,
равна 0,63. Любая корреляция ниже этой величины оставляет без ответа
вопрос о коррелированности двух переменных в популяции, из которой
была извлечена выборка.
Минимальные значения коэффициентов корреляции на уровнях 0,01
и 0,05 для групп разной численности можно найти в таблицах значимо-
сти корреляции, приводимых в учебниках по статистике. Для понимания
проблематики этой книги требуется лишь общее представление об ос-
новных вопросах. Добавим только, что уровни значимости ицтерпрети-
руются подобным же образом и применительно к другим статистиче-
ским мерам. Например, если различие между двумя средними значимо
на уровне 0,01, то отсюда можно сделать вывод (причем вероятность
ошибиться равняется одному шансу из 100), что тестирование всей попу-
ляции, из которой были взяты выборки, дает приблизительно ту же раз-
ницу. Так, если в обследованной выборке мальчики получили заметно
более высокое среднее значение в тесте на понимание техники, чем де-
Рис. 10. Коэффициент надежности 0,72 (A. Anostosi, J. Drake, 1954)
75-79 70-74 65-69 60-64i

155-59 50-54 i 1 45-49 И 1 40-44 1 35-39 30-35 25-29 20-24 15-19иii
fM-iч11
/иufniiiilii
itmililliiiii
////ми114i
/////mimilii
тчiiiii
/illi
/
CT>
in
S
0
01
CT>
Ю ГО
f
0 in 0
104 ПРИНЦИПЫ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ
вочки, то можно заключить, что мальчики будут превосходить девочек
по этому тесту и в популяции в целом.
Коэффициент надежности. Коэффициенты корреляции часто
применяются при анализе психологических данных. Одно из таких при-
менений - это измерение надежности теста. Пример коэффициента надеж-
ности, вычисленного по пирсоновскому методу смешанных моментов,
приведен на рис. 10. В этом случае выяснялось наличие корреляции ме-
жду показателями 104 человек по двум эквивалентным формам теста
беглости речи. В обоих случаях испытуемым давалось пять минут, в те-
чение которых они должны были написать как можно больше слов, на-
чинающихся на заданную букву. Формы теста отличались друг от друга
лишь задаваемой буквой. Авторы теста подобрали начальные буквы
с таким расчетом, чтобы трудность заданий была примерно одинаковой.
Корреляция между числом слов, написанных в ходе выполнения
каждой из двух форм данного теста, оказалась равной 0,72, т. е. значимой
на уровне 0,01. При наличии 104 случаев любая корреляция, превышаю-
щая 0,25, значима на этом уровне. Тем не менее полученная корреляция
несколько ниже, чем это желательно для коэффициента надежности, ко-
торый обычно бывает выше 0,8 и даже 0,9. Диаграмма на рис. 10 пред-
ставляет типичное двумерное распределение с высокой положительной
корреляцией. Можно видеть, как палочки теснятся вблизи диагонали,
идущей от левого нижнего к правому верхнему углу. Направление это
в общем довольно ясно выражено, хотя и наблюдается некоторый раз-
брос палочек. В следующем разделе обсуждается использование коэффи-
циента корреляции для вычисления различных мер надежности теста.
ТИПЫ НАДЕЖНОСТИ
Ретестовая надежность. Самый естественный способ определить
надежность результатов теста-использовать тот же тест второй раз.
В этом случае коэффициент надежности (Гц) просто равен корреляции
между результатами, полученными на одних и тех же испытуемых в каж-
дом из двух случаев проведения теста. Дисперсия ошибки соответствует
случайным колебаниям в выполнении заданий от одного сеанса тестиро-
вания к другому. Эти колебания могут отчасти быть результатом некон-
тролируемых условий тестирования-таких, как значительные изменения
погоды, появление неожиданного шума и иных отвлекающих моментов
типа сломавшегося карандаша. В какой-то степени их можно объяснять
изменениями в состоянии самого испытуемого-например болезнью,
утомлением, эмоциональным напряжением, беспокойством, недавними
приятными или неприятными переживаниями и т.д. Ретестовая надеж-
ность показывает, в какой степени результаты теста можно распростра-
нить на различные случаи его применения. Чем выше надежность, тем
менее чувствительны результаты к обычным изменениям состояния ис-
пытуемого и обстановки тестирования.
Приводя в руководстве к тесту его ретестовую надежность, всегда
следует указывать, в каком интервале времени она измерена. Поскольку
ретестовая корреляция с течением времени постепенно снижается для
105 НАДЕЖНОСТЬ
любого теста, существует не один, а бесконечное количество ретестовых
коэффициентов надежности. Желательно также давать некоторые сведе-
ния о событиях, происшедших за это время с испытуемыми в учебе или
работе (консультировался ли кто-либо с психологом или прошел курс
психотерапии и т.д.).
Независимо от желательности сведений об интервале времени меж-
ду двумя тестированиями, какими соображениями следует руководство-
ваться при выборе этого интервала? Можно привести немало примеров
того, как надежность теста остается высокой в течение нескольких дней
или недель, но спустя десять-пятнадцать лет его результаты уже почти
не коррелируют с первоначальными. Так, многие из тестов интеллекта
для дошкольников достаточно стабильны в дошкольный период, но со-
вершенно бесполезны для предсказания, каков будет IQ ребенка в стар-
шем возрасте или во взрослом состоянии. На практике, однако, чаще
всего можно провести следующее различие.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58