Если бы нам приходилось хранить так много этало-
нов, наш мозг был бы таким громоздким, что пришлось бы возить его на
тачке. Так что этот трюк не пройдет по неврологическим соображениям.
Обнаружение и интерпретация сенсорных сигналов
в компьютерах
Сравнение с эталоном является основой
многих кодирующих систем, ставших час-
тью нашей повседневной жизни. Например,
; почти все банки в США имеют системы
цену, печатаемую затем на контрольной
ленте кассового аппарата.)
А
1пет|сдг|
STATE
BANK
Mattew A. SWANN
18 Chclsca Place
New York, N.Y. 100П
HO. 159
PAY TO ME ORDER OF _
OTV-- Ю№ 75 47 Д>
Цдля идентификации счетов по специальным
Вб цифрам, отпечатанным на оборотной сто-
,роне чека, а во многих магазинах исполь-
зуютсн аналогичные коды (напечатанные
,У; на упаковках товара) для ускорения про-
|цесса выписки счетов и проведения пере-
йучета товаров. (По этому коду компьютер
% определяет единицу товара и указывает ее
Обе эти разновидности кодов читаются
посредством сравнения с эталоном. Рису-
нок на чеке имеет отличительные детали,
помогающие компьютеру различать буквы,
а торговые коды читаются по положению
линий, их ширине и пространству между
ними. Коды преобразуются сканером в
электрические импульсы, из которых со-
ставляется сигнальный паттерн; последний
передается в компьютер, идентифицирую-
щий этот паттерн путем сравнения его с
аналогом (эталоном), находящимся в его
памяти.
Но даже если бы это было возможно, то для доступа к памяти, где хранят-
ся многие миллионы эталонов, потребовалась бы процедура поиска, зани-
мающая крайне много времени, что никак не соответствует нашей способ-
ности быстро опознавать множество различных паттернов. Наконец, эта
модель маловероятна потому, что мы можем опознавать незнакомые фор-
мы и фигуры (например, новые варианты начертания буквы "А").
Еще один подход к проблеме извлечения информации из сложных стиму- Подеталь-
лов - это подетальный анализ. В соответствии с ним, восприятие - это ный она-
"высокоуровневая" обработка информации, которой предшествует этап лиз
идентификации входных стимулов по их более простым деталям. Так,
прежде чем произойдет оценка информации зрительного паттерна "в полном
объеме", осуществляется минимальный анализ его составных частей. На
элементарном визуальном уровне слово - например, слово ARROW
(стрела) - не переводится непосредственно в свою понятийную или
мысленную репрезентацию в нашей памяти (например, "заостренное древко
для стрельбы из лука" или знак "- "). Оно не читается как "arrow", и
его отдельные буквы не воспринимаются как A-R-R-0-W, а вместо этого
обнаруживаются и анализируются детали или компоненты каждой буквы..
Так, буква "А" может быть разложена на две наклонные линии (/ \) и
Распознавание паттернов
87
Рис. 3.5. Уста-
новка для наблю-
дения за нервной
активностью, вы-
зываемой просты-
ми зрительными
стимулами.
одну горизонталь (--), острый угол (Л.), перевернутую емкость (/--\)
и т.д. Если процесс опознания основан на анализе деталей и это найдет
свое подтверждение, то выходит, что ранние этапы обработки информации
более сложны, чем мы предполагали вначале.4
В двух исследовательских направлениях - неврологическом и бихеви-
ористском - были получены данные в пользу гипотезы о подетальном
анализе. Мы сосредоточимся на втором из них, но сначала обратимся к
экспериментам Хьюбеля и Визеля (Hubel and Wiesel, 1959, 1963; Wiesel,
1963), из которых прямо видно, какой тип информации кодируется в зри-
тельной коре мозга. Эти ученые вживляли микроэлектроды в зрительную
кору кошки и обезьяны, находившихся в состоянии легкого наркоза, а
потом изучали нервную активность, возникавшую в результате проекции
простых световых паттернов на экран непосредственно перед глазами жи-
вотного (Рис.3.5).
Регистрируя возбуждение отдельных нервных клеток и усиливая воз-
никающие в них электрические импульсы, они обнаружили, что некото-
рые клетки реагируют только на горизонтальные фигуры, а некоторые -
Чтобы оценить сложность сенсорного, перцептивного и моторного аппара-
тов, обслуживающих "простое" восприятие и ответные реакции, представьте
себе, сколько всего требуется, чтобы отбить ракеткой на лету теннисный мяч.
За долю секунды мы способны оценить его форму, размер, скорость, цвет,
траекторию, вращение и предсказать его положение. Наш мозг должен пере-
вести всю эту информацию (записанную только в двумерном виде на сетчат-
ке) в моторную реакцию, которая в случае успеха позволит нам отразить мяч.
Помимо того, что все это происходит практически мгновенно, значительная
часть информации постоянно меняется (например, относительная величина
мяча, его скорость и траектория).
Обнаружение и интерпретация сенсорных сигналов
88
с \
W
\
Рис. 3.6. Реакции
клеток зрительной
коры кошки на сти-
муляцию глаза
светлой полосой.
Фрагменты А-Е по-
казывают ориента-
цию светлой поло-
сы (вытянутый пря-
моугольник сплош-
ными линиями/ от-
носительно оси
рецептивного поля
(штриховые пимии].
На фрагменте Е
полоса была ори-
ентирована так
же, как на А и В,
но быстро двига-
лась из стороны в
сторону. Взято из:
Hubel and Wiesel
(1963J.
только на вертикальные. В других экспериментах они обнаружили, что
некоторые клетки чувствительны к краям зрительного стимула, некото-
рые - к линиям, а некоторые - к правым углам. На Рис.3.6 показано,
как усиленная мозговая активность клеток коры у очень молодого (и соот-
ветственно зрительно неопытного) котенка связана с конкретной ориента-
цией освещенной полосы (А-Е), предъявлявшейся на экране в поле зрения
животного. Горизонтальными отрезками над каждой записью активности
обозначены периоды, когда стимул был виден. Хьюбель пришел к выводу,
что формирование этих кортикальных кодов воспринимаемых фигур явля-
ется врожденным и специфичным для каждой клетки:
"Теперь становится понятным значение огромного числа клеток
в зрительной коре. Видимо, каждая клетка имеет свое особое
назначение: она отвечает за одну ограниченную зону сетчатки,
реагируя лучше всего на одну конкретную форму стимула и на
одну конкретную ориентацию. Если посмотреть на эту проблему
с противоположной стороны, то для каждого стимула - каждой
зоны сетчатки, на которую воздействует стимул, каждого типа
линии (край, полоса или отрезок) и каждой ориентации стиму-
ла - существует определенный набор простых кортикальных
клеток, которые на них реагируют: всякое изменение
расположения стимула вызывает ответную реакцию новой группы
клеток. Количество клеточных групп, последовательно
реагирующих по мере того как глаз следит за медленно
вращающимся пропеллером, трудно вообразить" (Hubel, 1963).
Распознавание паттернов
89
Следовательно, сложный и громоздкий механизм разложения паттерна на
простые детали - не только возможность, имеющая отношение к невро-
логии, но действительно неврологическая необходимость, т.е. подеталь-
ный анализ может оказаться таким этапом, через который информация
должна пройти, прежде чем анализ паттерна сможет начаться на высшем
уровне.
Движения глаз и восприятие паттерна. Непосредственное от-
ношение к подетальному анализу имеют наблюдения за движениями глаз
и зрительными фиксациями. Можно предположить, что если вы относи-
тельно долго смотрите на некоторую деталь паттерна, то вы извлекаете из
нее больше информации, чем при мимолетном взгляде. Этим подходом
заинтересовались Макворт и Ярбус (Mackworth, 1965; Yarbus, 1967). Ре-
зультаты экспериментов с фиксацией, проведенных русским психологом5
Ярбусом, показаны на Рис.3.7. Ярбус предположил, что чем больше ин-
формации содержит некоторая деталь (например, глаза, уши или рот ре-
бенка на указанной иллюстрации), тем дольше на ней фиксируется взгляд.
Он также заключил, что распределение точек фиксации зависит от целей
наблюдателя. В одной серии экспериментов испытуемых просили при раз-
глядывании сложного изображения сделать некоторые оценки (оценить,
например, каковы материальные условия членов семьи, сколько им лет).
При этом взгляд останавливается на тех деталях, которые наиболее важ-
ны для целей испытуемого. Таким образом, восприятие деталей сложного
паттерна зависит не только от физических свойств стимула, но и от рабо-
ты высокоуровневых когнитивных процессов, таких как внимание и моти-
вация.
Прототипное
сравнение
Альтернативой сравнению с эталоном и подетальному анализу как сред-
ствам распознавания паттернов является теория формирования прото-
типов. Вполне вероятно, что в ДВП хранятся не конкретные эталоны и
тем более не детальные признаки многочисленных паттернов, которые нам
приходится опознавать, а своеобразная абстракция паттернов, которая и
служит в качестве прототипа. Паттерн сопоставляется с прототипом и
при наличии сходства происходит его опознание. Применительно к чело-
веку, гипотеза прототипного сравнения более отвечает принципу невроло-
гической экономичности и процессам поиска в памяти, чем гипотеза о
сравнении с эталоном; она позволяет также опознавать "необычные" пат-
терны, которые, тем не менее, как-либо связаны с прототипом. В такой
системе можно, например, сформировать прототип идеализированной бук-
вы "А", относительно которого все остальные "А" будут оцениваться по
принципу сходства. Если расхождение велико (например, если это не "А",
а другая буква), то мы отмечаем отсутствие "совпадения" и отвергаем
предъявленную букву как не "А"; затем можно искать прототип, который
лучше подходит для этой буквы. Свидетельства в пользу прототипного
сравнения - повсюду вокруг нас, и интуитивно эта гипотеза выглядит
весьма достоверной. Мы узнаем машину марки Фольксваген, даже если у
нее другие цвет и форма или она облеплена всякими безделушками, кото-
очнее, биофизиком.- Прим. ред.
Обнаружение и интерпретация сенсорных сигналов
90
Рис. 3.7. Записи
движений глаз у
испытуемого при
разглядываний
картины (слева
вверху]. Траекто-
рия 1 получена,
когда испытуемый
рассматривал
картину произ-
вольно. Последу-
ющие траектории
получены после
того, как испытуе-
мого просили оце-
нить экономичес-
кую состоятель-
ность изображен-
ных людей траек-
тория 2), их воз-
раст (3J; предпо-
ложить, что они
делали, перед тем
как пришел "посе-
титель (Д), запом-
нить их одежду (5J;
запомнить поло-
жение людей и
объектов в комна-
те (6); и оценить,
как долго "посети-
тель" не видел эту
"семью" f7j. Взято
из: Yarbus I1967J.
Распознавание паттернов
91
рые никак не сходятся с идеализированной моделью в нашей голове. В
этом смысле прототип - это не только абстракция из набора стимулов,
но и "краткий конспект", наилучшая репрезентация данного паттерна6.
Хотя приведенные аргументы говорят в пользу сравнения с прототи-
пом, можно задать вопрос: Необходимо ли точное соответствие между
ЇВ цивилизации, где физическое очарование вознаграждается, прототипами
женственности и мужественности могут стать победительница пышного пред-
ставления "Мисс Америка" и исполнитель главной мужской роли в кассовом
фильме, и тогда оценка нами человека может оказаться связанной с тем,
насколько он соответствует этому идеальному прототипу.
Обнаружение и интерпретация сенсорных сигналов
92
образом и прототипам? Может быть эталоны - это некоторое приближе-
ние к образу, нужное, чтобы открыть ячейку памяти? Однако, если бы это
было так, то разве могли бы мы делать тонкие дифференцировки, необхо-
димые для обычного зрительного восприятия? Возьмем, например, сход-
ство деталей в буквах О и Q или В, Р и R. Хотя эти зрительные паттерны
похожи друг на друга, мы редко их путаем. Значит, эталоны не могут быть
"приблизительными" или "размытыми"- иначе мы слишком часто оши-
бались бы при распознавании образов, что очевидно не так.
Таким образом, сравнение с эталоном как принцип распознавания об-
разов полезно для компьютерных программ (чтение кодов на чеках и т.п.),
но в своей жестой форме оно не может адекватно объяснить разнообра-
зие, точность и экономичность распознавания образов человеком. Подво-
дя итог, скажем, что распознавание образов предполагает проведение опе-
раций с памятью. В простейшем случае можно полагать, что при распоз-
навании образа происходит сопоставление сенсорной информации с неко-
торым следом, хранящимся в памяти.
Абстрагирование зрительной информации. Как мы
предположили, на одном уровне зрительного опознания может происходить
сравнение с эталоном, но на другом уровне могут использоваться прототипы.
Предполагается, что прототип - это абстракция набора стимулов,
воплощающая множество сходных форм одного и того же паттерна.
Прототип позволяет нам распознавать образ, даже если он не идентичен
прототипу, а только похож на него. Так, мы распознаем различные
написания буквы "А" не потому, что они точно подходят к некоторой
ячейке памяти, а потому, что члены класса "А" обладают некоторыми
общими чертами.
Экспериментальные исследования, направленные на подтверждение те-
ории прототипов как средства распознавания образов, часто обращались к
вопросу о том, как формируются прототипы и как обеспечивается быстрая
классификация новых паттернов. Этот вопрос не нов; он беспокоил епис-
копа Беркли (Berkeley) еще много лет назад:
"Перед его мысленным, взором все изображения треугольников
обладали весьма конкретными свойствами. Они были или
равносторонними, или равнобедренными, или прямоугольными.
треугольниками, и он напрасно искал мысленный образ
"универсального треугольника". Хотя то, что мы имеем в виду
под треугольником, легко определяется вербально, совсем не ясно,
как выглядит "совершенный" треугольник. Мы видим множество
самых разнообразных треугольников: что же из всего этого
множества мы создаем в своих мыслях как основу для опознания
треугольника?" (Цит по: Calfee, 1975, р.222).
Воображаемая Одиссея Беркли о "совершенном" треугольнике
растянулась на несколько столетий и, наконец, стала предметом
эмпирического исследования в эксперименте, который сам стал для многих
прототипом (Posner, Goldsmith, and Welton, 1967). Эти ученые нашли
прототип треугольника (и других фигур), а затем измеряли время реакции
испытуемых на другие фигуры, в чем-то подобные прототипу. В первой
части эксперимента они разработали серию прототипов (Рис.3.8) путем
Распознавание паттернов
93
Рис. 3.8. Четыре паттерна-прототипа и четыре искаженных паттерна треугольника, использо-
ванные в эксперименте Познеро и др. Адаптировано из: Posner, Goldsmith, and Welton (1967J.
расстановки 9 точек в матрице 30х30 (стандартный лист в клеточку, 20
квадратов на дюйм) так, чтобы получились треугольник, буква или
случайная фигура. Путем сдвига этих точек с их исходных позиций были
получены по четыре искаженных фигуры для каждого оригинала. (На
Рис.3.8 показаны также искаженные треугольные паттерны.) Испытуемым
показывали по одному каждый из четырех искаженных паттернов и просили
классифицировать их по прототипам. После того как испытуемые
классифицировали каждый паттерн (они делали это нажатием
соответствующей кнопки), им сообщали, какой из их выборов был верен;
прототип не предъявлялся.
Из этого первого эксперимента стало очевидно, что испытуемые на-
учались относить искаженные паттерны конкретного прототипа к некото-
рой общей категории, тогда как другие паттерны, полученные из другого
прототипа, были отнесены к другой общей категории. За первоначальной
задачей шла задача на перенос, в которой испытуемых просили рассорти-
ровать ряд паттернов по трем предыдущим категориям. Новые наборы
паттернов состояли из: (Остарых искаженных паттернов, (2)новых иска-
женных паттернов (основанных на тех же исходных прототипах) и (3)са-
мих прототипов. Старые искаженные паттерны были классифицированы
правильно и легко - с точностью около 87%, но что более важно, прото-
типы (которых испытуемые никогда не видели и не классифицировали)
были "правильно" классифицированы примерно с тем же успехом. Новые
искаженные паттерны были классифицированы менее удачно, чем другие
два типа. Поскольку прототипы были столь же точно классифицированы,
как и старые искаженные паттерны, это означало, что испытуемые дей-
ствительно что-то узнали о прототипах,- хотя они видели только их
искаженные изображения.
Отличительной чертой этого эксперимента было то, что прототип или
схема классифицировались правильно примерно с той же частотой, что и
первоначально выученные искаженные паттерны и более часто, чем новые
(контрольные) искаженные паттерны.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81
нов, наш мозг был бы таким громоздким, что пришлось бы возить его на
тачке. Так что этот трюк не пройдет по неврологическим соображениям.
Обнаружение и интерпретация сенсорных сигналов
в компьютерах
Сравнение с эталоном является основой
многих кодирующих систем, ставших час-
тью нашей повседневной жизни. Например,
; почти все банки в США имеют системы
цену, печатаемую затем на контрольной
ленте кассового аппарата.)
А
1пет|сдг|
STATE
BANK
Mattew A. SWANN
18 Chclsca Place
New York, N.Y. 100П
HO. 159
PAY TO ME ORDER OF _
OTV-- Ю№ 75 47 Д>
Цдля идентификации счетов по специальным
Вб цифрам, отпечатанным на оборотной сто-
,роне чека, а во многих магазинах исполь-
зуютсн аналогичные коды (напечатанные
,У; на упаковках товара) для ускорения про-
|цесса выписки счетов и проведения пере-
йучета товаров. (По этому коду компьютер
% определяет единицу товара и указывает ее
Обе эти разновидности кодов читаются
посредством сравнения с эталоном. Рису-
нок на чеке имеет отличительные детали,
помогающие компьютеру различать буквы,
а торговые коды читаются по положению
линий, их ширине и пространству между
ними. Коды преобразуются сканером в
электрические импульсы, из которых со-
ставляется сигнальный паттерн; последний
передается в компьютер, идентифицирую-
щий этот паттерн путем сравнения его с
аналогом (эталоном), находящимся в его
памяти.
Но даже если бы это было возможно, то для доступа к памяти, где хранят-
ся многие миллионы эталонов, потребовалась бы процедура поиска, зани-
мающая крайне много времени, что никак не соответствует нашей способ-
ности быстро опознавать множество различных паттернов. Наконец, эта
модель маловероятна потому, что мы можем опознавать незнакомые фор-
мы и фигуры (например, новые варианты начертания буквы "А").
Еще один подход к проблеме извлечения информации из сложных стиму- Подеталь-
лов - это подетальный анализ. В соответствии с ним, восприятие - это ный она-
"высокоуровневая" обработка информации, которой предшествует этап лиз
идентификации входных стимулов по их более простым деталям. Так,
прежде чем произойдет оценка информации зрительного паттерна "в полном
объеме", осуществляется минимальный анализ его составных частей. На
элементарном визуальном уровне слово - например, слово ARROW
(стрела) - не переводится непосредственно в свою понятийную или
мысленную репрезентацию в нашей памяти (например, "заостренное древко
для стрельбы из лука" или знак "- "). Оно не читается как "arrow", и
его отдельные буквы не воспринимаются как A-R-R-0-W, а вместо этого
обнаруживаются и анализируются детали или компоненты каждой буквы..
Так, буква "А" может быть разложена на две наклонные линии (/ \) и
Распознавание паттернов
87
Рис. 3.5. Уста-
новка для наблю-
дения за нервной
активностью, вы-
зываемой просты-
ми зрительными
стимулами.
одну горизонталь (--), острый угол (Л.), перевернутую емкость (/--\)
и т.д. Если процесс опознания основан на анализе деталей и это найдет
свое подтверждение, то выходит, что ранние этапы обработки информации
более сложны, чем мы предполагали вначале.4
В двух исследовательских направлениях - неврологическом и бихеви-
ористском - были получены данные в пользу гипотезы о подетальном
анализе. Мы сосредоточимся на втором из них, но сначала обратимся к
экспериментам Хьюбеля и Визеля (Hubel and Wiesel, 1959, 1963; Wiesel,
1963), из которых прямо видно, какой тип информации кодируется в зри-
тельной коре мозга. Эти ученые вживляли микроэлектроды в зрительную
кору кошки и обезьяны, находившихся в состоянии легкого наркоза, а
потом изучали нервную активность, возникавшую в результате проекции
простых световых паттернов на экран непосредственно перед глазами жи-
вотного (Рис.3.5).
Регистрируя возбуждение отдельных нервных клеток и усиливая воз-
никающие в них электрические импульсы, они обнаружили, что некото-
рые клетки реагируют только на горизонтальные фигуры, а некоторые -
Чтобы оценить сложность сенсорного, перцептивного и моторного аппара-
тов, обслуживающих "простое" восприятие и ответные реакции, представьте
себе, сколько всего требуется, чтобы отбить ракеткой на лету теннисный мяч.
За долю секунды мы способны оценить его форму, размер, скорость, цвет,
траекторию, вращение и предсказать его положение. Наш мозг должен пере-
вести всю эту информацию (записанную только в двумерном виде на сетчат-
ке) в моторную реакцию, которая в случае успеха позволит нам отразить мяч.
Помимо того, что все это происходит практически мгновенно, значительная
часть информации постоянно меняется (например, относительная величина
мяча, его скорость и траектория).
Обнаружение и интерпретация сенсорных сигналов
88
с \
W
\
Рис. 3.6. Реакции
клеток зрительной
коры кошки на сти-
муляцию глаза
светлой полосой.
Фрагменты А-Е по-
казывают ориента-
цию светлой поло-
сы (вытянутый пря-
моугольник сплош-
ными линиями/ от-
носительно оси
рецептивного поля
(штриховые пимии].
На фрагменте Е
полоса была ори-
ентирована так
же, как на А и В,
но быстро двига-
лась из стороны в
сторону. Взято из:
Hubel and Wiesel
(1963J.
только на вертикальные. В других экспериментах они обнаружили, что
некоторые клетки чувствительны к краям зрительного стимула, некото-
рые - к линиям, а некоторые - к правым углам. На Рис.3.6 показано,
как усиленная мозговая активность клеток коры у очень молодого (и соот-
ветственно зрительно неопытного) котенка связана с конкретной ориента-
цией освещенной полосы (А-Е), предъявлявшейся на экране в поле зрения
животного. Горизонтальными отрезками над каждой записью активности
обозначены периоды, когда стимул был виден. Хьюбель пришел к выводу,
что формирование этих кортикальных кодов воспринимаемых фигур явля-
ется врожденным и специфичным для каждой клетки:
"Теперь становится понятным значение огромного числа клеток
в зрительной коре. Видимо, каждая клетка имеет свое особое
назначение: она отвечает за одну ограниченную зону сетчатки,
реагируя лучше всего на одну конкретную форму стимула и на
одну конкретную ориентацию. Если посмотреть на эту проблему
с противоположной стороны, то для каждого стимула - каждой
зоны сетчатки, на которую воздействует стимул, каждого типа
линии (край, полоса или отрезок) и каждой ориентации стиму-
ла - существует определенный набор простых кортикальных
клеток, которые на них реагируют: всякое изменение
расположения стимула вызывает ответную реакцию новой группы
клеток. Количество клеточных групп, последовательно
реагирующих по мере того как глаз следит за медленно
вращающимся пропеллером, трудно вообразить" (Hubel, 1963).
Распознавание паттернов
89
Следовательно, сложный и громоздкий механизм разложения паттерна на
простые детали - не только возможность, имеющая отношение к невро-
логии, но действительно неврологическая необходимость, т.е. подеталь-
ный анализ может оказаться таким этапом, через который информация
должна пройти, прежде чем анализ паттерна сможет начаться на высшем
уровне.
Движения глаз и восприятие паттерна. Непосредственное от-
ношение к подетальному анализу имеют наблюдения за движениями глаз
и зрительными фиксациями. Можно предположить, что если вы относи-
тельно долго смотрите на некоторую деталь паттерна, то вы извлекаете из
нее больше информации, чем при мимолетном взгляде. Этим подходом
заинтересовались Макворт и Ярбус (Mackworth, 1965; Yarbus, 1967). Ре-
зультаты экспериментов с фиксацией, проведенных русским психологом5
Ярбусом, показаны на Рис.3.7. Ярбус предположил, что чем больше ин-
формации содержит некоторая деталь (например, глаза, уши или рот ре-
бенка на указанной иллюстрации), тем дольше на ней фиксируется взгляд.
Он также заключил, что распределение точек фиксации зависит от целей
наблюдателя. В одной серии экспериментов испытуемых просили при раз-
глядывании сложного изображения сделать некоторые оценки (оценить,
например, каковы материальные условия членов семьи, сколько им лет).
При этом взгляд останавливается на тех деталях, которые наиболее важ-
ны для целей испытуемого. Таким образом, восприятие деталей сложного
паттерна зависит не только от физических свойств стимула, но и от рабо-
ты высокоуровневых когнитивных процессов, таких как внимание и моти-
вация.
Прототипное
сравнение
Альтернативой сравнению с эталоном и подетальному анализу как сред-
ствам распознавания паттернов является теория формирования прото-
типов. Вполне вероятно, что в ДВП хранятся не конкретные эталоны и
тем более не детальные признаки многочисленных паттернов, которые нам
приходится опознавать, а своеобразная абстракция паттернов, которая и
служит в качестве прототипа. Паттерн сопоставляется с прототипом и
при наличии сходства происходит его опознание. Применительно к чело-
веку, гипотеза прототипного сравнения более отвечает принципу невроло-
гической экономичности и процессам поиска в памяти, чем гипотеза о
сравнении с эталоном; она позволяет также опознавать "необычные" пат-
терны, которые, тем не менее, как-либо связаны с прототипом. В такой
системе можно, например, сформировать прототип идеализированной бук-
вы "А", относительно которого все остальные "А" будут оцениваться по
принципу сходства. Если расхождение велико (например, если это не "А",
а другая буква), то мы отмечаем отсутствие "совпадения" и отвергаем
предъявленную букву как не "А"; затем можно искать прототип, который
лучше подходит для этой буквы. Свидетельства в пользу прототипного
сравнения - повсюду вокруг нас, и интуитивно эта гипотеза выглядит
весьма достоверной. Мы узнаем машину марки Фольксваген, даже если у
нее другие цвет и форма или она облеплена всякими безделушками, кото-
очнее, биофизиком.- Прим. ред.
Обнаружение и интерпретация сенсорных сигналов
90
Рис. 3.7. Записи
движений глаз у
испытуемого при
разглядываний
картины (слева
вверху]. Траекто-
рия 1 получена,
когда испытуемый
рассматривал
картину произ-
вольно. Последу-
ющие траектории
получены после
того, как испытуе-
мого просили оце-
нить экономичес-
кую состоятель-
ность изображен-
ных людей траек-
тория 2), их воз-
раст (3J; предпо-
ложить, что они
делали, перед тем
как пришел "посе-
титель (Д), запом-
нить их одежду (5J;
запомнить поло-
жение людей и
объектов в комна-
те (6); и оценить,
как долго "посети-
тель" не видел эту
"семью" f7j. Взято
из: Yarbus I1967J.
Распознавание паттернов
91
рые никак не сходятся с идеализированной моделью в нашей голове. В
этом смысле прототип - это не только абстракция из набора стимулов,
но и "краткий конспект", наилучшая репрезентация данного паттерна6.
Хотя приведенные аргументы говорят в пользу сравнения с прототи-
пом, можно задать вопрос: Необходимо ли точное соответствие между
ЇВ цивилизации, где физическое очарование вознаграждается, прототипами
женственности и мужественности могут стать победительница пышного пред-
ставления "Мисс Америка" и исполнитель главной мужской роли в кассовом
фильме, и тогда оценка нами человека может оказаться связанной с тем,
насколько он соответствует этому идеальному прототипу.
Обнаружение и интерпретация сенсорных сигналов
92
образом и прототипам? Может быть эталоны - это некоторое приближе-
ние к образу, нужное, чтобы открыть ячейку памяти? Однако, если бы это
было так, то разве могли бы мы делать тонкие дифференцировки, необхо-
димые для обычного зрительного восприятия? Возьмем, например, сход-
ство деталей в буквах О и Q или В, Р и R. Хотя эти зрительные паттерны
похожи друг на друга, мы редко их путаем. Значит, эталоны не могут быть
"приблизительными" или "размытыми"- иначе мы слишком часто оши-
бались бы при распознавании образов, что очевидно не так.
Таким образом, сравнение с эталоном как принцип распознавания об-
разов полезно для компьютерных программ (чтение кодов на чеках и т.п.),
но в своей жестой форме оно не может адекватно объяснить разнообра-
зие, точность и экономичность распознавания образов человеком. Подво-
дя итог, скажем, что распознавание образов предполагает проведение опе-
раций с памятью. В простейшем случае можно полагать, что при распоз-
навании образа происходит сопоставление сенсорной информации с неко-
торым следом, хранящимся в памяти.
Абстрагирование зрительной информации. Как мы
предположили, на одном уровне зрительного опознания может происходить
сравнение с эталоном, но на другом уровне могут использоваться прототипы.
Предполагается, что прототип - это абстракция набора стимулов,
воплощающая множество сходных форм одного и того же паттерна.
Прототип позволяет нам распознавать образ, даже если он не идентичен
прототипу, а только похож на него. Так, мы распознаем различные
написания буквы "А" не потому, что они точно подходят к некоторой
ячейке памяти, а потому, что члены класса "А" обладают некоторыми
общими чертами.
Экспериментальные исследования, направленные на подтверждение те-
ории прототипов как средства распознавания образов, часто обращались к
вопросу о том, как формируются прототипы и как обеспечивается быстрая
классификация новых паттернов. Этот вопрос не нов; он беспокоил епис-
копа Беркли (Berkeley) еще много лет назад:
"Перед его мысленным, взором все изображения треугольников
обладали весьма конкретными свойствами. Они были или
равносторонними, или равнобедренными, или прямоугольными.
треугольниками, и он напрасно искал мысленный образ
"универсального треугольника". Хотя то, что мы имеем в виду
под треугольником, легко определяется вербально, совсем не ясно,
как выглядит "совершенный" треугольник. Мы видим множество
самых разнообразных треугольников: что же из всего этого
множества мы создаем в своих мыслях как основу для опознания
треугольника?" (Цит по: Calfee, 1975, р.222).
Воображаемая Одиссея Беркли о "совершенном" треугольнике
растянулась на несколько столетий и, наконец, стала предметом
эмпирического исследования в эксперименте, который сам стал для многих
прототипом (Posner, Goldsmith, and Welton, 1967). Эти ученые нашли
прототип треугольника (и других фигур), а затем измеряли время реакции
испытуемых на другие фигуры, в чем-то подобные прототипу. В первой
части эксперимента они разработали серию прототипов (Рис.3.8) путем
Распознавание паттернов
93
Рис. 3.8. Четыре паттерна-прототипа и четыре искаженных паттерна треугольника, использо-
ванные в эксперименте Познеро и др. Адаптировано из: Posner, Goldsmith, and Welton (1967J.
расстановки 9 точек в матрице 30х30 (стандартный лист в клеточку, 20
квадратов на дюйм) так, чтобы получились треугольник, буква или
случайная фигура. Путем сдвига этих точек с их исходных позиций были
получены по четыре искаженных фигуры для каждого оригинала. (На
Рис.3.8 показаны также искаженные треугольные паттерны.) Испытуемым
показывали по одному каждый из четырех искаженных паттернов и просили
классифицировать их по прототипам. После того как испытуемые
классифицировали каждый паттерн (они делали это нажатием
соответствующей кнопки), им сообщали, какой из их выборов был верен;
прототип не предъявлялся.
Из этого первого эксперимента стало очевидно, что испытуемые на-
учались относить искаженные паттерны конкретного прототипа к некото-
рой общей категории, тогда как другие паттерны, полученные из другого
прототипа, были отнесены к другой общей категории. За первоначальной
задачей шла задача на перенос, в которой испытуемых просили рассорти-
ровать ряд паттернов по трем предыдущим категориям. Новые наборы
паттернов состояли из: (Остарых искаженных паттернов, (2)новых иска-
женных паттернов (основанных на тех же исходных прототипах) и (3)са-
мих прототипов. Старые искаженные паттерны были классифицированы
правильно и легко - с точностью около 87%, но что более важно, прото-
типы (которых испытуемые никогда не видели и не классифицировали)
были "правильно" классифицированы примерно с тем же успехом. Новые
искаженные паттерны были классифицированы менее удачно, чем другие
два типа. Поскольку прототипы были столь же точно классифицированы,
как и старые искаженные паттерны, это означало, что испытуемые дей-
ствительно что-то узнали о прототипах,- хотя они видели только их
искаженные изображения.
Отличительной чертой этого эксперимента было то, что прототип или
схема классифицировались правильно примерно с той же частотой, что и
первоначально выученные искаженные паттерны и более часто, чем новые
(контрольные) искаженные паттерны.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81