А-П

П-Я

А  Б  В  Г  Д  Е  Ж  З  И  Й  К  Л  М  Н  О  П  Р  С  Т  У  Ф  Х  Ц  Ч  Ш  Щ  Э  Ю  Я  A-Z

 


Несмотря на все старания установить отличительные
признаки звуков речи или печатных букв, полного успеха
достигнуть не удалось, хотя некоторые результаты можно
считать удовлетворительными. Тем не менее идея о возмож-
ности описывать образы при помощи набора элементарных
признаков кажется весьма привлекательной. Выработана
довольно подробная спецификация фонем английского языка,
основанная на их отличительных признаках (Jakobson а. о.,
1961); возможно также установить элементарные признаки
Распознавание образов
различных печатных букв для шрифтов определенного типа
(Rumelhart, 1971). Например, буквы алфавита можно опи-
сать при помощи одних только вертикальных и горизонталь-
ных линий, если принять такие начертания, как Р Q Ц
/ Итак, мы рассмотрели сначала наивную эталонную гипо-
. тезу и установили ее полную непригодность. Однако мы на-
шли, что если добавить к ней процесс предварительной обра-
ботки (небольшое видоизменение входного стимула, прида-
ющее ему стандартные размеры и положение) и концепцию
прототипа, то можно создать модель гораздо лучшую, чем
эталонная система. Другая альтернатива эталонной гипоте-
Ы?_?а??М:0.фению.Д.о.ТОроймн.сейчас. переходим,-.это ги-
потеза признаков. Согласно этой гипотезе, подлежащий рас-
познаванию стимул сначала анализируется по отдельным
признакам. В результате составляется перечень признаков,
при объединении которых получился бы данный стимул. За-
тем этот перечень сравнивается с перечнями, хранящимися
в ДП. Таким образом, код ДП для данного стимула пред-
ставляет ..собой перечень признаков, а не эталон или прото-
"тип Выбирается-наиболее подходящий перечень, что и при-
., ..водит к распознанию образа.
Одной из теоретических моделей, основанных на анализе
признаков, является система <Дандемо1шу.м> (Selfridge,
1959). Эта система представлена на рис. 4.3. Как и в нашей
общей модели (рис. 4.1), здесь предполагается, что процесс
распознавания образов состоит из нескольких этапов или
уровней.
На каждом уровне имеется отряд <демонов>, которые вы-
полняют ту или иную работу, связанную с распознаванием
предъявленного образа. На первом уровне действуют демо-
ны изображения, которые заняты тем, что мы назвали сен-
сорной регистрацией, т. е. регистрируют стимул как некое
событие на сенсорном уровне. Затем это событие анализиру-
ется демонами выделения признаков, которые разбивают
первичное изображение на"сос"гавЛя1ощие элементы. Каждый
такой демон ищет в изображении лишь один признак-оп-
ределенную прямую, расположенную под определенным уг-
лом, или кривую-и регистрирует его, если находит. За
демонами выделения признаков следят демоны опознавания,
соответствующие перечням признаков. Перечень, имеющий-
ся у каждого из таких демонов, относится к одному опреде-
ленному образу, и работа этого демона состоит в том, чтобы
<кричать>, или сигнализировать, тем громче, чем больше
<своих> признаков он найдет среди тех, которые были вы-
делены в результате анализа признаков. Наконец, на самом
верхнем уровне восседает демон принятия решения (процесс
принятия решения); он должен устано.вить, какой яз демонов
опознавания кричит громче всех, и .в результате раопоз.нать
образ.
Не удивителько, если все эти рассуждения покажутся зна-
комыми, так как гипотеза признаков очень сходна с гипоте-
Рис. 4.3. Система <Пандемониум>, предложенная Селфриджем в качестве
модели распознавания признаков. Поступающий от органов чувств стимул
регистрируется демонами изображения. Демоны выделения признаков ана-
лизируют его, чтобы выяснить, какие у него имеются признаки. Демоны
опознавания сопоставляют выделенные признаки со своими образами Де-
мон Принятия решения окончательно устанавливает, какому образу соот-
ветствует стимул.
зой эталонов. Ведь в сущности всякий признак является не-
ким эталоном; только в данном случае эталон соответствует
не стимулу в целом, а лишь некоторой его части. Преимуще-
ство гипотезы признаков состоит в том, что если можно вы-
делить набор признаков, позволяющих описывать гораздо
более широкий круг образов (например, описать речь при
помощи нескольких элементарных признаков), то число эта-
лонов, с которыми нужно иметь дело, резко сокращается.
Однако сходство гипотезы признаков с гипотезой эталонов
Распознавание образов
влечет за собой множество проблем, общих для них обеих.
Как, например, система, основанная на анализе призна-
ков, будет справляться с вариациями в величине того или
иного зрительного элемента? Как она будет распознавать
новые признаки, никогда прежде не виденные? Что произой-
дет, если два стимула будут различаться только присутстви-
ем или отсутствием какого-либо элемента? Примером может
служить нижняя горизонтальная линия, которая есть у буквы
Е, но отсутствует у F. В этом случае в ДП могут найтись
два перечня признаков, подходящих для опознания стимула
F, так как все элементы буквы F соответствуют признакам,
содержащимся в перечнях как для Е, так и для F. В случае
распознавания элементов речи возникают еще большие слож-
ности. Прежде всего далеко не всегда ясно, где именно на-
чинается или кончается данная речевая единица, что сильно
затрудняет разбиение образа на отдельные признаки. По-
слушайте речь на незнакомом языке: вам будет казаться,
что человек говорит невероятно быстро, и почти невозможно
будет решить, где кончается одно слово и начинается дру-
гое. Если мы внимательно прислушаемся к людям, говоря-
щим по-английски, то мы обнаружим, что они нередко дела-
ют более длительные паузы в середине слова, чем между
двумя словами.
Пока у нас нет возможности окончательно разрешить все
эти проблемы, связанные с распознаванием образов. Это не
значит, однако, что гипотезу, основанную на анализе приз-
наков, следует отбросить. В конце концов все другие гипо-
тезы также имеют свои недостатки. Кроме того, есть ряд
экспериментальных результатов, говорящих о том, что при
распознавании действительно используется метод сопостав-
ления признаков.
Некоторые данные о роли анализа признаков в распозна-
вании образов носят физиологический характер. Показано,
например, что в зрительной системе имеются специализиро-
ванные клетки, функции которых состоят в распознавании
определенных признаков. За последние 10-15 лет физиологи
(Hubel a. Wiesel, 1962; Lettvin а. о., 1959) обнаружили в
зрительной системе кошек, лягушек и других животных нерв-
ные клетки, реагирующие только на зрительные стимулы оп-
ределенного типа. Это могут быть, например, горизонтальные,
вертикальные или движущиеся линии. Установлено, что в
мозгу ля.гушки некоторые клетки реагируют на появление в
зрительном поле движущихся черных точек; было высказано
предположение, что эти клетки представляют собой <детек-
торы мух>: их реакция помогает лягушке добывать пищу! Су-
ществует явная аналогия между стимулами, приводящими в
Глава 4
действие специализированные нейроны, и тем, что мы назы-
ваем здесь признаками. Можно допустить, что у человека
тоже есть клетки, которые разряжаются при появлении тех
или иных элементов сенсорного материала и выполняют в
зрительной системе роль анализаторов признаков. По-видимо-
му, некоторые клетки реагируют независимо от таких специ-
фических характеристик стимула, как длина. Они могли бы
служить детекторами более абстрактных признаков (напри-
мер, выявлять наличие линии любой длины, расположенной
под определенным углом); возможно, это помогло бы понять,
почему нам удается распознавать образы независимо от их
величины и т. п.
Есть и другие данные, свидетельствующие о важной роли
признаков в распознавании зрительных образов. Маленькие
дети, например, часто путают буквы b и d. Возможно, что
это результат их неспособности различать два элемента (на-
пример, с и э ), сходных во всем, кроме своей ориента-
ции. У взрослых аналогичный эффект можно получить, предъ-
являя им зрительные стимулы с такой быстротой, при кото-
рой восприятие может оказаться неполным. В подобных
экспериментах испытуемые делают ошибки такого же рода,
как и в экспериментах с определением объема памяти. Ког-
да, например, какая-нибудь буква предъявляется на очень
короткое время, после чего испытуемого просят назвать ее,
он часто называет вместо предъявленной буквы какую-ни-
будь другую. В отличие от ошибок, допускаемых при опре-
делении объема памяти, которые, по-видимому, вызываются
сходством по слуховым признакам, ошибки в таких экспери-
ментах обусловлены зрительным сходством (Kinney а. о.,
1966). В них D гораздо чаще называют вместо Q, чем вместо
В. Буквы Q и D имеют общие зрительные признаки, тогда
как D и В сходны на слух, но очень несходны по виду. Ха-
рактер таких ошибок позволяет думать, что зрительное вос-
приятие букв основано на анализе признаков.
Из всего сказанного видно, что имеются данные как в
пользу формирования прототипов, так и в пользу анализа
признаков. Мы убедились также в том, что многое в распоз-
навании образов поддается объяснению с помощью обеих
гипотез, но в то же время многие проблемы (причем одни
и те же) ни та ни другая гипотеза разрешить не может.
Какая же из двух гипотез лучше? На данном этапе ответ
на этот вопрос остается неясным. Возможно, что обе гипо-
тезы в каких-то случаях верны, так как ввиду большого раз-
нообразия распознаваемых нами стимулов механизмы их
ра.епознавания могут быть разными. Кроме того, возможно,
что различия между тем, что мы называем прототипами и
Распознавание образов
признаками, не столь велики, как это кажется. Во-первых,
.эти две концепции можно объединить: можно рассматривать
лрототип как состоящий из признаков, общих для всех реа-
.лизаций данного образа; тем самым идея прототипов стано-
вится столь же совместимой с признаками, как она совме-
стима с эталонами. Во-вторых, важно понять, что на неко-
тором уровне гипотеза, основанная на анализе признаков,
очень сходна с гипотезой эталонов. Одна из проблем, возни-
кающих при формулировке гипотезы признаков, касается то-
го, каким образом происходит распознавание отдельных при-
знаков, например линий, образующих данный угол. Возмож-
яо, что здесь придется постулировать процесс сравнения,
сопоставляющий признак с внутренним эталоном. В резуль-
тате получится эталонная теория распознавания признаков!
Эти соображения иллюстрируют ряд трудностей, возникаю-
щих при попытке точно определить тип кодирования в ДП,
используемый при распознавании образов. Хотя нам, может
быть, и не удастся точно определить этот код, в наших рас-
суждениях о нем мы значительно продвинулись вперед по
<сравнению с наивной гипотезой эталонов; при этом мы уяс-
нили себе ряд важных моментов, касающихся процесса рас-
аюзнавания.
, ПРОЦЕССЫ, СВЯЗАННЫЕ С РАСПОЗНАВАНИЕМ
В распознавании образов есть один этап, который мы по-
ка еще подробно не обсуждали,- это процесс сравнения и
принятия решения. Рассмотрим в связи с этим гипотезу эта-
лонов. Каждый образ необходимо сравнивать с многочислен-
ными эталонами, после чего можно выбрать тот эталон, ко-
торый лучше всего соответствует данному стимулу. Понятно,
что ввиду огромного количества хранящихся в памяти этало-
нов подобное сравнение было бы очень громоздкой и трудо-
ёмкой процедурой. Пришлось бы перебирать многие тысячи
эталонов, прежде чем удавалось бы принять решение. Как
все это могло бы осуществляться? Если бы распознающий
механизм должен был сравнивать входной стимул поочеред-
но с каждым эталоном, то для узнавания некоторых стимулов
требовалось бы очень много времени; те же самые сообра-
жения относятся к <прототипам> или <перечням признаков>,
если заменить ими <эталоны>. А между тем мы знаем, что
образы распознаются очень быстро.
ПОСЛЕДОВАТЕЛЬНАЯ ИЛИ ПАРАЛЛЕЛЬНАЯ ПЕРЕРАБОТКА?
Один из ответов на этот вопрос может состоять в том, что
распознающий механизм не сравнивает новые стимулы со
всеми хранящимися в ДП кодами поочередно, или, как гово-
Глава 4
рят, последовательно. Существует другая возможность - па-
раллельное сравнение, при котором одновременно произво-
дится множество отдельных сравнений, идущих бок о бок.
В этом случае подлежащий распознаванию стимул может
одновременно сопоставляться со многими внутренними кода-
ми и весь процесс займет не больше времени, чем одно такое
сопоставление. Это означало бы, что сравнения могут про-
изводиться очень быстро.
По-видимому, параллельная процедура могла бы в прин-
ципе разрешить проблему экономии времени на этапе срав-
нения. Нам известны примеры подобных параллельных про-
цессов из области физики. Один пример (Neisser, 1967) свя-
зан с использованием камертонов. Если взять камертон с
неизвестной собственной частотой и ударить по нему (так
что он начнет звенеть), держа его вблизи группы камертонов,
обладающих известными частотами, то один из них тоже нач-
нет звенеть. Этот второй камертон соответствует по частоте
первому; ни один из остальных камертонов при этом не за-
звенит. Таким способом можно определить частоту исследу-
емого камертона. Это процесс параллельного сравнения, так
как камертон с неизвестной частотой одновременно сопостав-
ляется со всеми камертонами, настроенными на известные
частоты.
Имеются также данные о параллельном осуществлении
психических операций. Один такой пример обнаружен Нейс-
сером (Neisser,. 1964) в экспериментах со зрительным поис-
ком. В этих экспериментах испытуемым предъявляли ряды
букв, разбитые на 50 строк. В каждой строке было по не-
скольку букв, например U, F, С, J. Испытуемый должен был,
просматривая строки в направлении сверху вниз, как можно
быстрее найти определенную букву, заданную эксперимен-
татором. Заданную букву помещали на случайно выбранное
место, и когда испытуемый находил ее, он должен был на-
жать на кнопку. Регистрировалась общая продолжительность
поиска, т. е. время от момента предъявления испытуемому
списка до момента нахождения им заданной буквы. Оказа-
лось, что если хорошо натренированному испытуемому зада-
вали десять букв и просили нажать на кнопку после на-
хождения одной из них, имевшейся в списке, то он делал это
так же быстро, как и в том случае, если ему задавали толь-
ко одну букву (Neisser, Novik a. Lazar, 1963). Этот результат
говорит против процесса последовательного поиска: если бы
испытуемый искал десять заданных букв последовательно,
просматривая весь список в поисках сначала одной буквы,
затем другой и так далее, то это заняло бы (в среднем) го-
раздо больше времени,, чем поиск всего лишь одной буквы.
Распознавание образов
Судя по полученным результатам, испытуемые могут искать
все десять букв одновременно, т. е. вести параллельный по-
иск.
Результаты выполнения заданий на зрительный поиск по-
казали также, что скорость нахождения испытуемыми задан-
ной буквы зависела в некоторой степени от того, насколько
эта буква отличалась по виду от остальных букв, имевшихся
в списке. Например, испытуемые находили букву Z среди
букв О, D, U, G, Q и R гораздо быстрее, чем среди букв 1, V,
М, X, Е и W. В первый список входили буквы с округленным
контуром, гораздо менее сходные с буквой Z, чем буквы из
второго списка, имеющие угловатый контур. На основании
этих результатов Нейссер утверждает, что испытуемые, вме-
сто того чтобы сравнивать с содержащимися в списке буква-
ми эталон заданной буквы, ищут в этом списке ее наиболее
характерные признаки. Угловатые очертания, образующие
букву Z, гораздо легче обнаружить среди округлых букв, чем
среди угловатых, так что время, затрачиваемое на поиск, бу-
дет зависеть от общего вида букв, содержащихся в списке.
В своих теоретических построениях, основанных на этих
результатах, Нейссер использовал модель <Пандемониум>
Селфриджа, о которой говорилось выше. В этой модели пред-
полагается, что процесс распознавания образов происходит в
известном смысле последовательно, поскольку один его этап
следует за другим (сначала вступают в действие демоны вы-
деления признаков, затем демоны опознавания и т. д.). Од-
нако на каждом этапе модели происходят и параллельные
процессы: например, все демоны опознавания следят за де-
монами выделения признаков и <кричат> одновременно.
РОЛЬ КОНТЕКСТА
Параллельные процессы - это лишь один, хотя и доста-
точно эффективный, способ разрешения поставленной нами
проблемы. Проблема эта состоит в том, чтобы выяснить, ка-
ким образом достигается такая скорость процессов сравнения
и принятия решения, которая нужна для быстрого распозна-
вания образов при огромном числе потенциальных возможно-
стей выбора.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43