А-П

П-Я

А  Б  В  Г  Д  Е  Ж  З  И  Й  К  Л  М  Н  О  П  Р  С  Т  У  Ф  Х  Ц  Ч  Ш  Щ  Э  Ю  Я  A-Z

 

для каждого распознаваемого нами стиму-
ла в ДП имеется его внутренний дубликат, который и исполь-
зуется при распознавании. Согласно этой гипотезе, для рас-
познавания образа приходится сравнивать данный стимул с
длинным рядом эталонов, хранящихся в ДП. Распознание
совершится в тот момент, когда будет выбран наиболее под-
ходящий для данного стимула, эталон и тем самым опреде-
лится, что же представляет собой этот стимул.
Однако гипотеза эталонов слишком проста; она чересчур
наивна, чтобы служить основой для теории распознавания
образов. Ее главный недостаток-огромное количество не-
обходимых эталонов. Рассмотрим, например, распознавание
одного не очень сложного стимула - буквы А. Согласно ги-
потезе эталонов, в ДП имеется копия этой буквы, с которой
сравнивается любой стимул, похожий на А, когда бы он ни
появился, и которая соответствует ему лучше, чем любой дру-
гой эталон. Отсюда, однако, следует, что нам понадобится
отдельный эталон для каждой разновидности буквы А. Изме-
нилась величина стимула? Нужен другой эталон. Если слегка
повернуть букву, нужен будет еще один эталон. Для какого-
нибудь своеобразного начертания, например , опять-таки
потребуется свой особый эталон. Если у нас не будет эталонов
для всех этих разновидностей буквы А, то при распознава-
нии неизбежно возникнут ошибки. Например, может оказать-
ся, что наклонное А лучше соответствует эталону для R, чем
для А, и тогда, встретившись с А, мы распознаем его как R.
Чтобы исключить возможность таких ошибок, понадобится
бесчисленное множество эталонов, несомненно гораздо боль-
шее, чем может вместить ДП.
Гипотезу эталонов можно видоизменить, сделав ее го-
раздо более приемлемой. Одна модификация состоит в том,
чтобы добавить к модели процесс, который предшествует со-
поставлению и служит для <очистки> входного стимула. Та-
кая предварительная обработка могла бы придавать стимулу
стандартное положение и стандартные размеры. Этот про-
цесс называют <нормализацией>, так как он устраняет раз-
личные неправильности в форме стимула и приводит его к
более обычному виду. Например, если стимул имел вид Д ,
то в результате нормализации он уменьшился бы, искрив-
ленная правая часть была бы выпрямлена, и все это
произошло бы еще до сравнения стимула с эталоном.
Подобный процесс сильно сократил бы число эталонов, не-
обходимых для распознавания буквы А.
Однако нормализация, предшествующая сравнению, не
позволяет снять все трудности, связанные с эталонной гипо-
тезой. Логически возникает следующее возражение: для того
чтобы знать правильную ориентацию и величину стимула,
нужно заранее знать, какой образ представляет данный сти-
Распознавание образов
мул. Например, какую ориентацию должен иметь стимул,
имеющий вид наклоненного Q? В одном случае он будет
выглядеть как Р, а в другом как Q. Чтобы знать, какой из.
этих двух поворотов будет правильным, необходимо сначала
решить, какая это буква. Но эта задача возлагается именно.
на систему распознавания, а не на предшествующий ей пре-
образователь. С этой логической проблемой, однако, нетруд
но справиться. Во-первых, при резких отклонениях стимула
от стандартной ориентации он, по всей вероятности, окажется:
нераспознаваемым. Иными словами, нет нужды постулиро-
вать, что этот предварительный процесс сможет перерабо-
тать сильно наклоненную букву Q, если в действительности
распознающая система не способна иметь дело с такого
рода стимулами. Во-вторых, подлежащие распознаванию
стимулы обычно включены в какой-то более обширный кон-
текст, и этот контекст может помогать процессу нормализа-
ции, подсказывая, как нужно изменить положение или вели-
чину данного стимула.
В более общем плане контекст сильно помогает процессу
распознавания, сокращая число образов, которым мог бы со-
ответствовать данный стимул. Кроме того, контекст облег-
чает решение таких проблем, как распознавание совершенно.
новых стимулов. Как нам удается распознать такой стимул,
как /\, если мы его никогда раньше не видели? Совершен-
но очевидно, что в ДП не может быть соответствующих эта-
лонов. В каком качестве будет распознан подобный стимул,
зависит от того, когда и где мы с ним встретимся. Если он
появится при обсуждении распознавания букв алфавита, то
он, возможно, будет воспринят как буква А, если же мы.
встретим его в такой карикатуре:

то вряд ли он нам покажется похожим на А
И он совершен
но прав"
ПРОТОТИПЫ
Контекст может помочь нам справиться с некоторыми
трудностями, присущими гипотезе эталонов, но он не позво-
ляет решить проблему полностью. Дело в том, что многие
стимулы, которые мы умеем распознавать, предстают перед
нами вне специального контекста, и тем не менее мы рас-
Глава 4
познаём их, несмотря на различия в размерах и ориентации.
В связи с этим нужно, по-видимому, иметь такую эталонную
систему, которая допускает некоторые вариации или <рас-
плывчатость> входящих в нее образов. Иными словами, рас-
познающее устройство должно хорошо работать и при нали-
чии мелких вариаций, которые могут оставаться после <очи-
стки> стимула. После введения в распознающее устройство
эталонов, допускающих вариации, система становится более
сходной с так называемой системой прототипов, или систе-
мой, основанной на схемах.
""-Схема-это просто набор правил для создания или опи-
сания прототипа, под которым мы здесь имеем в виду некую
.абстрактную фигуру, отображающую основные элементы ка-
кого-то множества стимулов. Например, прототип самолета
можно представлять себе в виде длинной трубы, к которой
прикреплены два крыла; все самолеты окажутся различными
вариантами этого прототипа. Иными словами, прототип-это
некая сущносгь, некая главная или средняя тенденция, да-
Г"Ж6, если хотите, платонова <идея>. Согласно прототипной ги-
J потезе распознавания образов, в ДП хранятся прототипы-
\J обобщенные, идеализированные образцы известного множе-
ства стимулов. Теоретически любой стимул можно закодиро-
вать в виде Трототипа в сочетании с перечнем вариаций,
_ после чего все поступающие стимулы можно сопоставлять с
прототипами, а не с эталонами, (Таким образом, концепция
..эталонов заменяется здесь концепцией прототипов). Предпо-
лагается, что наша долговременная память содержит прото-
типы всех распознаваемых нами категорий-собак, челове-
ческих лиц, букв А и т. д.,- что и позволяет нам узнавать
отдельных представителей этих категорий.
Существуют ли прототипы на самом деле? Судя по неко-
торым экспериментальным данным, на этот вопрос можно
ответить утвердительно: известны случаи формирования про-
тотипов для множеств стимулов. Например, Познер и Кил
(Posner a. Keele, 1968) провели эксперимент, в котором испы-
туемые вели себя так, как если бы у них вырабатывались
прототипы. Прежде всего Познер и Кил построили прототи-
пические образы, состоявшие из 9 точек каждый. В некото-
рых случаях эти точки располагались в виде геометрической
фигуры, например треугольника, в других-в виде буквы,
в третьих-случайным образом. Затем, несколько сдвигая
некоторые точки, экспериментаторы создавали новые фигу-
ры-искаженные формы тех же прототипов (рис. 4.2, А).
Иногда точки сдвигались в одном направлении, иногда - в
другом, так что исходный прототип соответствовал фигуре,
которая бы получилась, если бы мы поместили каждую точ-
Распознавание образов
ку в среднее положение по отношению ко всем отклонениям.
Создав прототипы и по нескольку искажений каждого из них,
Познер и Кил приступили к экспериментам на нескольких
группах испытуемых. Рассмотрим пример, когда прототипы
представляли собой случайные группировки точек; отклоне-
ния от прототипов при этом тоже, конечно, были случайными




..

Исходнаяi Л 5 7.7 9.7
фигура
faR1 foal ГА ri 1Rл1
Прототип Преобразование Преобразование Преобразование Преобразование
] 2 3 1+2+5
<Рис. 4.2. А. Прототип (треугольник, составленный из точек) и его <искаже-
ния> (все более сильные в направлении слева направо), использованные
.Познером и Килом (см. Posner а. о., 1967). Б. Прототип и его преобразо-
вания (Franks a. Bransford, 1971).
наборами. Испытуемым показывали сначала (одно за дру-
1гим) четыре отклонения от каждого из трех случайных про-
тотипов. Им предлагалось классифицировать каждое откло-
нение, т. е. указать, к какой из трех категорий оно принад-
-лежит. Все отклонения, соответствующие одному прототипу,
следовало относить к одной и той же категории, однако ис-
пытуемым не показывали ни один из прототипов. В конце
(концов испытуемые научились правильно классифицировать
"фигуры, т. е. относить все отклонения от одного прототипа
в одну категорию, все отклонения от другого - в другую и
т. д. Затем испытуемым дали новую задачу на классифика-
цию. Им предъявили ряд фигур и попросили отнести каждую
из них к одной из установленных ранее трех категорий. Не-
которые из этих фигур испытуемые уже видели прежде (из-
вестные отклонения), другие представляли собой новые ис-
кажения того же прототипа, а третьи были сами прототипы,
которых испытуемые раньше не видели. Известные отклоне-
ния, кк и следовало ожидать, классифицировались доволь-
но удачно-частота правильных ответов составляла 87%.
Неожиданным оказалось то, что примерно так же хорошо
классифицировались прототипы, хотя испытуемые никогда
их .прежде не видели. Однако новые отклонения, которые ис-
Глава 4
пытуемые увидели впервые, классифицировались менее точ-
но-частота правильных ответов составляла здесь уже толь-
ко 75%. Ввиду высокой точности классификации прототипов.
авторы высказали мнение, что испытуемые, обучаясь клас-
сифицировать первую группу отклонений, на самом деле .ус-
воили и прототипы. Иными словами, испытуемые а.бстраги-
ровали некую среднюю тенденцию - представление о прото-
типе-из ряда стимулов, которые были вариациями этого
прототипа.
В других экспериментах сходного рода были получены
еще более веские доводы в пользу теории прототипов.
Фрэнке и Брэнсфорд (Franks a. Bransford, 1971) создали
прототипы, составляя структурные группы из нескольких гео-
метрических фигур (треугольник, круг, квадрат и т. п.; рис.
4.2, Б). Затем путем одного или нескольких преобразований
прототипа получали отклонения от него. Преобразование
могло состоять, например, в удалении одной фигуры из дан-
ной группы, в замене ее другой фигурой и т. п. Испытуемым
сначала показывали несколько отклоняющихся образов, а
затем проводили тест на распознавание. При этом им предъ-
являли ряд образов-несколько искажений, которые они ви-
дели ранее, несколько таких, которых они прежде не видели,
и прототипы - и просили сказать относительно каждого, уз-
нают они его или нет. В каждой пробе испытуемые должны
были также указать, насколько они уверены в том, видели
они данный образ в первоначальном наборе или нет. Как по-
казывают эти оцеяки кажущейся достоверности, испытуемые
были больше всего <уверены> в том, что они видели раньше
прототипы, хотя в первой части эксперимента прототипов им
не показывали. Более того, на основании степени близости
того или иного варианта к прототипу можно было предска-
зывать степень уверенности испытуемых. Наибольшей она
была при <узнавании> прототипов; за ними шли структурные
группы, подвергшиеся только одному преобразованию, затем
двум и так далее. Варианты, виденные раньше, распознава-
лись ничуть не лучше, чем новые варианты, отличавшиеся
от прототипа тем же числом преобразований.
Судя по результатам этих экспериментов, ознакомление с
группой близких фигур приводит к выработке прототипиче-
ского представления об этой группе. В таких случаях говорят,
что испытуемые абстрагируют из виденных ими фигур некий
образ-прототип. Эксперимент Фрэнкса и Брэнсфорда позво-
ляет также предполагать, что испытуемые могут использо-
вать такие прототипы при идентификации новых образов.
Удача или неудача при распознавании данного образа опре-
делялась степенью искажения или преобразования прототи-
Распознавание образов
.па, а предъявлялась данная фигура раньше или нет, не име-
ло значения.
Иаксогласно протодипно.й, теорий, р.аспознавания обра-
"SB вДTrчeJnтвёкap.a.вд.тcя. ..прототипы обрда9а",длдкаждо-
""города информации, например прототипы букв, лиц или фи-
у~T05тSвлeнныx из точек. .Встречаясь с новым образом,
распознающая система сопоставляет его с этими прототипа-
""мй, проверяя не точное (эталонное), а скорее приблизитель-
ное соответствие допускающее некоторую..изменчивость сти-
мула. Какой прототип будет лучше всего соответствовать
данномустимулу, такой образ и будет распознан в этом сти-
муле. Подобная модель, включающая также механизм пред-
варительной "обработки стимула, представляет значительный
.шаг вперед по сравнению-с наивной эТалбнной гипотезой.
ЭЛЕМЕНТЫ ОБРАЗА -
До сих пор мы рассматривали распознавание образов, не
давая определения слову <образ> (pattern); это, конечно,
серьезное упущение. Согласно одному из определений (Lus-
пе, 1970), образ-это конфигурация из нескольких элемен-
тов сдставляющих некое целое. Подобное определение под-
разумевает, что любОй образ можно разбить на более прос-
тые элементы и что при воссоединении этих элементов вновь
. возникает образ. Например, можно представить буквы алфа-
вита состоящими из таких элементов, как вертикальные ли-
нии, горизонтальные линии, линии с наклоном в 45Ї и кри-
вые. С этой точки зрения букву А можно представить как
/ плюс \ плюс -. Эти элементы в надлежащем сочетании
дают образ буквы А. В общем концепция элементов, или
элементарных признаков, сводится к тому, что из относи-
тельно небольшого множества более простых частей, взятых
в различных сочетаниях, можно создать все образы, входя-
щие в некое более мощное множество (например, множество
печатных букв алфавита).
Другой пример множества образов, которые можно соз-
дать из более простых элементов (<признаков>),- это устная
речь. Речь состоит из основных звуковых единиц, называемых
фонемами и аналогичных буквам, из которых слагаются
слова, предъявляемые зрительно. Фонему можно определить
как такой звук, который, изменяясь как отдельный элемент,
может изменить смысл слова. Например, звуки, соответству-
ющие буквам л, в ил,и б в словах лес, вес, и бес, .представля-
ют собой разные фонемы, потому что каждый из этих звуков
изменяет смысл произносимого слова. Одна фонема мажет
быть представлена множеством акустических вариантов, так
Глава 4
как каждый человек произносит ее немножко иначе, чем дру-
гие, но тем не менее мы узнаем одну и ту же фонему, произ-
носимую разными людьми. Все это означает, что мы можем
считать фонему единицей речи, некой абстракцией, объеди-
няющей множество сходных звуков. В этом смысле ее можно
сравнить с рукописной буквой, которую каждый человек вы-
водит немножко по-своему, но которую тем не менее всегда
удается распознать.
Выявление набора признаков, которые можно использо-
вать в различных сочетаниях для получения фонем (подобно
тому как можно использовать прямые и кривые линии и уг-
лы в качестве основы для получения печатных букв),-очень
трудная проблема, но все же было сделано несколько попы-
ток решить ее. Один из методов основан на том, чтобы
исследовать механизм артикуляции звуков и попытаться опи-
сать каждый звук речи в соответствии с тем, как человек
использует при его произнесении свой речевой аппарат. В ре-
чевой аппарат входят язык, нос, зубы и губы, голосовые
связки и мышцы диафрагмы.
Рассмотрим, например, звуки с и з. Попробуйте произ-
нести каждый из них, и вы сможете заметить, что при произ-
несении з звук кажется исходящим из горла, тогда как в
произнесении с участвует только рот. По этому признаку
звуки делят на глухие и звонкие: с-глухой звук, при его
произнесении голосовые связки неподвижны; з-звонкий
звук, при его произнесении голосовые связки вибрируют. По-
этому говорят, что эти два звука различаются по одному
признаку-звонкости. Конечно, звуки речи обладают и мно-
гими другими признаками. К ним относятся положение язы-
ка в ротовой полости (переднее, среднее или заднее), про-
хождение воздуха через нос или только через рот и многие
другие. Предполагается, что каждой фонеме соответствует
единственное в своем роде сочетание таких признаков - ка-
кая-то специфическая для нее конфигурация речевого аппа-
рата. Исследуя речевую артикуляцию, пытаются выявить
набор элементов, характеризующий каждую отдельную фо-
нему.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43