здесь этот пример приводится для иллюстрации некоторых воз-
можностей существующих систем компьютерного "восприятия".
Мышление и интеллект - естественный и искусственный
504
Один из способов научить компьютеры распознавать геометрические фор- Распознава-
мы путем анализа логических признаков - это использовать принцип, что цие линий
сложные геометрические формы состоят из простых. В этой программе
использован ряд небольших "матриц", которые систематически проходят
через каждый объект в поисках соответствия. Пример "матрицы" и иден-
тифицируемого геометрического объекта показан на Рис. 15.2. Матрица
сделана из двух типов сенсоров - позитивного и негативного; присут-
ствует, отсутствует - это единственный сигнал, подаваемый такой ячей-
кой. или подразделением матрицы. Изображенная матрица содержит толь-
ко шесть ячеек - три "минуса" и три "плюса", и, судя по расположению
этих компонентов (все "отрицательные" элементы расположены слева),
вроде бы, подходит для идентификации левого края объекта. Помещение
матрицы ее средней линией над левым краем куба привело бы к полному
соответствию. На углу соответствие было бы плохим, а на нижнем краю,
где плюс и минус отменяют друг друга, соответствия не будет. Хотя эта
эвристика в наибольшей степени ориентирована на возможности машин,
она не расходится с результатами изучения восприятия у животных и
человека. Ранее в этой главе (и в Главе 3) мы узнали, что психофизиоло-
гам удалось найти детекторы линий в клетках коры у кошек и, хотя эти
данные не полностью подтверждены, похоже, что у человека также име-
ются детекторы края.
Трудность с вышеприведенной системой состоит в том, что для распоз-
навания даже простых паттернов нужно большое количество матриц (на-
пример, детектор левой кромки, детектор правой кромки). Также пробле-
матична "добротность" стимула; большинство геометрических форм (осо-
бенно в реальном мире) могут иметь резкие или расплывчатые края, яр-
кие или тусклые края. Распознавание паттернов путем распознавания линий
можно сильно упростить, если распознаваемую форму сначала преобразо-
вать в образ, состоящий только из линий, и затем использовать матрицы
для определения ориентации этих линий.
Системы распознавания паттернов обычно имеют дело со зрительным ма-
териалом. Как правило, воспринимающие устройства у таких систем име-
ют растр, или матрицу из фотоэлементов, реагирующих на свет. Обычно
эти фотоэлементы имеют только два состояния - включено и выключено
(для "белого" и "черного"). Рассмотрим элементарную задачу идентифи-
кации цифры. На Рис.15.3 показано, как цифры можно преобразовать в
Роспознова-
ние паттер-
нов
Матрица
Плохое
соответствие
Соответствие
отсутствует
Рис.15.2. Обнаружение
левого края посредством
шестиэлементной матри-
цы. Знаки + и - указы-
вают элементы, реагиру-
ющие на условия присут-
ствует и отсутствует" со-
ответственно. Адаптиро-
вано из: Raphael (1976J.
Искусственный интеллект
505
двоичный код - 0, иди выключено для "черного", и /. или включено -
для "белого". Компьютер считывает каждую цифру (т.е. фотоэлементы -
один для каждого квадрата сетки, накладываемой на число, - "ощущает"
световые зоны, т.е. те, что не заняты числом), исходя из того, насколько
данный цифровой код совпадает с матрицей, хранящейся в памяти компь-
ютера. Это работает очень хорошо - если все буквы одной формы, одина-
ково расположены и не уменьшены,- и такие устройства широко приме-
няются в американской промышленности и государственной почтовой служ-
бе. Но когда дело доходит до чтения рукописных писем, присланных для
тети Иолы, у оптических сканирующих устройств начинаются разные труд-
ности. Однако, судя по всему, быстро разрабатываются системы для "чте-
ния" даже и рукописных текстов.
Идентификация букв и слов средствами ИИ представляет не только
практическую проблему, она также имеет значение для тех ученых, кого
интересует процесс анализа информации человеком. Многое из того, что
известно об идентификации человеком букв и слов, обсуждалось в Гла-
ве 10. Эти знания помогают разрабатывать компьютерные программы, ими-
тирующие этот процесс. Плодотворный отчет по этой теме, послуживший
руководством для последующих исследований, представили Селфридж и
Нейсер (Selfridge and Neisser, 1963). Только что описанная общая проце-
дура "восприятия буквы" потребовала бы огромной компьютерной памяти
(для хранения матрицы каждого нового варианта каждой буквы) или не
Рис. 15.3. Двоич-
ное представле-
ние (к опенка в
центре) букв (ко-
лонка слева!. Ну-
ли показывают
выключено или
"черный , едини-
цы -- включено
или "белый. В
прозой колонке
изображено, как
выглядели бы циф-
ры при считыва-
нии их сканером.
Адаптировано из:
Raphael I1976J.
0 О0000000 0
0 0001111и0 0
0 О0111101} (1
0 0011111101) 11
000100100 0
0 00111100 0
0 01100110 0
0 01000010 0
0 00000000 0
0 00000000 0
Во00000000
001/111100
0000/10000
0000/1000 0
0 000/1000 0
0 000/1000 0
0 000/1000 0
0 000/1000 0
0 110(1111)0Р0 0
0 00000000 0
606000000 0
б 00и0000U 0
0 00011000 0
0 001001UU 0
0 01000010 0
001000010 0
0 (101(10100 0
0 00011000 0
000000000 0
0 00000000 U
Мышление и интеллект - естественный и искусственный
506
смогла бы обнаруживать многие встречающиеся в действительности фор-
мы букв (Рис. 15.4).
Нужен был более "хитрый" подход, и Селфридж и Нейсер предложили
анализировать буквы по их "деталям".6 Возьмем, например, букву А. Чем
помещать все типы написаний буквы А в память компьютера и проводить
с ними операции поиска и сравнения, мы можем написать для компьютера
программу, которая будет изучать каждую из составляющих букву дета-
лей, проверять их наличие или отсутствие и принимать решение о том,
какая это может быть буква. Для этого есть два фундаментально различ-
ных способа - модель последовательной переработки и мод- ib парал-
лельной переработки. В модели последовательной переработки каждая
деталь изучается заранее определенным пошаговым способом, и резуль-
тат каждого теста определяет следующий шаг в программе. Пример про-
граммы последовательной обработки показан на Рис. 15.5 слева. Эта про-
стая программа оценивает всего три детали, спрашивая: Есть ли у предъяв-
ленной фигуры кривизна наверху (например, Н, U, Y, V), пересечение
(например, Н, F) и вертикальная линия (В, Y, Т, R, Р, Н)? При постепен-
ном процессе каждый из этих вопросов задается по порядку. Для рассмот-
ренного набора букв (А, Н, V и Y) простое решение "Да" или "Нет"- это
все, что необходимо для идентификации каждой буквы. Например, если
предъявлена для опознания буква А, то, чтобы отделить эту букву от
других букв рассматриваемого набора, надо только ответить отрицательно
на первый вопрос (Есть ли кривизна наверху?). Остальные вопросы слу-
жат для различения между собой остальных букв этого набора.
Обсуждение нидстальной идентификации см. в Главе 10.
А
Рис. 15.4. Типичные случаи неудачного об-
наружения. В случае "А" матрица 1открытая
буква) не находит соответствия, когда неиз-
вестная буква (темная) имеет неправильную
величину, ориентацию или положение; в слу-
чае В неверное сопоставление происхо
дит даже когда образец был приведен к стан-
дартной величине и ориентации. Здесь мат-
рице А больше соответствует буква R, чем
закругленные или с другим наклоном образ-
цы буквы А. Взято из: Selfrodge and Neisse
(1963J.
В
Искусственный интеллект
507
В модели параллельной обработки тестовые детали те же самые, что и
в модели последовательной обработки, но все они применяются не шаг за
шагом, а одновременно (Рис. 15.5 справа). Это "адская" модель в том пла-
не, что для каждой детали есть свой "демон", принимающий решение и
реагирующий на входной стимул согласно своему конкретному виду чув-
ствительности.
Возможно, наибольшая неудача этой ранней модели - это ее слепота
к "критическим деталям" и влияниям контекста. Первый из этих недо-
статков особенно существенней, поскольку различение "критических де-
талей" - это отличительная особенность распознавания паттернов чело-
веком. При отличении G от С или Q от О, например, критическая де-
таль - это почти незаметная небольшая линия. Неважно, насколько пре-
обладает заметность других деталей, для человеческой обработки они не
перевешивают важность критической детали. Второй пункт критики этой
ранней модели в том, что она нечувствительна к влиянию контекста при
идентификации отдельных букв. Наши обширные знания орфографии и
структуры предложения оказывают нам при идентификации букв неоцени-
мую помощь. Чтение рукописного текста - как в указанном случае -
было бы почти невозможно, если бы читающий не привносил в ситуацию
изрядное количество собственной информации. Чтобы заставить машину
действовать при обработке информации подобно человеку, следует при-
нять в расчет этот важный параметр.
А теперь мы рассмотрим несколько примеров того, как идентифициру-
ются паттерны более сложные, чем просто буквы.
Рис. 15.5. Алгорит-
мы последователь-
ной (слева) и парал-
лельной (справа) об-
работки для разли-
чения букв А, Н, V и
У путем использова-
ния трех тестовых
картинок. При по-
следовательной об-
работке каждый
последующий этоп
определяется выход-
ной информацией
предыдущего; при
параллельной обра-
ботке все тесты при-
меняются одновре-
менно, и решение
принимается на ос-
новании объедине-
ния их выходных дан-
ных. Адаптировано
из: Selfridge and N-
eisser (1963).
1
ВводнойКривизна
стимулнаверху?
| Входной
г--1 чма ы
1Кривизна наверху?
1
Входной стимулПересечение ?-
Верти-
кальная
линия 7L-
Мышление и интеллект - естественный и искусственный
508
В качестве примера распознавания других паттернов обратимся к иденти-
фикации треугольника7. На рисунке 15.6 изображены несколько треуголь-
ников, каждый из которых человек может немедленно опознать и класси-
фицировать как таковой. Если прототип "треугольности", хранимый в про-
грамме компьютера, соответствует "правильной" матрице треугольника
(а), тогда треугольники (Ь) и (с), если их правильно повернуть и скоррек-
тировать по величине, можно будет легко распознать; однако, треугольни-
ки (о) и (е) вызывают проблемы, особенно те, что на (е) - их можно
идентифицировать только в результате "хорошего гештальта", но не по
тому. что они состоят из трех прямых линий.
Наша способность немедленно распознавать каждую из этих фигур
как треугольник объясняется обширным опытом восприятия других треу-
гольных объектов; абстрактное представление о треугольности доста-
точно широко, чтобы позволить нам опознать эти треугольники именно
как треугольники, хотя мы их никогда не видели. Может ли компьютер
выучить это понятие? Возможно, но такой механизм поиска необходимо
будет более сложным, чем единичная операция сопоставления, такая, как
в машине, считывающей номер с чека. Вместо этого стоило бы подумать о
программе поиска, распознающей детали треугольника (как в программе
распознавания букв Селфриджа-Нейсера). Тогда такие детали, или атри-
буты, как углы, линии, форма, количество объектов и т.д. хранились бы в
компьютерной памяти, точно так же как в нашей памяти хранится каталог
этих атрибутов треугольника.
Программы последнего типа, более близкие интересам когнитивной
психологии, разрабатывали Гузман и Винстон (Gusman, 1968; Winston,
1970, 1973, 1984). Эти программы отличались от более ранних тем, что
0 том, как человек формирует понятие о треугольности см, в Главе 13.
Рис. 15.6. Хорошие (A-Dj и "про-
блематичные (Ef треугольники. Пер-
вые отличаются только по величине,
ориентации и отношению сторон; у
последних нет обычных прямолиней-
ных сторон, но их все же можно опоз-
нать как треугольники.
они не требовали хранения описаний тех форм, которые компьютеру пред-
стояло распознавать, а основывались на соотношении частей трехмерных
геометрических объектов.
"Квалифици- Если бы мы могли видеть только те объекты, видеть которые были запрог-
рованное" раммированы машины, описанные вплоть до этого момента, наши дела
зрительное были бы плохи. Основная проблема в том, что интеллект компьютеров,
воспоиятие V вежливо выражаясь, ограничен. Люди "видят" мозгом столько же, сколь-
Jurxnuu к0 и глазами: эта мысль является основной темой этой книги. Умение
воспринимать базируется на частом опыте восприятия объектов и собы-
тий. Опытный дизайнер по интерьерам способен разглядеть тончайшие
нюансы цвета, или текстуры, или формы, к которым неспециалист слеп.
Тот же самый принцип, видимо, действует и в отношении других сенсор-
ных модальностей (например, у профессиональных дегустаторов, музы-
кальных критиков, дегустаторов косметики и специалистов по мехам).
Можно ли научить машину выполнять те же самые - или хотя бы сход-
ные - функции?
Одна из очень практических функций, выполняемых человеком,- это
обнаружение дефектов продукции. Бесчисленные часы проводят наши
друзья рабочие, изучая, правильно ли прилеплены этикетки на бутылках с
пивом, или проверяя электролампочки, или ботинки, или печатные платы
на предмет дефектов. Люди не особенно хорошо справляются с такой ра-
ботой не потому, что она превышает интеллект человека, но потому что
она им быстро наскучивает, и они начинают допускать ошибки. Скука не
относится к характеристикам систем ИИ; они могут работать беспрестан-
но и не жалуются. Может быть, квалифицированное человеческое воспри-
ятие, повторяющиеся действия - это именно то, что хорошо делает ком-
пьютер
Для обнаружения отклонений и принятия простых решений о качестве
продукта было разработано много успешных программ с использованием
компьютеров. Примером работ по ИИ, проводимых в этой области, явля-
ется программа, выполненная Тибадо (Thibadeau, 1985) в Институте Робо-
тотехники, являющемся филиалом Университета Карнеги-Мелона. Это не
просто задача "зрительного обнаружения" (можно использовать оптику
гораздо более чувствительную, чем человеческий глаз), а задача интер-
претации обнаруженного паттерна как приемлемого или неприемлемого.
В одном из проектов Тибадо занимался построением прибора для авто-
матической проверки, способном принимать разумные решения о каче-
стве печатных плат. На Рис. 15.7 можно видеть сильно увеличенные изоб-
ражения некоторых типов дефектов в проводниках печатных плат. На ча-
сти (а) этого рисунка изображен "обрыв" проводника, на части (b) -
"короткое замыкание", а на части (с) - "щербинка".
Выявление такого брака человеком занимает много времени, дорого
стоит и несовершенно, тогда как машины в этой сфере как минимум быс-
трее, дешевле и точнее. Пока что они еще несовершенны, и именно к
этому вопросу обратился Тибадо. Первым этапом разработки лучшего ИИ
прибора было составление списка видов брака, определяемых по стандар-
там, установленным инженерами. Каталог этих ошибок включал сотни
изображений, сходных с показанными на Рис. 15.7. Следующим этапом
было выяснить, на что обращают внимание инженеры, когда рассматрива-
Мышленц.с и интеллект - естественный и искусственный
510
ют печатную плату. В результате этот исследователь заинтересовался со-
зданием методики, при которой инженеров просили описать эти изобра-
жения путем оценки их по отношению к системе отсчета.
Одна система отсчета была установлена, когда инженеров просили
сказать о том, "что вызвало данный дефект", и оценить уверенность в
своей субъективной оценке по десятибалльной шкале. Затем этих испыту-
емых просили сказать, какие части изображения привели их к такому
решению и достаточно ли было этого изображения для вывода. Наконец, в
результате проведенной инженерами сортировки изображений дефектных
соединений на категории была составлена определенная систематизация
Данные этих наблюдений, отражающие некоторую точку зрения (о том,
что вызвало данный дефект), использовались затем как часть базы данных
компьютера, с тем, чтобы он принимал более разумные решения Совер-
шенная оценка зрительных паттернов может потребовать многих систем
отсчета.
Такие разработки занимают в ИИ важное место. В них с целью изго-
товления инструмента, способного "видеть" и принимать решения, соче-
тается применение некоторых способов принятия решения о зрительных
стимулах, свойственных человеку, с превосходными возможностями ска-
Рис. 15.7. Некоторые частые типы дефектов печатных плат. Перепечатано с разрешения из.
1984 Annual Research Review
Короткое замыкание Щербинка
И с к нес т венный интеллект
511
нирования и скоростью вычислений, свойственных оптическим сканирую-
щим устройствам и компьютерам.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81
можностей существующих систем компьютерного "восприятия".
Мышление и интеллект - естественный и искусственный
504
Один из способов научить компьютеры распознавать геометрические фор- Распознава-
мы путем анализа логических признаков - это использовать принцип, что цие линий
сложные геометрические формы состоят из простых. В этой программе
использован ряд небольших "матриц", которые систематически проходят
через каждый объект в поисках соответствия. Пример "матрицы" и иден-
тифицируемого геометрического объекта показан на Рис. 15.2. Матрица
сделана из двух типов сенсоров - позитивного и негативного; присут-
ствует, отсутствует - это единственный сигнал, подаваемый такой ячей-
кой. или подразделением матрицы. Изображенная матрица содержит толь-
ко шесть ячеек - три "минуса" и три "плюса", и, судя по расположению
этих компонентов (все "отрицательные" элементы расположены слева),
вроде бы, подходит для идентификации левого края объекта. Помещение
матрицы ее средней линией над левым краем куба привело бы к полному
соответствию. На углу соответствие было бы плохим, а на нижнем краю,
где плюс и минус отменяют друг друга, соответствия не будет. Хотя эта
эвристика в наибольшей степени ориентирована на возможности машин,
она не расходится с результатами изучения восприятия у животных и
человека. Ранее в этой главе (и в Главе 3) мы узнали, что психофизиоло-
гам удалось найти детекторы линий в клетках коры у кошек и, хотя эти
данные не полностью подтверждены, похоже, что у человека также име-
ются детекторы края.
Трудность с вышеприведенной системой состоит в том, что для распоз-
навания даже простых паттернов нужно большое количество матриц (на-
пример, детектор левой кромки, детектор правой кромки). Также пробле-
матична "добротность" стимула; большинство геометрических форм (осо-
бенно в реальном мире) могут иметь резкие или расплывчатые края, яр-
кие или тусклые края. Распознавание паттернов путем распознавания линий
можно сильно упростить, если распознаваемую форму сначала преобразо-
вать в образ, состоящий только из линий, и затем использовать матрицы
для определения ориентации этих линий.
Системы распознавания паттернов обычно имеют дело со зрительным ма-
териалом. Как правило, воспринимающие устройства у таких систем име-
ют растр, или матрицу из фотоэлементов, реагирующих на свет. Обычно
эти фотоэлементы имеют только два состояния - включено и выключено
(для "белого" и "черного"). Рассмотрим элементарную задачу идентифи-
кации цифры. На Рис.15.3 показано, как цифры можно преобразовать в
Роспознова-
ние паттер-
нов
Матрица
Плохое
соответствие
Соответствие
отсутствует
Рис.15.2. Обнаружение
левого края посредством
шестиэлементной матри-
цы. Знаки + и - указы-
вают элементы, реагиру-
ющие на условия присут-
ствует и отсутствует" со-
ответственно. Адаптиро-
вано из: Raphael (1976J.
Искусственный интеллект
505
двоичный код - 0, иди выключено для "черного", и /. или включено -
для "белого". Компьютер считывает каждую цифру (т.е. фотоэлементы -
один для каждого квадрата сетки, накладываемой на число, - "ощущает"
световые зоны, т.е. те, что не заняты числом), исходя из того, насколько
данный цифровой код совпадает с матрицей, хранящейся в памяти компь-
ютера. Это работает очень хорошо - если все буквы одной формы, одина-
ково расположены и не уменьшены,- и такие устройства широко приме-
няются в американской промышленности и государственной почтовой служ-
бе. Но когда дело доходит до чтения рукописных писем, присланных для
тети Иолы, у оптических сканирующих устройств начинаются разные труд-
ности. Однако, судя по всему, быстро разрабатываются системы для "чте-
ния" даже и рукописных текстов.
Идентификация букв и слов средствами ИИ представляет не только
практическую проблему, она также имеет значение для тех ученых, кого
интересует процесс анализа информации человеком. Многое из того, что
известно об идентификации человеком букв и слов, обсуждалось в Гла-
ве 10. Эти знания помогают разрабатывать компьютерные программы, ими-
тирующие этот процесс. Плодотворный отчет по этой теме, послуживший
руководством для последующих исследований, представили Селфридж и
Нейсер (Selfridge and Neisser, 1963). Только что описанная общая проце-
дура "восприятия буквы" потребовала бы огромной компьютерной памяти
(для хранения матрицы каждого нового варианта каждой буквы) или не
Рис. 15.3. Двоич-
ное представле-
ние (к опенка в
центре) букв (ко-
лонка слева!. Ну-
ли показывают
выключено или
"черный , едини-
цы -- включено
или "белый. В
прозой колонке
изображено, как
выглядели бы циф-
ры при считыва-
нии их сканером.
Адаптировано из:
Raphael I1976J.
0 О0000000 0
0 0001111и0 0
0 О0111101} (1
0 0011111101) 11
000100100 0
0 00111100 0
0 01100110 0
0 01000010 0
0 00000000 0
0 00000000 0
Во00000000
001/111100
0000/10000
0000/1000 0
0 000/1000 0
0 000/1000 0
0 000/1000 0
0 000/1000 0
0 110(1111)0Р0 0
0 00000000 0
606000000 0
б 00и0000U 0
0 00011000 0
0 001001UU 0
0 01000010 0
001000010 0
0 (101(10100 0
0 00011000 0
000000000 0
0 00000000 U
Мышление и интеллект - естественный и искусственный
506
смогла бы обнаруживать многие встречающиеся в действительности фор-
мы букв (Рис. 15.4).
Нужен был более "хитрый" подход, и Селфридж и Нейсер предложили
анализировать буквы по их "деталям".6 Возьмем, например, букву А. Чем
помещать все типы написаний буквы А в память компьютера и проводить
с ними операции поиска и сравнения, мы можем написать для компьютера
программу, которая будет изучать каждую из составляющих букву дета-
лей, проверять их наличие или отсутствие и принимать решение о том,
какая это может быть буква. Для этого есть два фундаментально различ-
ных способа - модель последовательной переработки и мод- ib парал-
лельной переработки. В модели последовательной переработки каждая
деталь изучается заранее определенным пошаговым способом, и резуль-
тат каждого теста определяет следующий шаг в программе. Пример про-
граммы последовательной обработки показан на Рис. 15.5 слева. Эта про-
стая программа оценивает всего три детали, спрашивая: Есть ли у предъяв-
ленной фигуры кривизна наверху (например, Н, U, Y, V), пересечение
(например, Н, F) и вертикальная линия (В, Y, Т, R, Р, Н)? При постепен-
ном процессе каждый из этих вопросов задается по порядку. Для рассмот-
ренного набора букв (А, Н, V и Y) простое решение "Да" или "Нет"- это
все, что необходимо для идентификации каждой буквы. Например, если
предъявлена для опознания буква А, то, чтобы отделить эту букву от
других букв рассматриваемого набора, надо только ответить отрицательно
на первый вопрос (Есть ли кривизна наверху?). Остальные вопросы слу-
жат для различения между собой остальных букв этого набора.
Обсуждение нидстальной идентификации см. в Главе 10.
А
Рис. 15.4. Типичные случаи неудачного об-
наружения. В случае "А" матрица 1открытая
буква) не находит соответствия, когда неиз-
вестная буква (темная) имеет неправильную
величину, ориентацию или положение; в слу-
чае В неверное сопоставление происхо
дит даже когда образец был приведен к стан-
дартной величине и ориентации. Здесь мат-
рице А больше соответствует буква R, чем
закругленные или с другим наклоном образ-
цы буквы А. Взято из: Selfrodge and Neisse
(1963J.
В
Искусственный интеллект
507
В модели параллельной обработки тестовые детали те же самые, что и
в модели последовательной обработки, но все они применяются не шаг за
шагом, а одновременно (Рис. 15.5 справа). Это "адская" модель в том пла-
не, что для каждой детали есть свой "демон", принимающий решение и
реагирующий на входной стимул согласно своему конкретному виду чув-
ствительности.
Возможно, наибольшая неудача этой ранней модели - это ее слепота
к "критическим деталям" и влияниям контекста. Первый из этих недо-
статков особенно существенней, поскольку различение "критических де-
талей" - это отличительная особенность распознавания паттернов чело-
веком. При отличении G от С или Q от О, например, критическая де-
таль - это почти незаметная небольшая линия. Неважно, насколько пре-
обладает заметность других деталей, для человеческой обработки они не
перевешивают важность критической детали. Второй пункт критики этой
ранней модели в том, что она нечувствительна к влиянию контекста при
идентификации отдельных букв. Наши обширные знания орфографии и
структуры предложения оказывают нам при идентификации букв неоцени-
мую помощь. Чтение рукописного текста - как в указанном случае -
было бы почти невозможно, если бы читающий не привносил в ситуацию
изрядное количество собственной информации. Чтобы заставить машину
действовать при обработке информации подобно человеку, следует при-
нять в расчет этот важный параметр.
А теперь мы рассмотрим несколько примеров того, как идентифициру-
ются паттерны более сложные, чем просто буквы.
Рис. 15.5. Алгорит-
мы последователь-
ной (слева) и парал-
лельной (справа) об-
работки для разли-
чения букв А, Н, V и
У путем использова-
ния трех тестовых
картинок. При по-
следовательной об-
работке каждый
последующий этоп
определяется выход-
ной информацией
предыдущего; при
параллельной обра-
ботке все тесты при-
меняются одновре-
менно, и решение
принимается на ос-
новании объедине-
ния их выходных дан-
ных. Адаптировано
из: Selfridge and N-
eisser (1963).
1
ВводнойКривизна
стимулнаверху?
| Входной
г--1 чма ы
1Кривизна наверху?
1
Входной стимулПересечение ?-
Верти-
кальная
линия 7L-
Мышление и интеллект - естественный и искусственный
508
В качестве примера распознавания других паттернов обратимся к иденти-
фикации треугольника7. На рисунке 15.6 изображены несколько треуголь-
ников, каждый из которых человек может немедленно опознать и класси-
фицировать как таковой. Если прототип "треугольности", хранимый в про-
грамме компьютера, соответствует "правильной" матрице треугольника
(а), тогда треугольники (Ь) и (с), если их правильно повернуть и скоррек-
тировать по величине, можно будет легко распознать; однако, треугольни-
ки (о) и (е) вызывают проблемы, особенно те, что на (е) - их можно
идентифицировать только в результате "хорошего гештальта", но не по
тому. что они состоят из трех прямых линий.
Наша способность немедленно распознавать каждую из этих фигур
как треугольник объясняется обширным опытом восприятия других треу-
гольных объектов; абстрактное представление о треугольности доста-
точно широко, чтобы позволить нам опознать эти треугольники именно
как треугольники, хотя мы их никогда не видели. Может ли компьютер
выучить это понятие? Возможно, но такой механизм поиска необходимо
будет более сложным, чем единичная операция сопоставления, такая, как
в машине, считывающей номер с чека. Вместо этого стоило бы подумать о
программе поиска, распознающей детали треугольника (как в программе
распознавания букв Селфриджа-Нейсера). Тогда такие детали, или атри-
буты, как углы, линии, форма, количество объектов и т.д. хранились бы в
компьютерной памяти, точно так же как в нашей памяти хранится каталог
этих атрибутов треугольника.
Программы последнего типа, более близкие интересам когнитивной
психологии, разрабатывали Гузман и Винстон (Gusman, 1968; Winston,
1970, 1973, 1984). Эти программы отличались от более ранних тем, что
0 том, как человек формирует понятие о треугольности см, в Главе 13.
Рис. 15.6. Хорошие (A-Dj и "про-
блематичные (Ef треугольники. Пер-
вые отличаются только по величине,
ориентации и отношению сторон; у
последних нет обычных прямолиней-
ных сторон, но их все же можно опоз-
нать как треугольники.
они не требовали хранения описаний тех форм, которые компьютеру пред-
стояло распознавать, а основывались на соотношении частей трехмерных
геометрических объектов.
"Квалифици- Если бы мы могли видеть только те объекты, видеть которые были запрог-
рованное" раммированы машины, описанные вплоть до этого момента, наши дела
зрительное были бы плохи. Основная проблема в том, что интеллект компьютеров,
воспоиятие V вежливо выражаясь, ограничен. Люди "видят" мозгом столько же, сколь-
Jurxnuu к0 и глазами: эта мысль является основной темой этой книги. Умение
воспринимать базируется на частом опыте восприятия объектов и собы-
тий. Опытный дизайнер по интерьерам способен разглядеть тончайшие
нюансы цвета, или текстуры, или формы, к которым неспециалист слеп.
Тот же самый принцип, видимо, действует и в отношении других сенсор-
ных модальностей (например, у профессиональных дегустаторов, музы-
кальных критиков, дегустаторов косметики и специалистов по мехам).
Можно ли научить машину выполнять те же самые - или хотя бы сход-
ные - функции?
Одна из очень практических функций, выполняемых человеком,- это
обнаружение дефектов продукции. Бесчисленные часы проводят наши
друзья рабочие, изучая, правильно ли прилеплены этикетки на бутылках с
пивом, или проверяя электролампочки, или ботинки, или печатные платы
на предмет дефектов. Люди не особенно хорошо справляются с такой ра-
ботой не потому, что она превышает интеллект человека, но потому что
она им быстро наскучивает, и они начинают допускать ошибки. Скука не
относится к характеристикам систем ИИ; они могут работать беспрестан-
но и не жалуются. Может быть, квалифицированное человеческое воспри-
ятие, повторяющиеся действия - это именно то, что хорошо делает ком-
пьютер
Для обнаружения отклонений и принятия простых решений о качестве
продукта было разработано много успешных программ с использованием
компьютеров. Примером работ по ИИ, проводимых в этой области, явля-
ется программа, выполненная Тибадо (Thibadeau, 1985) в Институте Робо-
тотехники, являющемся филиалом Университета Карнеги-Мелона. Это не
просто задача "зрительного обнаружения" (можно использовать оптику
гораздо более чувствительную, чем человеческий глаз), а задача интер-
претации обнаруженного паттерна как приемлемого или неприемлемого.
В одном из проектов Тибадо занимался построением прибора для авто-
матической проверки, способном принимать разумные решения о каче-
стве печатных плат. На Рис. 15.7 можно видеть сильно увеличенные изоб-
ражения некоторых типов дефектов в проводниках печатных плат. На ча-
сти (а) этого рисунка изображен "обрыв" проводника, на части (b) -
"короткое замыкание", а на части (с) - "щербинка".
Выявление такого брака человеком занимает много времени, дорого
стоит и несовершенно, тогда как машины в этой сфере как минимум быс-
трее, дешевле и точнее. Пока что они еще несовершенны, и именно к
этому вопросу обратился Тибадо. Первым этапом разработки лучшего ИИ
прибора было составление списка видов брака, определяемых по стандар-
там, установленным инженерами. Каталог этих ошибок включал сотни
изображений, сходных с показанными на Рис. 15.7. Следующим этапом
было выяснить, на что обращают внимание инженеры, когда рассматрива-
Мышленц.с и интеллект - естественный и искусственный
510
ют печатную плату. В результате этот исследователь заинтересовался со-
зданием методики, при которой инженеров просили описать эти изобра-
жения путем оценки их по отношению к системе отсчета.
Одна система отсчета была установлена, когда инженеров просили
сказать о том, "что вызвало данный дефект", и оценить уверенность в
своей субъективной оценке по десятибалльной шкале. Затем этих испыту-
емых просили сказать, какие части изображения привели их к такому
решению и достаточно ли было этого изображения для вывода. Наконец, в
результате проведенной инженерами сортировки изображений дефектных
соединений на категории была составлена определенная систематизация
Данные этих наблюдений, отражающие некоторую точку зрения (о том,
что вызвало данный дефект), использовались затем как часть базы данных
компьютера, с тем, чтобы он принимал более разумные решения Совер-
шенная оценка зрительных паттернов может потребовать многих систем
отсчета.
Такие разработки занимают в ИИ важное место. В них с целью изго-
товления инструмента, способного "видеть" и принимать решения, соче-
тается применение некоторых способов принятия решения о зрительных
стимулах, свойственных человеку, с превосходными возможностями ска-
Рис. 15.7. Некоторые частые типы дефектов печатных плат. Перепечатано с разрешения из.
1984 Annual Research Review
Короткое замыкание Щербинка
И с к нес т венный интеллект
511
нирования и скоростью вычислений, свойственных оптическим сканирую-
щим устройствам и компьютерам.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81