Лошади суют нос вам в карман, а собаки лижут руки. Дельфины плавают вокруг дрессировщика и боготворят ведро с рыбой. Если животное постоянно следит за дрессировщиком, очень трудно научить дельфина прыгать в противоположном направлении, к публике.
Когда вы выработали условное подкрепление, вы сможете идентифицировать действие на расстоянии или когда животное двигается от вас. Поэтому хорошо обученное животное вместо того, чтобы надоедать вам своим попрошайничеством, будет делать своё дело, но одновременно внимательно слушать магический звук, чтобы оно ни делало: для лошадей и собак эта внимательность имеет огромное обучающее значение сама по себе.
Поскольку сигнал позволяет отмечать доли секунды, то свистком можно развить у животного точное понимание, чего хочет дрессировщик. Это позволит обучить животное, чему вы хотите, очень чётко и подробно. Например, пусть дельфин выучил одно правило (прыгать в заданном направлении), поэтому вы уверены, что он почти всегда прыгает в правильном направлении по вашему сигналу. Теперь добавим новые детали или правила. Вы решили: «Я буду подкреплять только высокие прыжки». Дельфин достаточно быстро учится новым деталям («Я должен прыгать в этом направлении и прыгать высоко»).
Этот постепенный процесс кажется очень тщательно разработанным, но на практике это фантастически короткий способ обучения сложному поведению. Даже с необученным дельфином дрессировщик может разработать эффектное и специфическое поведение по одному указанию (например, поклон на публику, который я описывала) за два-три дня, а иногда, если все идёт хорошо, и за один десятиминутный урок. Много раз за мою работу с дельфинами мне удавалось «схватить» определённое действие, сформировать его в нечто особенное и научить делать его по одному указанию всего за один урок, об этом говорят и другие дрессировщики дельфинов.
Как быть с собаками?
За один десятиминутный урок вы легко сможете переложить методы дрессировки дельфинов для собаки при использовании условного подкрепления. Некоторые собаки боятся свистков. Лучшим условным подкреплением для собак является кликер, маленькая коробочка, которая при надавливании на металлическую пластинку издаёт щелчок. Её можно купить в магазинах для животных или заказать по Интернету.
Как только вы увидите что собака напряжена и ждёт лакомства, знайте, что сигнал (щелчок) стал условным подкреплением
Возьмите с собой кликер и немного лакомства. Разделите лакомство на маленькие кусочки, так чтобы вознаградить собаку пятнадцать-двадцать раз, но не насытить её. Некоторые собаки будут работать за сухой корм, особенно перед кормёжкой, но обычно лучше взять что-то более соблазнительное.
Научите собаку распознавать щелчок кликера, щёлкая и давая лакомство раз пять в различных частях комнаты или сада (чтобы у собаки не появилось мысли, что кликер работает только в одном определённом месте).
Затем щёлкните кликером и помедлите с лакомством несколько секунд. Если вы увидите, что собака напряглась и ждёт лакомство, знайте, что сигнал стал условным подкреплением. Теперь вы можете создавать поведение, мы называем этот процесс «формированием».
Формирование поведения
Легче всего сформировать поведение под названием «Поймай свой хвост». Конечно, существует столько способов, как добиться этого поведения, сколько придумывают дрессировщики: вы можете повернуть собаку вокруг себя за ошейник, вы можете положить кусочек бекона на кончик хвоста, чтобы собака обернулась вокруг себя, чтобы полизать хвост. Но есть только один способ добиться этого сразу без принуждений.
Прекратите щёлкать кликером и немного подождите. Ваша собака может быть заинтригована и возбуждена, когда вы ничего не делаете. Она может крутиться и даже заскулить или залаять. В тот момент, когда собака движется или поворачивается в нужном вам направлении, щёлкните кликером. Дайте лакомство.
Опять подождите. Не обращайте внимания на все остальные действия собаки, за исключением правильного (не ждите чуда, один поворот головы или один шаг передней лапой в правильном направлении — это всё, что вам нужно). Если «поймали» это поведение, если у вас хорошее чувство времени, за три или четыре подкрепления вы можете добиться, что собака поворачивается в нужном направлении чаще и быстрее.
Теперь вам не нужно подкрепление после первого шага в нужном направлении, но вы должны подкреплять весь поворот в нужном направлении, который состоит из нескольких шагов, возможно, каждую четверть круга, а после того, как собака освоит эти четвертинки круга, обучение полному повороту пойдёт ещё быстрее.
Гриффа учат поворачиваться по кругу. За каждое правильное движение ему щёлкают кликером.
Это лучший момент прекратить первый урок: остановка после маленькой победы — вот золотое правило. На следующий день возьмите кликер, кучу лакомств и начните с первого шага, затем сделайте четверть круга, а затем полный круг, вы увидите, что во второй раз все пойдёт намного быстрее.
После обучения повороту на один круг переходите к следующему шагу — повороту на два круга, а затем уже к следующему и очень важному шагу — разнообразию подкрепления — в одном случае подкрепляйте половину круга, в другом два круга или один или три полных круга, или даже один с четвертью, такой порядок ваших действий заставит собаку быть очень внимательной. Когда собака поймёт, что от неё требуется, вы можете ввести знак рукой или словесное указание, чтобы собака выполняла этот трюк, только когда её попросят.
Это очень простой трюк, и он не создаст вам имени великого дрессировщика. Существует и другое поведение, в котором вы сможете попрактиковаться, это «обозначение целей», при котором у собаки формируют такое поведение, как прикосновение носом к точке, на которую вы указали. (Дрессировщики морских львов учат своих животных «целиться» в сжатый кулак дрессировщика, затем опуская кулак на землю, или поднимая его в воздух, дрессировщик может заставить льва двигаться в нужном направлении без принуждения.) Целью этих экспериментов не является обучение собаки трюкам, это демонстрация использования условного подкрепления при формировании поведения и того, насколько эффективным может быть этот вид подкрепления.
Почему нужно использовать кликер?
Зачем вам нужен кликер? Почему вы не можете, к примеру, использовать голос и слово «Молодец» в качестве условного подкрепления? Основной причиной является то, что вы не сможете сказать «Молодец» именно в те нужные доли секунды, чего вы с лёгкостью достигнете щелчком кликера. С помощью кликера после небольшой практики вы сможете подкреплять совершенно неуловимые движения — всего один шаг лапой в правильном направлении. Похвала — вещь неопределённая, потому что занимает слишком много времени. Щелчок также несёт информацию и для вас. Он учит вас чувству времени, потому что провести грань между слишком ранним и слишком поздним щелчком намного проще, чем между сказанными вслух словами.
Другой трудностью в использовании слов являются наши постоянные разговоры рядом с собаками, и с самими собаками, которые мы ничем не подкрепляем. Для собак очень трудно рассортировать значимые слова от общего шума, который мы производим. Но щелчок кликера сильно отличается от остальных звуков, поэтому его значение так кристально ясно для собак. Вы действительно увидите, насколько точно условно подкрепляемая собака реагирует на трещотку (она наэлектризована, гальванизирована, возбуждена), по сравнению с собакой натренированной на слово «Молодец». («Что? А…» Собака улыбнулась, помахала хвостом.)
Реальный мир
Итак, я слышала дрессировщиков, которые говорили, что кликер хорош только для обучения трюкам, но ни для чего больше. Вы не сможете использовать его, к примеру, в ринге обидиенс. Конечно, нет, но он там вам и не нужен. Значимость кликера заключается в формировании нового поведения или уточнении деталей, он не нужен животному, которое уже обучено. Но даже для знаменитого чемпиона по рабочим соревнованиям кликер в качестве условного подкрепления может стать очень полезным инструментом.
Когда поведение уже закреплено, его не нужно постоянно подкреплять
Один участник состязаний рассказал мне, что он обучил свою суку добермана сигналу кликера, а затем использовал этот сигнал для подкрепления того, чтобы собака смотрела в лицо хозяина во время работы вместо того, чтобы смотреть в сторону.
«Это выглядело, как будто она была признательна за информацию, потому что для неё все прояснилось», — сказал он. Конечно, когда собака начинает понимать, чего же от неё хотят, она будет делать это правильно и на ринге безо всякого кликера.
Не следует, однако, думать, что люди никогда не использовали условного подкрепления на ринге. Все дрессировщики делали это, чтобы закрепить в сознании собаки сигнал, который больше никто, кроме неё, не поймёт. Я знаю одного очень способного дрессировщика на послушание, использовавшего едва слышное фырканье как условное подкрепление. Я видела похвалу одной из участниц соревнований: «Хорошая работа!» (она тут же отразилась великим наслаждением на морде её собаки), которая была передана прикосновением пальца хозяйки к голове собаки. Я знаю, что одна участница соревнований научила свою собаку Рекса, что лакомства называются «Билли». Затем, когда собака все выполняла на ринге, она подкрепляла особенно хорошее поведение, например точное возвращение, что выглядело в виде команды: «Билли, рядом!» И всем казалось, что она использует обычное имя своей собаки.
Еда, еда, еда! Собака наслаждается, но общее впечатление отвратительное.
Насколько приятнее смотреть на собаку, которой щёлкнули, чтобы она приняла нужную стойку, ведь она знает, что её наградят позднее.
Когда собака обучена каким-то действиям, условное подкрепление позволяет не только отсрочить награду пищей, не теряя при этом совершенства исполнения, но и давать вообще меньше лакомства. Вам не следует волноваться, что ваше животное успеет насытиться ещё до конца работы. Один пример: на собачьих выставках я часто замечала хендлеров, которые раз за разом подкармливали собак, давали им пищу, чтобы получить наиболее совершенную выставочную стойку или напряжённое выражение. И когда бы я не наблюдала, как в собачью пасть падает все новая и новая пища, всякий раз я знала, что хозяин этой собаки не имеет ни малейшего представления об условном подкреплении! Намного эффективнее приучить животное к нужной позе, развить понимание словесного указания, а затем подкрепить собаку щелчком за то, что она сохраняла нужную стойку соответствующее время. Награда пищей последует потом, вне ринга или когда эксперт уйдёт.
Сила условного подкрепления заключается в его действии — оно передаёт информацию и влияет на поведение животного, причём во всех ситуациях, когда обычное подкрепление нежелательно или невозможно. Подумайте, к примеру, насколько было бы полезно условное подкрепление для обучения розыскных собак, ездовых, сторожевых, поводырей, разыскивающих птиц и приносящих убитую дичь и для формирования любого поведения собак, когда требуется, чтобы животное работало далеко от вас.
Контроль плохого поведения
Контроль плохого поведения при помощи положительного подкрепления вместо «коррекции» может показаться бесперспективным занятием, но дрессировщики дельфинов знают множество способов, как это делать. Мы предлагаем три примера.
1. Установление условного отрицательного подкрепления
Это не будет сигналом, означающим «Я собираюсь тебя ударить», но это будет сигнал «Нет, я не буду тебя подкреплять». Оно говорит животному, что ряд его действий не будет оплачен. Например, вы можете просто повернуться спиной к своей собаке. Животное быстро поймёт, что, увидев этот «красный свет» или «плохой» сигнал, оно должно изменить своё поведение. Вы сможете использовать этот сигнал, чтобы, к примеру, отучить собаку прыгать на вас приветствуя, а вместо этого спокойно стоять — тогда её подкрепят лаской.
Если ваша собака ведёт себя плохо, например прыгает на вас, вы должны чётко объяснить ей, что такое поведение подкрепляться не будет.
Однако когда собака твёрдо стоит на земле, её нужно подкрепить.
2. Использование положительного подкрепления для обучения несовместимым действиям
В нашем шоу в Морском парке один дельфин просто изводил одну из девушек, выступавших в том же шоу. Прежде чем дать пловчихе водяной пистолет (или разрешить другое наказание), мы обучили дельфина давить на рычаг, торчащий над водой по свистку или за рыбу, и каждый раз, когда девушка оказывалась в воде, мы просили его давить на этот рычаг. Дельфин не мог одновременно давить на рычаг и преследовать пловчиху, эти действия были несовместимы (тем более что давление на рычаг всегда подкреплялось, поэтому прекратилось преследование пловчихи). Вы можете использовать эту технику для приучения собаки лежать в гостиной во время вашего обеда, тогда она не будет попрошайничать у вашего стола.
3. Тайм-аут
Иногда дельфин делает что-то действительно плохое, например проявляет агрессию (бьёт головой или зубами по руке дрессировщика). Когда такое происходит, нужно сразу же повернуться к нему спиной, забрать свои принадлежности и ведро с рыбой и уйти на целую минуту. Дельфин сразу же высовывает голову из воды и смотрит с недоумением: «Эй, что я такого сделал?» После нескольких повторений он учится думать о своих действиях. Собачий эквивалент может быть таким же: уберите лакомство и кликер — и конец всем развлечениям.
Дрессировщики в океанариуме успешно используют тайм-ауты для борьбы с агрессией, направленной на людей-пловцов, даже у таких высокодоминантных животных, как взрослые самцы-касатки. Но эта техника может приносить страдания животным, поэтому использовать её нужно осторожно.
Вдумчивое отношение
Использование подкрепления составляет большую часть работы дрессировщика, поэтому оно заставляет вас думать. Но что за головная боль! Намного легче следовать таким простым правилам: если сделала кучу, ткните её носом, если собака не идёт рядом, дёрните поводок. Однако обдумав то, что вы собираетесь подкрепить, вы станете намного более искусным дрессировщиком. Но для совершенного выбора момента для подкрепления вам нужно сосредоточиться, тогда дрессировка станет очень волнующим, а не скучным занятием.
С точки зрения животного этот вид дрессировки не означает приучение держаться подальше от неприятностей, выполняя то, что от него требуют, ведь это просто обычная работа, и больше ничего. Взамен эта дрессировка даёт животному шанс победить, снова и снова, а также шанс контролировать хотя бы часть своей работы. Например, с точки зрения дельфина, когда он научился понимать значение свистка, дрессировка не становится для него сменой команд и послушания, она становится игрой в загадки, которые дельфин стремится «разгадать» различными способами, как заставить дрессировщика дунуть в свой свисток. Это игра по строгим правилам, но при равенстве обеих сторон. Ничего удивительного, что дельфины очень любят своих дрессировщиков, которые учат их послушанию!
Действие положительного условного подкрепления намного сильнее, чем у простой дрессировки. Если вы прекратите полагаться на контроль плохого поведения, а начнёте формировать хорошее поведение с чётко выраженными условными сигналами подкрепления, ваша собака будет относиться к вам совсем по-другому. Вы научитесь использовать интуицию при общении со своей собакой.
Дрессировка с кликером даст вашей собаке шанс побеждать снова и снова. Здесь Мич (помесь ротвейлера) учат удерживать лакомство на кончике носа, а затем схватить его.
Щелчок! Мич вознаграждают за правильное поведение, и она получает своё лакомство.
ГЛАВА ВТОРАЯ
ДАВАЙТЕ НАЧНЁМ
Обучение некоторым простым действиям при помощи кликера
О хорошо обученных собаках мы обычно думаем, что они просто не способны что-то сделать неправильно: прыгнуть на гостя, много лаять, залезать на диван и т. д. Поэтому и о «дрессировке» мы думаем, как о способе избежания плохого поведения. Под дрессировкой мы понимаем прекращение прыжков на людей, лая или хождение рядом на поводке. Поэтому обычная дрессировка на первый взгляд состоит из контроля и профилактики. Вы дёргаете свою собаку за поводок, чтобы заставить её сделать что-то, а затем исправляете её, обычно другим рывком поводка, когда собака делает что-то «неправильно», пока она не научится, как делать «правильно».
Дрессировка с кликером даёт новый путь обучения собаки.
Дрессировка с кликером, или оперантное обучение, имеет совершенно другие принципы.
1 2 3 4 5 6 7 8
Когда вы выработали условное подкрепление, вы сможете идентифицировать действие на расстоянии или когда животное двигается от вас. Поэтому хорошо обученное животное вместо того, чтобы надоедать вам своим попрошайничеством, будет делать своё дело, но одновременно внимательно слушать магический звук, чтобы оно ни делало: для лошадей и собак эта внимательность имеет огромное обучающее значение сама по себе.
Поскольку сигнал позволяет отмечать доли секунды, то свистком можно развить у животного точное понимание, чего хочет дрессировщик. Это позволит обучить животное, чему вы хотите, очень чётко и подробно. Например, пусть дельфин выучил одно правило (прыгать в заданном направлении), поэтому вы уверены, что он почти всегда прыгает в правильном направлении по вашему сигналу. Теперь добавим новые детали или правила. Вы решили: «Я буду подкреплять только высокие прыжки». Дельфин достаточно быстро учится новым деталям («Я должен прыгать в этом направлении и прыгать высоко»).
Этот постепенный процесс кажется очень тщательно разработанным, но на практике это фантастически короткий способ обучения сложному поведению. Даже с необученным дельфином дрессировщик может разработать эффектное и специфическое поведение по одному указанию (например, поклон на публику, который я описывала) за два-три дня, а иногда, если все идёт хорошо, и за один десятиминутный урок. Много раз за мою работу с дельфинами мне удавалось «схватить» определённое действие, сформировать его в нечто особенное и научить делать его по одному указанию всего за один урок, об этом говорят и другие дрессировщики дельфинов.
Как быть с собаками?
За один десятиминутный урок вы легко сможете переложить методы дрессировки дельфинов для собаки при использовании условного подкрепления. Некоторые собаки боятся свистков. Лучшим условным подкреплением для собак является кликер, маленькая коробочка, которая при надавливании на металлическую пластинку издаёт щелчок. Её можно купить в магазинах для животных или заказать по Интернету.
Как только вы увидите что собака напряжена и ждёт лакомства, знайте, что сигнал (щелчок) стал условным подкреплением
Возьмите с собой кликер и немного лакомства. Разделите лакомство на маленькие кусочки, так чтобы вознаградить собаку пятнадцать-двадцать раз, но не насытить её. Некоторые собаки будут работать за сухой корм, особенно перед кормёжкой, но обычно лучше взять что-то более соблазнительное.
Научите собаку распознавать щелчок кликера, щёлкая и давая лакомство раз пять в различных частях комнаты или сада (чтобы у собаки не появилось мысли, что кликер работает только в одном определённом месте).
Затем щёлкните кликером и помедлите с лакомством несколько секунд. Если вы увидите, что собака напряглась и ждёт лакомство, знайте, что сигнал стал условным подкреплением. Теперь вы можете создавать поведение, мы называем этот процесс «формированием».
Формирование поведения
Легче всего сформировать поведение под названием «Поймай свой хвост». Конечно, существует столько способов, как добиться этого поведения, сколько придумывают дрессировщики: вы можете повернуть собаку вокруг себя за ошейник, вы можете положить кусочек бекона на кончик хвоста, чтобы собака обернулась вокруг себя, чтобы полизать хвост. Но есть только один способ добиться этого сразу без принуждений.
Прекратите щёлкать кликером и немного подождите. Ваша собака может быть заинтригована и возбуждена, когда вы ничего не делаете. Она может крутиться и даже заскулить или залаять. В тот момент, когда собака движется или поворачивается в нужном вам направлении, щёлкните кликером. Дайте лакомство.
Опять подождите. Не обращайте внимания на все остальные действия собаки, за исключением правильного (не ждите чуда, один поворот головы или один шаг передней лапой в правильном направлении — это всё, что вам нужно). Если «поймали» это поведение, если у вас хорошее чувство времени, за три или четыре подкрепления вы можете добиться, что собака поворачивается в нужном направлении чаще и быстрее.
Теперь вам не нужно подкрепление после первого шага в нужном направлении, но вы должны подкреплять весь поворот в нужном направлении, который состоит из нескольких шагов, возможно, каждую четверть круга, а после того, как собака освоит эти четвертинки круга, обучение полному повороту пойдёт ещё быстрее.
Гриффа учат поворачиваться по кругу. За каждое правильное движение ему щёлкают кликером.
Это лучший момент прекратить первый урок: остановка после маленькой победы — вот золотое правило. На следующий день возьмите кликер, кучу лакомств и начните с первого шага, затем сделайте четверть круга, а затем полный круг, вы увидите, что во второй раз все пойдёт намного быстрее.
После обучения повороту на один круг переходите к следующему шагу — повороту на два круга, а затем уже к следующему и очень важному шагу — разнообразию подкрепления — в одном случае подкрепляйте половину круга, в другом два круга или один или три полных круга, или даже один с четвертью, такой порядок ваших действий заставит собаку быть очень внимательной. Когда собака поймёт, что от неё требуется, вы можете ввести знак рукой или словесное указание, чтобы собака выполняла этот трюк, только когда её попросят.
Это очень простой трюк, и он не создаст вам имени великого дрессировщика. Существует и другое поведение, в котором вы сможете попрактиковаться, это «обозначение целей», при котором у собаки формируют такое поведение, как прикосновение носом к точке, на которую вы указали. (Дрессировщики морских львов учат своих животных «целиться» в сжатый кулак дрессировщика, затем опуская кулак на землю, или поднимая его в воздух, дрессировщик может заставить льва двигаться в нужном направлении без принуждения.) Целью этих экспериментов не является обучение собаки трюкам, это демонстрация использования условного подкрепления при формировании поведения и того, насколько эффективным может быть этот вид подкрепления.
Почему нужно использовать кликер?
Зачем вам нужен кликер? Почему вы не можете, к примеру, использовать голос и слово «Молодец» в качестве условного подкрепления? Основной причиной является то, что вы не сможете сказать «Молодец» именно в те нужные доли секунды, чего вы с лёгкостью достигнете щелчком кликера. С помощью кликера после небольшой практики вы сможете подкреплять совершенно неуловимые движения — всего один шаг лапой в правильном направлении. Похвала — вещь неопределённая, потому что занимает слишком много времени. Щелчок также несёт информацию и для вас. Он учит вас чувству времени, потому что провести грань между слишком ранним и слишком поздним щелчком намного проще, чем между сказанными вслух словами.
Другой трудностью в использовании слов являются наши постоянные разговоры рядом с собаками, и с самими собаками, которые мы ничем не подкрепляем. Для собак очень трудно рассортировать значимые слова от общего шума, который мы производим. Но щелчок кликера сильно отличается от остальных звуков, поэтому его значение так кристально ясно для собак. Вы действительно увидите, насколько точно условно подкрепляемая собака реагирует на трещотку (она наэлектризована, гальванизирована, возбуждена), по сравнению с собакой натренированной на слово «Молодец». («Что? А…» Собака улыбнулась, помахала хвостом.)
Реальный мир
Итак, я слышала дрессировщиков, которые говорили, что кликер хорош только для обучения трюкам, но ни для чего больше. Вы не сможете использовать его, к примеру, в ринге обидиенс. Конечно, нет, но он там вам и не нужен. Значимость кликера заключается в формировании нового поведения или уточнении деталей, он не нужен животному, которое уже обучено. Но даже для знаменитого чемпиона по рабочим соревнованиям кликер в качестве условного подкрепления может стать очень полезным инструментом.
Когда поведение уже закреплено, его не нужно постоянно подкреплять
Один участник состязаний рассказал мне, что он обучил свою суку добермана сигналу кликера, а затем использовал этот сигнал для подкрепления того, чтобы собака смотрела в лицо хозяина во время работы вместо того, чтобы смотреть в сторону.
«Это выглядело, как будто она была признательна за информацию, потому что для неё все прояснилось», — сказал он. Конечно, когда собака начинает понимать, чего же от неё хотят, она будет делать это правильно и на ринге безо всякого кликера.
Не следует, однако, думать, что люди никогда не использовали условного подкрепления на ринге. Все дрессировщики делали это, чтобы закрепить в сознании собаки сигнал, который больше никто, кроме неё, не поймёт. Я знаю одного очень способного дрессировщика на послушание, использовавшего едва слышное фырканье как условное подкрепление. Я видела похвалу одной из участниц соревнований: «Хорошая работа!» (она тут же отразилась великим наслаждением на морде её собаки), которая была передана прикосновением пальца хозяйки к голове собаки. Я знаю, что одна участница соревнований научила свою собаку Рекса, что лакомства называются «Билли». Затем, когда собака все выполняла на ринге, она подкрепляла особенно хорошее поведение, например точное возвращение, что выглядело в виде команды: «Билли, рядом!» И всем казалось, что она использует обычное имя своей собаки.
Еда, еда, еда! Собака наслаждается, но общее впечатление отвратительное.
Насколько приятнее смотреть на собаку, которой щёлкнули, чтобы она приняла нужную стойку, ведь она знает, что её наградят позднее.
Когда собака обучена каким-то действиям, условное подкрепление позволяет не только отсрочить награду пищей, не теряя при этом совершенства исполнения, но и давать вообще меньше лакомства. Вам не следует волноваться, что ваше животное успеет насытиться ещё до конца работы. Один пример: на собачьих выставках я часто замечала хендлеров, которые раз за разом подкармливали собак, давали им пищу, чтобы получить наиболее совершенную выставочную стойку или напряжённое выражение. И когда бы я не наблюдала, как в собачью пасть падает все новая и новая пища, всякий раз я знала, что хозяин этой собаки не имеет ни малейшего представления об условном подкреплении! Намного эффективнее приучить животное к нужной позе, развить понимание словесного указания, а затем подкрепить собаку щелчком за то, что она сохраняла нужную стойку соответствующее время. Награда пищей последует потом, вне ринга или когда эксперт уйдёт.
Сила условного подкрепления заключается в его действии — оно передаёт информацию и влияет на поведение животного, причём во всех ситуациях, когда обычное подкрепление нежелательно или невозможно. Подумайте, к примеру, насколько было бы полезно условное подкрепление для обучения розыскных собак, ездовых, сторожевых, поводырей, разыскивающих птиц и приносящих убитую дичь и для формирования любого поведения собак, когда требуется, чтобы животное работало далеко от вас.
Контроль плохого поведения
Контроль плохого поведения при помощи положительного подкрепления вместо «коррекции» может показаться бесперспективным занятием, но дрессировщики дельфинов знают множество способов, как это делать. Мы предлагаем три примера.
1. Установление условного отрицательного подкрепления
Это не будет сигналом, означающим «Я собираюсь тебя ударить», но это будет сигнал «Нет, я не буду тебя подкреплять». Оно говорит животному, что ряд его действий не будет оплачен. Например, вы можете просто повернуться спиной к своей собаке. Животное быстро поймёт, что, увидев этот «красный свет» или «плохой» сигнал, оно должно изменить своё поведение. Вы сможете использовать этот сигнал, чтобы, к примеру, отучить собаку прыгать на вас приветствуя, а вместо этого спокойно стоять — тогда её подкрепят лаской.
Если ваша собака ведёт себя плохо, например прыгает на вас, вы должны чётко объяснить ей, что такое поведение подкрепляться не будет.
Однако когда собака твёрдо стоит на земле, её нужно подкрепить.
2. Использование положительного подкрепления для обучения несовместимым действиям
В нашем шоу в Морском парке один дельфин просто изводил одну из девушек, выступавших в том же шоу. Прежде чем дать пловчихе водяной пистолет (или разрешить другое наказание), мы обучили дельфина давить на рычаг, торчащий над водой по свистку или за рыбу, и каждый раз, когда девушка оказывалась в воде, мы просили его давить на этот рычаг. Дельфин не мог одновременно давить на рычаг и преследовать пловчиху, эти действия были несовместимы (тем более что давление на рычаг всегда подкреплялось, поэтому прекратилось преследование пловчихи). Вы можете использовать эту технику для приучения собаки лежать в гостиной во время вашего обеда, тогда она не будет попрошайничать у вашего стола.
3. Тайм-аут
Иногда дельфин делает что-то действительно плохое, например проявляет агрессию (бьёт головой или зубами по руке дрессировщика). Когда такое происходит, нужно сразу же повернуться к нему спиной, забрать свои принадлежности и ведро с рыбой и уйти на целую минуту. Дельфин сразу же высовывает голову из воды и смотрит с недоумением: «Эй, что я такого сделал?» После нескольких повторений он учится думать о своих действиях. Собачий эквивалент может быть таким же: уберите лакомство и кликер — и конец всем развлечениям.
Дрессировщики в океанариуме успешно используют тайм-ауты для борьбы с агрессией, направленной на людей-пловцов, даже у таких высокодоминантных животных, как взрослые самцы-касатки. Но эта техника может приносить страдания животным, поэтому использовать её нужно осторожно.
Вдумчивое отношение
Использование подкрепления составляет большую часть работы дрессировщика, поэтому оно заставляет вас думать. Но что за головная боль! Намного легче следовать таким простым правилам: если сделала кучу, ткните её носом, если собака не идёт рядом, дёрните поводок. Однако обдумав то, что вы собираетесь подкрепить, вы станете намного более искусным дрессировщиком. Но для совершенного выбора момента для подкрепления вам нужно сосредоточиться, тогда дрессировка станет очень волнующим, а не скучным занятием.
С точки зрения животного этот вид дрессировки не означает приучение держаться подальше от неприятностей, выполняя то, что от него требуют, ведь это просто обычная работа, и больше ничего. Взамен эта дрессировка даёт животному шанс победить, снова и снова, а также шанс контролировать хотя бы часть своей работы. Например, с точки зрения дельфина, когда он научился понимать значение свистка, дрессировка не становится для него сменой команд и послушания, она становится игрой в загадки, которые дельфин стремится «разгадать» различными способами, как заставить дрессировщика дунуть в свой свисток. Это игра по строгим правилам, но при равенстве обеих сторон. Ничего удивительного, что дельфины очень любят своих дрессировщиков, которые учат их послушанию!
Действие положительного условного подкрепления намного сильнее, чем у простой дрессировки. Если вы прекратите полагаться на контроль плохого поведения, а начнёте формировать хорошее поведение с чётко выраженными условными сигналами подкрепления, ваша собака будет относиться к вам совсем по-другому. Вы научитесь использовать интуицию при общении со своей собакой.
Дрессировка с кликером даст вашей собаке шанс побеждать снова и снова. Здесь Мич (помесь ротвейлера) учат удерживать лакомство на кончике носа, а затем схватить его.
Щелчок! Мич вознаграждают за правильное поведение, и она получает своё лакомство.
ГЛАВА ВТОРАЯ
ДАВАЙТЕ НАЧНЁМ
Обучение некоторым простым действиям при помощи кликера
О хорошо обученных собаках мы обычно думаем, что они просто не способны что-то сделать неправильно: прыгнуть на гостя, много лаять, залезать на диван и т. д. Поэтому и о «дрессировке» мы думаем, как о способе избежания плохого поведения. Под дрессировкой мы понимаем прекращение прыжков на людей, лая или хождение рядом на поводке. Поэтому обычная дрессировка на первый взгляд состоит из контроля и профилактики. Вы дёргаете свою собаку за поводок, чтобы заставить её сделать что-то, а затем исправляете её, обычно другим рывком поводка, когда собака делает что-то «неправильно», пока она не научится, как делать «правильно».
Дрессировка с кликером даёт новый путь обучения собаки.
Дрессировка с кликером, или оперантное обучение, имеет совершенно другие принципы.
1 2 3 4 5 6 7 8