10 правил отработки навыка. Дрессировка собак и людей

Опубликовано Tatyana 11.08.2017 1 Комментарии Справочник,

Выработка и закрепление определенного навыка в процессе дрессировки будет более результативным, если сдедовать советам Карен Прайор:

 

1. Повышайте критерий небольшими градациями, чтобы у субьекта всегда была возможность выполнить требуемое и подучить подкрепление

 

Практически это означает, что, когда вы увеличиваете требования или повышаете критерий подкрепления, вы должны это делать в пределах, доступных в данный момент субъекту. Если ваша лошадь берет барьер в два фута, иногда имея фут в запасе вы можете увеличить барьер до двух с половиной футов. Поднять его до трех футов, значит искать себе неприятностей: животное способно на это, но пока не в состоянии обеспечить стабильности.  Быстрота увеличения критерия зависит от того, насколько хорошо ваше взаимодействие в процессе выработки.
Каждый раз, как вы увеличиваете критерий, вы меняете правила. Субъекту должна быть дана возможность обнаружить это; несмотря на изменение правил, при некотором увеличении усилий, субъект должен продолжать получать подкрепление (но при этом в некоторых случаях выполнение действия на прежнем уровне становится неэффективным).
Это может быть усвоено только в процессе ознакомления с подкреплением на новом уровне.
Если вы повышаете критерий так сильно, что субъекту надо совершить усилия значительно большие, чем он ранее совершал для вас — неважно делал или не делал он это для себя, — вы сильно рискуете. Поведение может быть сорвано.
У прыгуна могут появиться дурные привычки, такие, как останавливаться перед барьером или сбивать его. Привычки, подавление которых потребует много времени. Самый быстрый — а иногда единственный — способ сформировать поведение — это увеличивать критерии такими ступенями, чтобы субъекту легко давалось постоянное улучшение поведения. Непрерывный прогресс, даже дюйм за дюймом, приведет вас к поставленной цели гораздо быстрее, чем попытки форсировать быстрый прогресс с риском потерять все выработанное поведение.
Однажды мне пришлось встретиться с одним отцом, допустившим в этом серьезную ошибку. Так как сын-подросток очень плохо учился, он отобрал у него обожаемый всеми подростками мотоцикл до улучшения отметок. Мальчик стал заниматься лучше, его оценки улучшились, с F и D до D и C. Однако вместо того, чтобы поощрить этот прогресс, отец сказал, что оценки еще недостаточно хорошие, и продолжал придерживаться своего запрета. Эта эскалация критерия была слишком резкой, мальчик совсем перестал заниматься. Более того, он стал очень недоверчивым.


2. В конкретный промежуток времени отрабатывайте что-нибудь одно, не пытайтесь формировать поведение по двум критериям одновременно 


 Под этим я не подразумеваю, что вы не можете работать над многими различными типами поведения в один и тот же период времени. Безусловно, вы можете это. Во время любого занятия мы можем сначала немного поработать над качеством, затем над скоростью — в теннисе над ударом слева, затем над ударом справа, затем над работой ног и т. д. Это избавляет от монотонности. Хорошие преподаватели все время меняют работу, оставляя данную задачу, как только в ней достигнут успех, и переходят к другой. Однако, когда вы работаете над данным типом поведения, вы должны пользоваться в каждый данный отрезок времени одним и только одним неизменным критерием. Допустим, что я обучаю дельфина делать фонтан брызг, и один раз не дам ему подкрепление, потому что фонтан недостаточно велик, а другой раз — потому что он направлен не в ту сторону, в итоге у животного не будет ключа к расшифровке того, что я хочу от него. Одно подкрепление не может содержать двух типов информации: я должна сначала довести высоту фонтана до удовлетворяющей меня отметки, а затем формировать его направление вне зависимости от высоты, до тех пор, пока оно тоже не будет заучено; только когда оба критерия установлены, я могу требовать соблюдения обоих.
У этого правила множество практических применений. Если задачу можно расчленить на отдельные компоненты, которые затем формируются раздельно, обучение пойдет гораздо быстрее. Рассмотрим обучение удару в гольфе, отправляющему мяч в лунку. Попадет ли мяч в лунку зависит от правильности расстояния, на которое послан мяч, — чтобы оно не было меньше, чем расстояние до лунки, и чтобы мяч не перелетел через нее, и от направления удара, чтоб мяч не уходил ни в одну, ни в другую сторону от лунки. Если я собираюсь обучиться удару, я буду практиковаться в этих навыках раздельно. Я бы положила на траву пучок шнура длиной в несколько футов и стала бы тренироваться, посылая мяч вдоль него сначала с расстояния двух, затем четырех, шести, десяти футов и т. д. Я могла бы сделать из шнура круг и стала тренироваться попадать в него с определенного расстояния, постепенно уменьшая размер круга, до тех пор, пока не смогла бы надежно попадать в очень маленькую цель. Только когда меня будут удовлетворять мои навыки удара по мячу как для посылки его на нужное расстояние, так и в заданном направлении, я их объединю и, сделав большую цель, начну менять расстояние, а затем стану уменьшать цель и, снова меняя расстояние, добьюсь попадания в маленькую цель с различных дистанций. Затем по мере улучшения навыка удара я могу добавлять новые критерии, по одному в каждый конкретный момент времени.
Это поможет мне стать превосходным или по крайней мере очень хорошим игроком в гольф в зависимости от моей настойчивости и пределов зрительно-моторной координации. Это обеспечит мне, безусловно в пределах моих возможностей, надежность попадания мячом в лунку. Я утверждаю, что любой игрок в гольф, пользуясь такой однозадачной программой выработки, за несколько выходных достигнет большего, чем за целое лето бессистемной тренировки, волей-неволей надеясь достичь каждым ударом и правильности расстояния, и правильности направления.

3. Прежде чем увеличивать или повышать критерий, пользуйтесь подкреплением текущего уровня ответа т е подкрепляйте любое исполнение данного действия, имеющегося в данный момент.


Вы помните о вариативной шкале подкреплений? Как только поведение усвоено, вы должны начать подкреплять его не каждый раз, чтобы поддерживать его на данном уровне. Это правило составляет суть процесса выработки. Когда вы можете позволить себе подкреплять данный уровень поведения случайным образом и сохранять уверенность в получении его, вы получаете свободу в использовании подкреплений только за лучшие проявления данного поведения. Такое селективное подкрепление «сдвинет» нормальное или среднее поведение в сторону того улучшения, которое вам желательно. Хорошая выработка представляет из себя серию чуть заметных переходов между непрерывным подкреплением — когда достигнут новый уровень выполнения — и вариативным подкреплением — когда достижение закрепилось и создалась возможность избирательного подкрепления еще более хороших ответов.


4. Вводя новый критерий, временно ослабьте старые


Допустим, вы учитесь играть в сквош (что-то вроде тенниса) и успешно работаете над одной целью — послать мяч туда, куда вы хотите. Теперь вы хотите поработать над скоростью, но, когда вы усиливаете удар, мяч летит куда попало. Забудьте на некоторое время о точности и просто ударяйте по мячу. Когда вы научитесь управлять скоростью мяча, точность скоро восстановится.


То, что раз выучено, не забывается, но под подавляющим воздействием нового критерия старое, хорошо выученное поведение иногда временно уходит в сторону. Однажды я видела дирижера, который пришел в состояние крайнего раздражения во время генеральной репетиции оперы, потому что певцы хора делали одну ошибку за другой, они как будто забыли всю свою твердо выученную вокальную партию. Причиной было то, что они в первый раз надели тяжелые костюмы, их поставили на подмостки и заставили двигаться во время пения: привыкание к новым условиям временно перекрыло выученное ранее поведение. К концу репетиции их музыкальное мастерство восстановилось без дополнительных репетиций. Дрессировщики дельфинов называют это «синдромом нового бассейна». Когда вы помещаете дельфина в новый бассейн, для вас не должно быть неожиданностью, что он «забудет» все, что знал, пока не привыкнет к новой обстановке. Следует помнить, что ругать себя или других за ошибки в выученном поведении, совершаемые при новых обстоятельствах, непедагогично. Ошибки обычно исправляются в скором времени сами по себе, а выговоры огорчают, а иногда фиксируют внимание на ошибках, которые становятся постоянными.


5. Будьте впереди того, кого Вы обучаете: полностью планируйте свою программу выработки так, чтобы в случае внезапного успеха обучаемого вы знали, что следует подкреплять далее.


Планируйте программу выработки так, что, если субъект совершит в обучении неожиданный скачок вперед, вы должны знать, что подкреплять далее. Однажды я в течение двух дней обучала только что пойманного дельфина прыгать через препятствие, выступающее над водой на несколько дюймов. Когда поведение прочно установилось, я подняла барьер еще на несколько дюймов, животное тотчас же прыгнуло, и с такой легкостью, что я скоро снова подняла барьер уже на гораздо большую высоту; через пятнадцать минут этот новичок прыгал на восемь футов.
Такого рода «рывок» выработки может произойти в любой момент. Этот феномен наблюдается как у людей, так и у многих видов разумных животных. Я считаю, что тут дело в инсайте (внезапное озарение): субъект внезапно осознает ваши цели, исходя из которых вы добиваетесь его действий (в данном случае — прыгнуть как можно выше), и делает это.
Киты-касатки славятся своим предвосхищающим обучением. У их дрессировщиков в ходу одна и та же шутка: касатку не надо дрессировать, достаточно записать программу поведения на доске и вывесить ее в воде, и киты будут следовать этому предписанию.
Дрессировщики могут встретиться с осложнениями только в том случае, если они оказываются неподготовленными к неожиданному улучшению. Если вы тренируете переход от стадии А к Б, а субъект внезапно чисто выполняет стадию В уже с двух подкреплений, вы должны предусмотреть подкрепление стадии Г и Д, иначе в дальнейшем вам нечего будет подкреплять.
«Рывок» часто эмоционально очень значим для субъекта; даже животные, по-видимому, испытывают удовольствие от «ага!» познания, и часто впадает в состояние явно повышенного настроения. Таким образом, «рывок» — это блистательная возможность добиться значительного прогресса в кратчайшие сроки. Быть не готовым к нему и держать субъект на низком уровне обучения только потому, что вы не знаете, что делать дальше, — лучший способ потратить зря время, а в худшем случае может отбить охоту к обучению и вызывает отвращение у субъекта, который станет в будущем работать без особого желания.
 

6. Не меняйте тренеров на "середине реки". У Вас может быть несколько инструкторов, но придерживайтесь одной программы выработки на каждый тип поведения.


В процессе выработки какого-либо поведения вы рискуете значительным регрессом, если перепоручаете своего ученика другому преподавателю. Не важно, сколь скрупулезно обсуждены критерии перед передачей дела, поскольку и индивидуальные установки, и время реакций, и прогноз успеха будут слегка отличаться, и в итоге субъект утрачивает подкрепления до тех пор, пока не привыкнет к этим отличиям.
Конечно, у каждого обучающегося может быть много различных учителей — мы не испытываем затруднений от того, что один обучает нас французскому, другой — арифметике, третий — футболу. Но то конкретное поведение, которое должно быть разучено, требует только одного учителя в каждый конкретный момент времени. На тех стадиях выработки, когда навык образован наполовину, постоянное повышение критерия осуществляется лучше, если процесс формирования данного поведения находится в одних руках. Допустим, если у вас двое детей и одна собака, и оба хотят обучать собаку, то разрешите им это, но пусть каждый работает над различными, каждый над своими трюками, и тем избавьте бедную собаку от большой неразберихи.

Единственный случай, когда вам следует подумать о смене преподавателя посредине процесса выработки, это, конечно, когда обучение зашло в тупик. Если обучение идет плохо или совсем не идет, то вам нечего терять от перемены.


7. Если одна процедура выработки не приносит успеха, найдите другую, существует столько же способов добиться нужного поведения, сколько инструкторов, способных их придумать.

 
Поразительно, до чего люди бывают привержены к неэффективной системе, будучи убежденными, что повторение одного и того же даст результаты. Для выработки любого поведения существует столько же способов, сколько инструкторов, способных их придумать. Например, при обучении детей плаванию надо сделать так, чтоб они не боялись и чувствовали себя спокойно под водой. В качестве первого шага формирования этого навыка одни тренеры велят им выдувать в воду воздух, пуская пузыри, другие — быстро опускать в воду и поднимать обратно лицо, а третьи — прыгать в воде, пока они не отважатся просто присесть, чтобы вода закрыла их. Любой хороший тренер, видя, что ребенку скучно или его пугает этот метод, перейдет на другой; одни и те же методы выработки не равноценны для разных индивидуумов.
Дрессировщики, передающие свое искусство от поколения к поколению, такие, например, как цирковые дрессировщики, часто не могут этого усвоить. Их методы дрессировки отточены несколькими поколениями и передаются от одного к другому — вот способ научить медведя кататься на велосипеде, а вот способ обучить льва издавать рык (если хотите знать — надо выдернуть несколько волосков из его гривы). Эти передаваемые из поколения в поколение «рецепты» считаются лучшими способами, а иногда таковыми и являются, но они часто рассматриваются и как единственные способы, что является причиной того, что цирковые представления чрезвычайно похожи друг на друга.
Однажды один телевизионный деятель, который ставил шоу в океанариуме «Жизнь моря», пригласил меня посетить их ферму в Вирджинии и посмотреть, как тренируют лошадей. Эта знаменитость был превосходным наездником и тренером и у него было несколько прекрасно обученных лошадей. Мы наблюдали, как учили лошадь кланяться, или становиться на одно колено при помощи традиционного метода, включавшего двух людей и множество веревок и кнутов; при помощи этого метода лошадь многократно заставляли становиться на одно колено до тех пор, пока она не научилась опускаться на него сама.
Я сказала, что необязательно делать это таким образом, и утверждала, что могу научить лошадь кланяться, даже не прикасаясь к животному (один из вариантов: нарисовать на стене красное пятно; использовать пищу в качестве условного подкрепления выработки у лошади касания коленом пятна, затем постепенно снижать пятно, приближая его к полу, чтобы лошади пришлось встать на колени, чтобы коснуться его и заработать подкрепление). Телевизионная звезда пришла в негодование от такого наглого заявления — что за мысль!
Если бы существовал другой способ научить лошадь кланяться, он бы знал об этом — нам пришлось два или три раза обойти вокруг сарая, чтоб он немного поостыл.


8. Не кончайте тренировку, не дав положительного подкрепления, это соответствует наказанию


Это не относится к той несистематической (хотя очень значимой и продуктивной) выработке, которая происходит в домашних условиях, — поощрение учения в школе, гостеприимство, подбадривание детей; здесь подкрепление происходит от случая к случаю, без особых правил. Однако в более официальной ситуации — скажем, на уроке или при выработке поведения у какого-либо животного — преподаватель должен уделять свое внимание ученику или классу до конца урока. Это более, чем просто хорошие манеры или хорошая самодисциплина; это — хорошее обучение. Когда субъект старается заработать подкрепление, он, так сказать, вступает в контакт с преподавателем. Если преподаватель начинает болтать с кем-либо из присутствующих, выходит, чтобы поговорить по телефону, или просто мечтает, контакт нарушается. Подкрепление не поступает, хотя обучающийся и не сделал ошибки. Это приносит больше вреда, чем если бы преподаватель просто упустил хороший шанс для подкрепления. Это может плохо сказаться даже на хорошо отработанном поведении, которое осуществляется в это время. Конечно, если вы хотите упрекнуть ученика, перестать обращать на него внимание — лучший способ сделать это.
Дрессировщики дельфинов называют это «тайм-аут» и используют для коррекции неправильного поведения. Забрать корзину с рыбой и уйти на минуту — один из способов сказать дельфину: «Нет!» или: «Неправильно!» Обычно это оказывается очень эффективным — не следует думать, что дельфины не могут огорчаться или раскаиваться, они это могут. Лишение внимания — мощный инструмент, поэтому не применяйте его без должной осторожности и несправедливо.


9. Если навык ухудшается, "возвратитесь к детскому саду" , быстро повторите весь процесс выработки с серией легких  подкреплений


Иногда навык или поведение портятся, а иногда создается видимость их полной потери. Нам всем знакомо это чувство, когда пытаемся говорить на иностранном языке, вспомнить стихотворение или поехать на велосипеде после многолетнего перерыва: это очень выбивает из колеи. Иногда внешние обстоятельства временно полностью, уничтожают хорошо выученное поведение — например, в состоянии испуга невозможно произнести заученную речь, неудачное падение резко нарушает ваши навыки скалолазанья. Иногда на первоначальное обучение накладывается и мешает ему последующее обучение, создавая путаницу — вы стараетесь найти испанское слово, а всплывает немецкое.
Самый быстрый способ исправить такое ухудшение — не биться об него головой, заставляя субъект делать это до тех пор, пока результат не покажется вам удовлетворительным или пока вы не дадите подкрепление, а вернуться к началу процесса выработки и очень быстро снова пройти весь путь, давая подкрепление в новых условиях (спустя двадцать лет, на публике и т. д.) и применяя по одному-два подкрепления на каждом уровне. В океанариуме «Жизнь моря» мы называли это «вернуться в детский сад», и такой прием часто восстанавливал ухудшившееся поведение до нормального уровня за десять-пятнадцать минут. Конечно, так мы всегда и поступаем, когда повторяем материал перед экзаменом или освежаем память, заглянув в текст, прежде чем выходим на трибуну. Полезно помнить, что если вы в состоянии в большей или меньшей степени воспроизвести исходный процесс выработки, то такое повторение одинаково полезно и для физических, и для умственных навыков. Оно действенно как у животных, так и у людей.


10. Заканчивайте каждую тренировку на высокой ноте и в любом случае останавливайтесь, оставаясь впереди обучаемого. 

 

Сколько должен продолжаться каждый сеанс выработки?


Частично это зависит от промежутка времени, в течение которого субъект сохраняет внимание. Кошки часто начинают проявлять беспокойство после, примерно, двенадцати подкреплений, поэтому пяти минут может быть достаточно. Собаки и лошади могут работать дольше. У людей продолжительность различных уроков традиционно равна часу, а занятия футболом, научные семинары и разные другие мероприятия часто длятся целый день.
Когда остановиться, не столь важно, как на чем остановиться. Вы должны всегда прекращать работу, сохраняя ведущее положение. Это относится и ко всему уроку, и к отдельным частям его, когда вы кончаете работать над одним типом поведения и переходите к другому. Вы должны совершать переход на высокой ноте — т. е. сразу как только достигнут успех.


Последнее совершенное действие всегда закрепляется в сознании субъекта; вы должны быть уверены, что это хорошее, вознаграждаемое выполнение. А часто происходит так, что мы получаем три-четыре хороших ответа — собака прекрасно ищет и подает предмет, прыгун в воду впервые выполнил прыжок полтора оборота, певец правильно исполнил трудный пассаж — и мы так возбуждены, что хотим видеть или делать это скова и снова. И мы повторяем это или стараемся повторить, и очень скоро субъект устает, поведение ухудшается, неожиданно возникают ошибки, происходят коррекции и подбадривания, и урок идет насмарку. Наездники-любители поступают так всегда. Вот почему я терпеть не могу смотреть, как люди обучают своих лошадей прыгать; как часто они далеко заходят за черту, где следует остановиться, когда животное выполнило действие хорошо, и прежде, чем поведение не начало снова ухудшаться.


Будучи тренером вы должны, если это необходимо, заставлять себя останавливаться на хорошем ответе. Иногда это требует выдержки. Но на следующем уровне вы можете обнаружить, что принос предмета, сальто при прыжке в воду или вокальное упражнение выполнены не только так же хорошо, как последнее на прошлом уроке, но значительно лучше.


Психологи называют это «латентным обучением». В процессе тренировки возникает некоторый стресс, хотя бы от желания сделать лучше. Этот стресс может влиять на выполнение действия, маскируя реально имеющееся обучение.
В начале следующего урока, прежде чем возникнет стресс, выполнение действия может в действительности быть на шаг впереди по сравнению с тем уровнем, на котором остановились, и тогда вы получаете то, что гораздо более достойно подкрепления.


Формирование поведения таким способом, конечно, противоположно обучению при помощи муштры и повторений. Оно может обеспечить не только стабильный прогресс, но абсолютно безошибочное обучение, и оно может идти чрезвычайно быстро. Однажды я так приучила пони к уздечке за пятнадцать минут, двигаясь непрерывно взад-вперед, формируя пять задач (вперед, остановка, налево, направо и назад). При этом я подкрепляла успех в каждой из них. Как ни странно, возможность такого быстрого обучения зависит от вашей готовности отказаться от временных рамок и постановки специфической цели, цели быстрого прогресса. Вместо этого вы должны быть просто готовы остановиться, оставаясь впереди.

 

(Прайор Карен " Не рычите на собаку")

 

1 Комментарии

Мария:
14.08.2017, 15:47:46
Ответить

Очень "приятно", когда наши с Наташей фото и наработки выкладываются на незнакомом сайте без спросу.

Оставить комментарий