Выбрать главу

Точно так же, с помощью образования условного рефлекса, можно связать с каким-нибудь сигналом (словом) и начало наказания (пример: команда «Фу»), и окончание наказания, и окончание поощрения, и даже ситуацию «ничего не происходит», в значении «следует продолжать попытки». С этим значением слова «ищи» мы столкнёмся в ближайшем будущем при изучении этапов дрессировки собаки-детектора.

Кликер-дрессировщики в своей практике избегают прямых наказаний, предпочитая им отмену поощрений или непредоставление поощрений. Они справедливо утверждают, что как только собака понимает суть метода: отказ в поощрении мотивирует её, чтобы пробовать кое-что еще, она охотно экспериментирует с новым поведением. Однако, если неправильный выбор наказан, собака, из-за страха получения нового наказания, может начать сомневаться, стоит ли предлагать другое поведение. «Игнорируйте нежелательное поведение в максимально возможной степени. Каждый раз, когда Вы укрепляете желательное поведение, это походит на добавление денег к счету в банке. Чем больше денег на счету, тем более сильны отношения с вашей собакой. Положительное наказание — даже если оно эффективно — удаляет деньги из этого счета в банке, и это ослабляет отношения.

Если Вы решились использовать физическое наказание, посмотрите на эффект. Действительно ли поведение не только временно приостанавливается, но и случается менее часто? В противном случае это не исправление поведения путём наказания — это злоупотребление властью»[4].

Остаётся сказать о том, что часто называют «расписанием подкрепления». Снова позволю себе обширную цитату, на этот раз из Stacy Braclay-Scheck «Как учатся люди и собаки»: «Расписание подкрепления определяет, как часто поведение надо подкреплять. Есть 5 видов расписания: с фиксированным интервалом (ФИ), фиксированным отношением (ФО), изменяемым интервалом (ИИ), изменяемым отношением (ИО) и произвольное (ПР).

ФИ — фиксированный интервал означает, что подкрепление дается после фиксированного интервала времени. Например, каждые 5 минут. Пример: оплата работы — через каждые 2 недели я получаю чек (т. е. условное поощрение). ИИ — изменяемый интервал означает, что подкрепление дается после варьируемого интервала времени. Иногда это 5 минут, иногда 3, иногда 7 или 1. Моя электронная почта работает в этом режиме — с изменяемым интервалом времени я получаю письма (а для меня это положительные эмоции!). ФО — фиксированное отношение означает, что поведение будет вознаграждаться один раз за N исполнений. Фиксированное отношение 1:3 означает, что каждое третье поведение будет вознаграждено. Этот вид отношения имеет тенденцию ухудшать исполнение поведения у некоторых животных и людей, так как они знают, что первые 2 попытки не будут вознаграждаться, а третья будет вознаграждена несмотря ни на что. Фиксированное отношение 1:1 означает, что каждое правильное исполнение поведения будет вознаграждено. ИО — изменяемое отношение означает, что вознаграждение будет выдаваться, основываясь на каком-то среднем количестве правильных исполнений поведения. Изменяемое отношение 1:3 означает, что в среднем одна из трех попыток будет вознаграждена. Поощряться может первая попытка, а может и третья. Это отношение часто называется изменяемое расписание подкреплений. Произвольное расписание означает, что нет никакой очевидной связи между поведением и его последствиями. По этому принципу работает Фортуна».

вернуться

4

Подсказки для успеха. Melissa Alexander