Сколько нужно "граммов пряника" и какова "длина кнута"?
Сколько нужно "граммов пряника" и какова "длина кнута"?
Отрицательное подкрепление является одним из основных элементов тренинга лошади, и связано оно не с жестокостью и наказанием (как несправедливо думают многие начинающие всадники), а с использованием средств управления.
Так, например, обучая лошадь уступать давлению, мы применяем к ней давление (стимул) и вознаграждаем лошадь, когда она уступает. Вознаграждением выступает устранение стимула. И это лежит в основе всех средств управления. Каждое "давящее" средство управления в принципе можно рассматривать как отрицательное подкрепление. Вознаграждение лошади за ее правильную реакцию - это удаление стимула.
Очевидно, что отрицательное подкрепление не так уж и отрицательно, ведь лошадь, когда на нее воздействуют шенкелем, не ржет на всю округу «Опомнись, Человече!». Если вы используете его правильно, то оно представляет собой мягкое давление, которое быстро удаляется, как только лошадь выполнит то, что от нее требовалось.
Когда определенному средству управления нужно придать особый акцент, применяют такие вспомогательные средства, как хлыст и шпоры. При этом необходимо понимать, как правильно пользоваться этими инструментами.
И хлыст, и шпоры являются средствами тренинга. Они действуют как истинное отрицательное подкрепление и должны использоваться как таковое. Лошади по своей природе невероятно чувствительные существа. Конечно, некоторые из них более чувствительны, некоторые менее, но они все чувствуют, когда муха садится на их шкуру. Они чувствуют вашу шпору и хлыст.
Очень часто можно наблюдать следующий сценарий работы с хлыстом: инструктор говорит ученику, что нужно "оживить" лошадь, которая утратила энергию, хлыстом, и ученик послушно соглашается. Он несколько раз ударяет лошадь, а та в свою очередь продолжает двигаться, как двигалась, или дает посредственную ответную реакцию. Ученик удовлетворен тем, что выполнил наставление инструктора, но основной урок, который получила при этом лошадь, - десенсибилизация. Лошадь только что научилась игнорировать хлыст, не реагировать на него, что полностью противоречит истинной цели всадника.
То же самое происходит и со шпорой - ученик будет привыкать поддерживать любой аллюр при помощи шпор вместо того, чтобы использовать их лишь для того, чтобы усилить реакцию лошади на любое средство управления. Шпора, которая, как предполагается, должна усиливать реакцию на седалище или шенкеля, если лошадь вяло реагирует или игнорирует их, вместо этого становится средством управления сама по себе. Со временем всаднику придется использовать все более строгие шпоры или активнее и чаще работать хлыстом. Лошадь теряет чувствительность, и мы начинаем двигаться в противоположном направлении от нашей цели - чувствительной лошади, правильно и четко реагирующей на легчайшее воздействие средств управления.
Говоря об ответных реакциях, нужно помнить о том, что важнейшее значение для целей обучения имеет и тип реакции.
Еще один распространенный сценарий: всадник использует хлыст или шпору, а лошадь в ответ хвостит, машет головой (в крайнем случае - отбивает), всадник прекращает воздействие, довольный, что у лошади возникла реакция. Но последнее, чего вам хотелось бы, - это ехать на лошади, которая вяло двигается, но рьяно хвостит. Так почему такая реакция должна радовать?
Реакция – это хорошо. Она говорит вам о том, что ваша лошадь думает. Но вам нужно, чтобы вы работали с одним и тем же набором правил. Какое средство управления вы использовали, прежде чем использовать хлыст или шпоры? Чего вы хотели? Движения вперед, сбора, поворота, уступки шенкелю? Не все всадники по-настоящему четко понимают это. Но только зная, чего вы хотите, вы сможете судить, была ли реакция лошади такой, какой вам хотелось.
Положительное подкрепление также важно, но его следует дозировать.
Так, например, молодых и небезопасных лошадей я буду работать, активно используя голосовые сигналы. Я говорю с ними, чтобы придать им ощущение уверенности, слежу за тем, чтобы мое дыхание и мышечный тонус не стали причиной появления у них напряженности (вы удивились бы, узнав, как часто ваша лошадь задерживает дыхание, когда его задерживаете вы, и наоборот). С такими лошадьми я щедра на звуковое вознаграждение.
Но по мере того, как лошадь становится все более опытной и уверенной, я буду говорить с ней и вознаграждать ее голосом все меньше и меньше. И не потому, что я буду ею менее довольна, а потому, что хочу, чтобы мое положительное подкрепление оставалось таким же мощным инструментом, как и отрицательное. Если я буду каждую тренировку по сто раз говорить «Браво!» или «Хороший мальчик!», то вскоре лошадь перестанет реагировать на эту похвалу, звуковые сигналы для нее перестанут быть чем-то особенным. Я же хочу, чтобы лошадь знала, когда я довольна. Это прекрасно работает, когда вы обучаете лошадь новому навыку, лошадь напрягается, но совершает попытку и делает это успешно. Последовательная похвала невероятно важна для создания уверенности и творит чудеса, психологически готовя лошадь, настраивая ее на следующую попытку. Если бы я болтала, не переставая, на каждой тренировке, то мои слова утратили бы свое положительное влияние на психическое состояние лошади.
Итак, и кнут, и пряник, эти отрицательные и положительные стимулы, работают только тогда, когда пряник остается все таким же желанным и сладким, а кнут - неприятным. Нам стоит работать с нашими лошадьми спокойно, без острых негативных реакций или шумной болтовни. Это даст нашим лошадям свободу и способность слушать то, что мы на самом деле должны сказать.
Бонни Уолкер (источник); перевод Валерии Смирновой.