Обучение с подкреплением
Она рассказывает нам, как обучить кого угодно и чему угодно, используя принципы «обучения с подкреплением».
Вначале ряд аксиом:
1. Хотите изменить мир — измените себя!
2. «Всем необходимо внимание!», или «Все хотят есть!»
3. Любое живое существо способно к развитию и стремится к нему.
4. Для большинства людей и зверей состояние невостребованности — некомфортно и тревожно.
5. В состоянии невостребованности большинство людей повторяют одни и те же действия, которые, на их взгляд, решают проблему хотя бы частично. Или повторяют успешные действия окружающих для достижения поставленных задач.
Очевидно, что все мы пытаемся влиять друг на друга, используя для этого любые подручные средства. Чаще всего мы и не знаем, что же мы делаем и что получим в итоге. Главное — немедленно прореагировать.
Карен Прайор выбрала для демонстрации своего метода дельфинов, потому что эти вольные и умные животные могут просто уплыть, если мы будем просто отстаивать самомнение, а не попытаемся с ними договориться. На дельфина нельзя подействовать ни поводком, ни кулаком, ни окриком. Единственное, чем располагает дрессировщик, — ведерко с рыбой (положительное подкрепление)...
К своим детям мы можем применить силу и, к сожалению, часто это делаем, всегда кажется, что это самый короткий путь. Но попробуем изменить свой стиль поведения, будем считать свое семейство семейством дельфинов (аксиома 1).
Итак, что мы имеем: бассейн, зрителей и дрессировщика. Два дельфина свободно плавают в бассейне. В этом месте они уже привыкли получать внимание и еду за выступления. Сейчас им скучно и они проголодались (аксиома 2). Дрессировщица попросила зрителей заказать движения, которым дельфины должны научиться прямо сейчас. Допустим, поступил заказ серому дельфину — бить хвостом вверх-вниз.
А для дельфина коричневого — бить хвостом справа налево. По аксиоме 3, дельфинам некомфортно плавать под молчание зрителей и при отстраненно стоящей дрессировщице. Они начинают нервничать и метаться по бассейну. И вдруг первый дельфин совершенно случайно бьет хвостом сверху вниз, как и было заказано. Мгновенно он получает рыбку. Повторяет хлопанье — ещё рыбка. Таким образом подкрепляется пять хлопков. Второй дельфин тоже хочет есть и пытается повторить действие друга (аксиомы 3 и 5), но рыбки, естественно, не получает, потому что ему это действие не заказывали. Тогда он от досады отмахивается... справа налево — и получает рыбку! Съедает её, думает, осторожно наклоняет хвост вправо-влево. Снова рыбка! Съедает её, думает... Еще три взмаха. Через несколько минут в бассейне плавали два обученных дельфина, совершая каждый по пять желаемых различающихся движений хвостом да ещё и по очереди.
Вот и весь секрет обучения с «подкреплением»: «Поведение, которое встречается, всегда можно усилить с помощью положительного подкрепления». В качестве подкрепления надо выбирать то, что является приятным для объекта обучения. С дельфинами всё просто: рано или поздно они случайно совершают то действие, которое им логично заказать. Успевай только вовремя кинуть рыбку. А вот ждать, когда ребенок сам сядет за уроки, можно лишь до вечера или до очередной двойки.
В следующих «Ступенях» читайте о том, что подкрепление, как и внимание, бывает не только положительным.