Вступ
Ця книга здійснила справжній переворот у біології та психології у 1980-х. Карен Прайор не просто висунула, а й успішно довела гіпотезу про те, що дресирувати можна будь-яку живу істоту, від примітивного морського гребінця до високоінтелектуального академіка з IQ, як у Ейнштейна. У книзі пропонуються нескладні принципи навчання із підкріпленням. Вони довели свою ефективність на спортивних тренуваннях, репетиціях театральних труп, у загальноосвітніх школах та у сімейному вихованні. Принципи навчання з підкріпленням корисні й у самоосвіті.
Автор зазначає, що навчання з підкріпленням – не панацея від усіх життєвих неприємностей. Воно не вирішує медичні, генетичні та глибокі психологічні проблеми. Але допомагає ефективно формувати потрібні навички, відучувати від шкідливих звичок та налагоджувати стосунки з оточуючими.
Карен Прайор переконана, що людина, яка вміє дресирувати тварин, чудово впорається і з дітьми. У всіх її знайомих дресирувальників дельфінів дуже милі та виховані діти.
1. Підкріплення
Підкріплення буває двох типів: позитивне та негативне. Позитивне підкріплення – це те, що суб’єкт дресирування хоче отримати: їжа, схвалення та ласка. А негативне підкріплення – це те, чого він хотів би уникнути: неприємний звук (наприклад, якщо ви забули пристебнути ремінь у машині), ляпанці та грізний вираз обличчя.
1.1. Позитивне підкріплення
Позитивне підкріплення – це те, що збігається в часі з певною дією і веде до підвищення ймовірності повторного вчинення цієї дії. Поведінка, яка зустрічається іноді, можна посилити і відрегулювати за допомогою позитивного підкріплення.
Ви кличете кішку. Вона підходить, і ви її гладите. Чим частіше це відбувається, тим більше шансів, що тварина знову прийде на поклик, щоб отримати приємні відчуття.
У відносинах із людьми позитивне підкріплення діє так само.
Ваш дорослий син дзвонить вам раз на тиждень. Ви хочете, щоб він дзвонив вам хоч би через день. Якщо ви виражатимете радість з приводу кожного дзвінка, він, швидше за все, дзвонитиме частіше. Але якщо ви скаржитиметеся і бурчатимете, що син вас не любить і не поважає, спрацює негативне підкріплення. Він буде дзвонити якомога рідше, щоб не відчувати негативних емоцій.
Будь-яке підкріплення щодо.
Їжа не буде позитивним підкріпленням, якщо ви ситі. Посмішки та похвали марні, якщо суб’єкт хоче вивести вас із себе, роздратувати або засмутити.
Як підкріплення треба вибирати те, що потрібно суб’єкту на даний момент. Для будь-якої тренувальної ситуації корисно передбачити кілька підкріплень.
Дельфінів можна підкріплювати різними способами: рибою, погладжуванням або чуханням, увагою оточуючих та іграшками. Тварина не знає, яка поведінка буде підкріплена наступного разу і якою буде підкріплення. Тому уявлення в океанаріумах можуть відбуватися без підкріплень рибою.
Позитивне підкріплення приносить користь і людських відносинах. На ньому ґрунтується мистецтво робити подарунки: треба вгадати, що викличе радість у одержувача подарунка. Правильний вибір стає підкріпленням як обдаровуваного, так дарувальника.
1.2. Негативне
підкріплення Негативні підкріплення можуть бути різними за інтенсивністю: від легкого протягу, що походить від кондиціонера в кафе, що викликає відчуття дискомфорту і змушує переміститися за інший столик, до таких крайнощів, як удар електричним струмом або хлистом. Покарання відбувається після певної поведінки. Тому ви не можете його уникнути, змінивши свою поведінку.
Школяр, якого сварили за двійку, може потім вчитися краще чи гірше, але не може змінити оцінку, за яку було покарано.
А негативне підкріплення небажаного вчинку можна припинити, якщо змінити поведінку.
Діти бігають по будинку, галасують і перекидають стільці. Але вони помічають похмурий погляд батька та зупиняються. Він перестає хмуритися і підбадьорливо посміхається. І цим позитивно підкріплює спокійну поведінку дітей.
1.3. Правила підкріплення
Позитивне та негативне підкріплення підпорядковуються однаковим правилам. Вони мають бути:
Своєчасними .
Підкріплення – це інформація. Воно каже суб’єкту, що саме вам подобається чи не подобається.
Вигуки тренера «Так!» або «Добре!» дають спортсмену інформацію про правильність виконання певного руху. А ось «розбір польотів» у роздягальні після тренування не надто ефективний.
Батьки часто підкріплюють дітей зарано, намагаючись їх підбадьорити: «Молодець, ти вже майже правильно все зробив». Скарги дітей на кшталт “Я не можу, у мене не виходить” – ознака того, що батьки підкріплювали спроби, а не поведінку, яка дає результат. Тому діти не прагнуть позитивного результату, а продовжуватимуть робити спроби випросити нові підкріплення.
Мінімальними.
Що менше підкріплення, то краще. Маленьке підкріплення не тільки заощаджує час, але й дозволяє дати більшу кількість підкріплень за один сеанс, перш ніж тварина насититися.
Курча ефективно підкріплюють одне-два зернятка, а слона – половинка яблука. Улюбленої їжі можна давати ще менше: наприклад, чайну ложку зерна для коня.
Незважаючи на те, що мінімальні підкріплення найбільш ефективні, іноді суб’єкту корисно давати великий куш — нагороду, яка в кілька разів більша за звичайне підкріплення і дається несподівано. Куш здатний розвеселити, підбадьорити та підвищити мотивацію суб’єкта.
Несподівані вечірки без приводу, які 1-2 рази на рік влаштовуються робочий час в офісі, сприяють підняттю бойового духу.
Отримання всього одного куша може поліпшити поведінку непокірного, зляканого або суб’єкта, що опирається, який раніше не демонстрував потрібної поведінки.
Автор згадує, що у 15 років вона була страшенно грубою з батьком та мачухою. Якось увечері батьки сказали їй, що втомилися від її жахливої поведінки, тож вирішили її нагородити. І подарували їй квиток на 10 уроків верхової їзди, про яку вона мріяла. Незаслужений куш змінив поведінку Карен, бо вона перестала вважати себе скривдженою.
1.4. Умовне підкріплення
Часто буває так, що підкріплення неможливо дати в той момент, коли суб’єкт виконує бажану дію.
Коли дельфін вчиться стрибати, заохотити його високий або якісний стрибок у момент виконання не вийде. Якщо йому дати рибу після завершення стрибка, він, можливо, вирішить, що підкріплення можна отримати, якщо стрибати частіше. Як же пояснити дельфіну, на яку висоту та з яким прогином стрибати?
У цьому випадку використовують умовне підкріплення – будь-який сигнал, що спочатку не пов’язаний з дією (звук, світло, рух), але який навмисне з ним пов’язують.
Тренери дельфінів використовують поліцейський свисток: руки вільні, а звук чути навіть під водою. З собаками та кіньми ефективно працюють слова «хороша конячка (собака)». Шкільні вчителі говорять «дуже добре» чи «молодець» — і діти трудяться заради цих слів.
Умовне підкріплення виробляється ще до того, як ви починаєте формувати поведінку. Умовне підкріплення поєднують із істинним, наприклад, з їжею чи погладжуванням. Після того як умовне підкріплення вироблено, воно стає цінним саме собою, без первинного підкріплення.
Коні та собаки можуть відпрацювати весь виступ лише на умовному підкріпленні. І люди вже давно не працюють за їжу. А гроші — не що інше, як умовне підкріплення, що означає речі, які можна купити.
Умовне негативне підкріплення – ефективний виховний засіб.
Кішку можна навчити реагувати на слово “ні”, якщо поєднувати його з гучними звуками. Тварини дряпають меблі? Впустіть на підлогу металеву тацю і голосно скажіть: «Ні».
1.5. Варіабельне підкріплення
Постійне підкріплення потрібно лише під час навчання. Через деякий час у ньому вже немає потреби.
Коли ви вчите дитину кататися на велосипеді, ви постійно щось кажете: «Тримай кермо рівно!» або «Молодець!» Після того, як навичка закріпилася, ці слова вже не потрібні.
Щоб підтримувати сформовану поведінку, краще припинити її регулярно підкріплювати, а використовувати підкріплення епізодично. Такий режим підкріплення називають варіабельним .
Якщо заохочувати кожен стрибок дельфіна, він почне стрибати абияк. Якщо зовсім не давати риби, він перестане стрибати. Але якщо підкріпити перший стрибок, а потім вибірково деякі стрибки, дельфін виступатиме на вищому рівні, намагаючись заслужити рибу. Такий режим дозволяє підкріплювати найсильніші стрибки і таким чином відточувати майстерність вихованця.
Варіабельне підкріплення не працює лише в одному випадку: якщо воно пов’язане із вирішенням тестів чи головоломок.
Коли ми відгадуємо кросворди або складаємо пазли, ми отримуємо підкріплення за правильні слова та деталі, оскільки вони єдино вірні.
1.6. Випадкове підкріплення
Підкріплення відбуваються у нашому житті постійно. І найчастіше вони виникають випадково.
Біолог, який вивчав поведінку яструбів, зауважив: якщо яструб упіймав під якимось кущем мишу, він постійно під нього заглядатиме протягом кількох днів.
Випадкові підкріплення впливають на нашу поведінку, але не завжди приносять користь. Іноді людина поводиться певним чином, тому що вірить, що її поведінка принесе той чи інший результат. Це називається забобонною поведінкою.
Деякі люди впевнені: якщо вони гризтимуть олівець, їх відвідають розумні думки.
1.7. Підкріплення своєї поведінки
Іноді ми надто суворо ставимося до себе, набагато суворіше, ніж до інших людей. В результаті працюємо без вихідних, у багатозадачному режимі та вважаємо, що так і має бути. Ми не думаємо про те, що себе потрібно підкріплювати, хвалити та заохочувати. Як наслідок, страждаємо від неврозів та депресії.
Зміну звички або освоєння корисної навички можна підкріплювати різними способами: походом у кіно чи театр, прогулянкою, зустріччю з друзями чи гарною книгою. Але не варто вдаватися до хворих способів підкріплення: сигарет, алкоголю, шкідливої їжі.
2. Вироблення необхідної поведінки
Підкріпити поведінку, яка й так відбувається іноді, нескладно. Але як змусити тварину чи людину робити те, що вона ніколи раніше не робила? Як лев зрозуміє, що йому потрібно стрибнути через обруч, що горить? Вироблення полягає в тому, щоб використовувати незначні зміни поведінки суб’єкта та поступово рухатися до поставленої мети.
2.1. 10 правил виробітку
Процес виробітку підпорядковується десяти правилам. Перші чотири з’явилися в результаті лабораторних експериментів, решта – у процесі практичної діяльності.
• Підвищуйте критерій поступово, щоб суб’єкт завжди мав можливість виконати необхідне та отримати підкріплення.
Якщо кінь бере бар’єр 60 сантиметрів, його можна збільшити до 70-75 сантиметрів. Але піднявши планку до метра, ви провокуєте появу у коня шкідливої звички. Вона почне або різко зупинятися перед бар’єром або його ламати.
• У певний проміжок часу відпрацьовуйте щось одне, не намагайтеся формувати дві навички одночасно.
Можна працювати над багатьма різними типами поведінки однією занятті, щоб уникнути монотонності і нудьги. Працюючи над певним типом поведінки, потрібно скористатися у кожен час лише одним постійним критерієм.
Якщо, навчаючи дельфіна робити фонтан бризок, ви спочатку не дасте йому підкріплення, тому що фонтан недостатньо великий, а в інший раз – тому, що він б’є не в тому напрямку, дельфін не зрозуміє, що від нього потрібно. Одне підкріплення повинне містити один тип інформації. Спочатку потрібно відрегулювати висоту фонтану, а потім формувати його напрямок. І лише коли обидва критерії встановлені, можна вимагати від дельфіна дотримання обох.
• Перш ніж підвищити планку, варіативно підкріплюйте виконання цієї дії.
Хороше вироблення – це серія ледь помітних переходів між безперервним (коли навичка або новий рівень тільки формується) і варіативним підкріпленням (коли навичка вже закріпилася і потрібно вибірково підкріплювати найкращі дії).
Ви дресирує собаку стрибати через бар’єр. Спочатку ви заохочуєте кожен стрибок. Потім, коли навичка сформована і собака стрибає без помилок, ви заохочуєте лише деякі стрибки. І тільки потім можна піднімати планку бар’єру та знову переходити до безперервних підкріплень.
• Вводячи новий критерій, тимчасово ослабте старі.
У нових обставинах чи під впливом нових вимог суб’єкт може «забути» те, що вмів і знав раніше.
Коли ви переміщаєте дельфіна в інший басейн, йому потрібний час, щоб звикнути до нової обстановки. У цей період не можна лаяти дельфінів за помилки, і вони незабаром пройдуть самі собою.
• Плануйте свою програму вироблення повністю. У разі швидкого успіху ви повинні знати, що робити далі.
Традиційна школа розрахована на середню дитину, та інші діти не можуть вчитися у своєму власному темпі. Повільні школярі не встигають засвоїти матеріал у відведений час, а здібних та швидких учнів ніяк не підкріплюють, і вони нудьгують на уроках. В результаті й повільні, і швидкі діти не люблять школу. Часом вулиця стає для них привабливішим місцем.
• Не змінюйте тренерів під час програми.
Якщо змінити вчителя в момент, коли навичка ще не сформована, швидше за все, ви спостерігатимете регрес у навчанні. Поміняти вчителя варто, тільки якщо навчання зайшло в глухий кут.
• Якщо одна процедура вироблення не приносить успіху, знайдіть іншу.
Пам’ятайте: потрібної поведінки можна досягти різними способами.
Навчання дітей плавання починається з того, що їх навчають не боятися води. Одні тренери просять дітей пускати бульбашки у воду, інші опускати у воду обличчя, треті присідати у воді так, щоб вода накривала їх з головою. Хороший тренер змінить метод, якщо побачить, що дитина боїться.
• Не закінчуйте тренування без позитивного підкріплення. Його відсутність сприйматиметься суб’єктом як покарання.
Вчитель має приділяти увагу дітям, а дресирувальник – тваринам до кінця уроку чи тренування. Якщо він відволікається на щось, наприклад, розмовляє телефоном, контакт порушується, і суб’єкти не отримують підкріплення. Це може призвести до погіршення вже виробленої поведінки.
Чемні та слухняні діти можуть почати балуватися і шуміти, якщо побачать, що вчитель не звертає на них уваги, а займається своїми справами.
• Якщо навичка погіршується, поверніться до початку та швидко повторіть весь цикл вироблення з підкріпленнями.
Кожен із нас стикався з ситуацією, коли та чи інша навичка здається втраченою: після 20-річної перерви важко їздити велосипедом або спілкуватися іноземною мовою. В цьому випадку корисно почати з нуля: наприклад, поїздити велосипедом з повною, а потім — з частковою підтримкою.
• Закінчуйте кожне тренування на піку успіху. Остання дія закріплюється у свідомості суб’єкта, тому це має бути успішна дія.
Часто буває так: ми отримуємо три-чотири успішні дії — собака знаходить і приносить ціпок, стрибун у воду вперше виконує складний стрибок у півтора оберти, музикант правильно виконує важкий твір. І ми такі щасливі, що хочемо, щоб це повторювалося знову і знову. Але незабаром суб’єкт втомлюється і починає робити помилки. Ми його підбадьорюємо та вмовляємо, а потім злимося та закінчуємо тренування.
Дуже важливо вчасно зупинити тренування: коли суб’єкт ще не надто втомився.
Кішки втомлюються приблизно через 5 хвилин або 12 підкріплень, коні та собаки – трохи пізніше. У дитини залежно від віку активна увага триває від 10 до 30 хвилин. Дорослий може витримати годину, якщо цікаве заняття.
Якщо ви навчитеся зупинятися на правильній дії, суб’єкт його запам’ятає та успішно розпочне наступне тренування.
2.2. Управління за допомогою стимулів
Коли поведінка сформована, ним можна керувати за допомогою стимулів. Стимул це те, що викликає поведінкову реакцію. Деякі стимули викликають реакцію без тренування: ми здригаємося від гучного звуку або жмуримося від яскравого світла. Такі сигнали називають безумовними стимулами.
Інші стимули будуються на асоціаціях. Самі собою вони не мають сенсу, але після тренування стають сигналами для певної поведінки, наприклад, зелений сигнал світлофора змушує нас переходити дорогу. Такі сигнали називають умовними стимулами.
Для того щоб керувати поведінкою за допомогою сигналів, треба сформувати потрібну поведінку, а потім зробити так, щоб вона відбувалася під час або відразу після певного сигналу.
Повний контроль за допомогою стимулів визначається чотирма умовами.
• Поведінка завжди здійснюється одразу після подачі умовного стимулу.
Собака сідає, коли їй наказують.
• Поведінка ніколи не виникає у відсутності стимулу.
Під час занять чи роботи собака ніколи не сідає спонтанно.
• Поведінка ніколи не спостерігається у відповідь на інші стимули.
Якщо ви кажете «Лежати!», собака не повинна сідати.
• Жодна інша поведінка не виникає у відповідь на цей стимул.
Коли ви кажете «Сидіти!», собака не повинна лягати чи стрибати.
3. Навчання. Вісім методів звільнення від небажаної поведінки
Підкріплення можна використовувати не тільки для того, щоб сформувати потрібну поведінку, але і для того, щоб позбавитися небажаної поведінки. Щодня ми стикаємося з небажаною поведінкою: діти кричать і не дають працювати, собака гризе взуття, чоловік розкидає шкарпетки по квартирі. Ось вісім методів, які допоможуть впоратися з такою поведінкою. Перші чотири методи – негативні, інші – позитивні:
Метод 1. «Вбити звіра»
Цей метод найрадикальніший. Він фізично не дає суб’єкту продовжувати вчиняти небажані дії.
Існує багато варіацій методу 1: відправити дитину до її кімнати, коли вона втручається у розмову дорослих; прив’язати собаку, щоб він не кидався на людей; посадити людину у в’язницю.
Метод 1 має один великий мінус: він не вчить правильної поведінки.
Дитина, яку замкнули, навчиться ображатись і боятися, але так і не зможе нормально спілкуватися. Собака продовжить кидатися на людей, коли його відпустять. А злодій, швидше за все, знову щось вкраде та потрапить до в’язниці.
Метод 1 хороший як тимчасове рішення: коли немає можливості застосувати інші методи.
Дитину садять у манеж, якщо мати з нею одна вдома і їй треба займатися домашніми справами. А щенят замикають на ніч у клітці, щоб вони не залишали калюжі на килимі.
Метод 2.
Це дуже популярний метод.
Призначити штраф, відшльопати дитину, накричати на підлеглого, оголосити війну…
Метод 2, як і метод 1, не вчить, як змінити поведінку.
Покарання не покаже дитині, як отримати вищі оцінки. Можливо, у дитини зміниться мотивація, і вона змінить поведінку, щоб уникнути покарання у майбутньому. А тварини не спроможні аналізувати ситуацію. Після покарання вони продовжуватимуть поводитися, як раніше.
Метод 3. Негативне підкріплення
Це будь-яка неприємна подія чи стимул, дію якого можна припинити, змінивши поведінку.
Ми змінюємо положення тіла, коли нам незручно сидіти чи стояти. Ми прагнемо швидше опинитися у приміщенні, коли починається дощ.
Негативне підкріплення, на відміну покарання, відбувається під час поведінки, а чи не після нього, тобто безпосередньо з нею пов’язано.
Люди часто використовують негативне підкріплення: суворий погляд, несхвальне зауваження. Занадто часто застосування негативного підкріплення призводить до появи у суб’єкта змін у характері: від нападів люті до підвищеної тривожності і невпевненості в собі. Дуже важливо навчитися припиняти негативне підкріплення, якщо поведінка суб’єкта трохи покращала.
Трирічна дитина б’є маму та каже, що ненавидить її. Негативне підкріплення з боку матері це припинення спілкування. Коли малюк заспокоїться, мати обійме його та почне розмовляти з ним про щось інше.
Метод 4. Згасання
Цей метод у тому, що за відсутності підкріплення поведінка стає менш активним, та був зникає.
Щоб навчити щура натискати на кнопку, дресирувальник використовував їжу. Спочатку щур часто повторював трюк, щоб отримати їжу. Потім, коли їй перестали давати підкріплення, вона почала робити це рідше, і, зрештою, зовсім перестала.
Але поведінка людини не завжди згасає без підкріплення. У реальному житті, на відміну від лабораторії, є стимули, що підтримують небажану поведінку.
У людських взаєминах згасання найефективніше у мовному поведінці. Їли не звертати уваги бурчання, скиглі та погрози, вони, як правило, припиняються.
Метод 5. Вироблення несумісної поведінки
Суть методу полягає в тому, щоб навчити суб’єкта іншій поведінці, яка несумісна з небажаною.
Собака випрошує їжу на кухні? Можна її замикати на час сніданку, обіду та вечері, використовуючи метод 1. Але краще навчити її лежати на порозі кухні, коли люди їдять. Навчіть її виконувати команду «Іди ляг!». Одночасно лежати на порозі та випрошувати їжу біля столу неможливо.
Цей метод активно застосовується на тенісних тренуваннях: неправильно поставлені удари поступово замінюються правильними, оскільки неможливо виконувати і ті, й інші одразу.
Метод 6. Асоціювання поведінки з сигналом
Спочатку суб’єкта вчать виконувати дію, якого хочеться позбутися, строго за сигналом. А потім перестають давати цей сигнал.
Авторка застосовувала цей метод, коли потрібно було заспокоїти дітей у машині. Вона їм казала: «Давайте спробуємо шуміти якнайголосніше!» Спочатку всім весело, все кричать, але це швидко набридає. Після двох-трьох повторів тиша у машині забезпечена надовго.
Метод 7. Формування відсутності
Цей метод підійде, якщо у вас немає мети отримати від суб’єкта конкретну поведінку чи результат, а ви просто хочете, щоб він припинив поведінку, яка вам неприємна.
Мати Карен багато років провела у лікарні. Дочка не могла відвідувати її щодня, але довго розмовляла з матір’ю телефоном. Ці розмови були болісними: мати скаржилася на хвороби і самотність, плакала і звинувачувала Карен у всіх своїх бідах. Після довгих років такого спілкування Карен застосувала метод 4 (згасання) та метод 7 (формування відсутності). На скарги вона відповідала «Хм» і «Так», але з ентузіазмом реагувала на питання про дітей, друзів та роботу. За два місяці мати Карен перетворилася на колишню, якою вона була до хвороби. Вона стала позитивною та дотепною.
Метод 8. Зміна мотивації
Це основний і найефективніший метод позбавлення небажаної поведінки. Мотивацію небажаної поведінки не завжди легко визначити. Потрібно уважно спостерігати за тим, що впливає на зміну поведінки, а що ні. Найпоширеніші причини небажаної поведінки – це голод, хвороба, самотність чи страх.
Багато дітей смокчуть палець. Це ознака занепокоєння. Заборони та покарання не діють. Але як тільки малюк перестає боятися і знаходить впевненість у собі, звичка зникає.
Висновок
Дресирування піддаються всі живі істоти. Особливо ефективним є навчання з підкріпленням певних дій. Позитивне підкріплення – це те, що суб’єкт дресирування мріє отримати, а негативне підкріплення – те, чого він уникає.
Для того щоб ефективно дресирувати тварину та людину, потрібно давати підкріплення без затримки та у невеликих кількостях. Але іноді, підвищення мотивації, корисно давати суб’єкту великий куш — заслугу, розмір якої у кілька разів більше простого підкріплення.
Якщо підкріплення з якоїсь причини неможливо дати у потрібний момент, його замінюють умовним підкріпленням – звуком чи словами, що асоціюються із реальним підкріпленням. Коли навичка сформована, постійне підкріплення змінюється варіабельним, яке дається іноді.
Виробити нову поведінку можна, помічаючи незначні зміни у поведінці та спрямовуючи їх до поставленої мети. Коли поведінка сформована, ним можна керувати за допомогою умовних стимулів – сигналів, що асоціюються з конкретною поведінковою реакцією.
Підкріплення дає можливість як сформувати нове поведінка, а й назавжди чи тимчасово припинити небажане поведінка. Тренер сам вибирає, які методи застосовувати, негативні («вбити звіра», покарання, негативне підкріплення чи згасання) чи позитивні (вироблення несумісної поведінки, асоціювання поведінки із сигналом, формування відсутності чи зміну мотивації).