Pozitivní posilování aneb co nás trenéři delfínů naučili o výcviku psů
Pojmy jako pozitivní motivace, pozitivní posilování, klikrtrénink a tvarování (anglicky shaping) se v moderní kynologii stávají čím dál populárnějšími a během několika posledních let si v "příručním slovníku kynologie" vydobyly nezastupitelné místo. Metodika pozitivního posilování ale není ničím novým, rozvíjet se začala přibližně od padesátých let minulého století. O to, že se z výzkumných laboratoří a vědeckých kruhů dostala do povědomí i (a nejen) kynologů, se zasloužili zejména trenéři mořských savců v amerických akváriích.
Mořští savci a divoká zvířata mají oproti domestikovaným zvířatům, mezi které patří i psi, tu zvláštnost, že je téměř nemožné donutit je k spolupráci nátlakem a tresty. Vyvine-li na nedomestikované zvíře trenér nátlak, jedinou myšlenkou zvířete je, jak ze situace uniknout - tato zvířata nejsou schopná tresty akceptovat, a už vůbec ne se z nich poučit nebo se trestáním něco naučit. Chcete-li tedy takové zvíře přinutit ke spolupráci nátlakem, musíte mu odebrat možnost úniku - například pomocí ohraničení cirkusové arény mřížemi. Tento princip se ovšem u mořských savců uplatňuje velmi obtížně.
Prvním důvodem je fakt, že pokud se třeba takový delfín rozhodne nespolupracovat, vždycky má možnost odplavat na druhý konec nádrže a tam se potopit ke dnu - možnost úniku má tedy téměř vždycky.
Druhým důvodem je mimořádná inteligence mořských savců. Taková kosatka váží 6 tun, člověka je schopná zabít jediným cvaknutím zubů a její inteligence je někdy srovnávána s desetiletým dítětem - je si tedy velmi dobře vědoma všech výhod, které nad trenérem má. Chcete-li tedy, aby s vámi například kosatka spolupracovala, musí tato spolupráce probíhat na základě svobodné vůle - to, jestli s vámi spolupracovat bude nebo ne, je výhradně její rozhodnutí - trenér nemá jinou možnost, než toto rozhodnutí respektovat. Zvíře trénované metodikou pozitivního posilování tedy spolupracuje, protože samo chce, ne protože musí. Co ale trenér ovlivnit může, je motivace zvířete ke spolupráci - a motivací je již zmiňovaná odměna (v terminologii operantního podmiňování pozitivní posílení), kterou zvíře za svůj výkon dostane. Odměnou může být prakticky cokoliv, o co zvíře v danou chvíli stojí. Při výcviku nedomestikovaných zvířat se nejčastěji používá jídlo, a z hlediska tréninku má taková odměna bezesporu řadu výhod. Jídlo ale ani zdaleka není jedinou možností odměny, a ocitnete-li se při tréninku v situaci, kdy jídlem prostě nemůžete zvíře motivovat, rozhodně to neznamená, že metodikou pozitivního posilování trénovat nemůžete. Aby ale jídlo jako odměna za provedený výkon odpovídalo definici pozitivního posílení, je třeba splnit několik podmínek, ty si probereme později.
A jak Ty vlastně cvičíš psa?
Můj kamarád, který v předchozích letech působil jako psovod u Policie ČR a stal se velkým příznivcem pozitivního posilování při výcviku psů, odpovídá na otázku: "A jak Ty vlastně cvičíš svého psa?" těmito slovy: "Představte si, že místo toho, aby vás policejní hlídka zastavila a dala vám pokutu za překročení povolené rychlosti, by vás hlídka v případě, že byste jeli do 50km/h, zastavila a na místě vám vyplatila 10 000,-Kč. Kladným důsledkem této akce by byla rychlost vozidel při průjezdu onou obcí, protoře by přes ni všichni řidiči jezdili maximálně 50km/h, záporným pak skutečnost, že by byla místní komunikace okamžitě zahlcena řidiči usilujícími o odměnu. Šance na odměnu by totiž k průjezdu obcí přilákala i řidiče, kteří původně chtěli jet jinou trasou, ochotně a rádi by ji ale pod vidinou odměny změnili." Tento příklad - jakkoliv je pro nás jako občany ČR těžko představitelný - je současně i nejvýstižnějším popisem pracovní náplně trenérů mořských savců. Z popsaného příkladu si můžeme vyvodit následující: úkolem dopravní policie je kontrolovat účastníky silničního provozu, potrestat řidiče pravidla porušující, a ignorovat ty, kteří pravidla dodržují ("v pořádku, jeďte"), úkolem trenérů zvířat pak je pronásledovat své svěřence, aby je mohli odměnit za chování, o něž usilují, které u nich chtějí budovat, a chování nežádoucí ignorovat - samozřejmě v případě, že to vůbec nějakým způsobem jde.
Proč pozitivní posilování?
V předchozím odstavci jsem vás seznámil jen s tím nejpodstatnějším, jen se základy principu pozitivního posilování. V lidech, kteří s metodikou pozitivního posilování nemají zkušenost (ale se psy pravidelně pracují), vzbuzují tyto informace pocit "nedůvěry" a chtějí znát odpovědi na celou řadu otázek. Vyberu tedy z nejčastěji kladených dotazů ty nejpodstatnější - takové, které budou zároveň i odpovědí na základní otázku Proč pozitivní posilování nesmést ze stolu - a pokusím se na ně odpovědět nejen na následujících řádcích, ale i v samostatném článku. Jeho téma bude "Často kladené otázky", ale vynasnažím se vám odpovědět i na ostatní opakující se dotazy.
Otázka č. 1: Pokud je motivací pro spolupráci výhradně odměna, znamená to, že musím psa odměnit pokaždé, když splní povel? A poslechne mne pes, i když ví, že u sebe žádnou odměnu nemám?
Nemusíte ho odměnit pokaždé, a poslechne, budete-li postupovat metodicky správně. Dokonce není žádoucí odměňovat zvíře za každý splněný povel. Ve fázi nácviku, kdy se pes chování učí (např. tvarováním, o tom v dalších dílech), je nutné každý úspěšný pokus odměnit. Ve fázi, kdy již má pes chování upevněné a pod kontrolou signálem, přejděte na tzv. proměnlivý rozvrh odměn, tzn. neodměňujte každý splněný povel, ale postupně cca každý druhý, pak každý třetí atd. Ve skutečnosti není pro zvíře motivací odměna jako taková, ale šance na její získání. Během času pak v rámci proměnlivého rozvrhu můžete odměny téměř odbourat a odměnit psa jen jednou za čas - tak, aby dané chování pro zvíře neztratilo hodnotu, aby pro něj stále šanci na odměnu znamenalo. Kdybychom totiž ve stadiu upevněného chování psa odměňovali za každé splnění povelu, připravili bychom se o moment překvapení, a navíc by se zvíře při výcviku brzy začalo nudit. Postupné odbourávání odměn je nezbytné nejen proto, aby pes pracoval i bez nich - hlavním důvodem je to, že správně nastavený proměnlivý rozvrh odměn zvyšuje motivaci zvířete, je tedy důležitým nástrojem jeho spolehlivosti jak v různých situacích, tak i v prostředích. Této problematice se budeme věnovat mnohem podrobněji v dalších dílech, protože jde o jeden z nejdůležitějších konceptů metodiky pozitivního posilování. Ke druhé části otázky: nějakou formu odměny máte u sebe vždy, dokonce i když si myslíte, že nemáte. O tom ale také někdy příště.
Otázka č. 2: Pokud se pozitivní posilování už řadu let efektivně uplatňuje v prostředí akvárií a zoologických zahrad, tzn. v prostředí téměř "sterilním", bez rušivých vlivů a v ohraničeném prostoru výběhu nebo bazénu, bude stejně fungovat i v "běžném provozu", ve kterém s našimi psy žijeme téměř 24 hodin denně, a to včetně situací, kdy prostředí psovi nabízí odměnu mnohem lákavější, než je obsah našeho pamlskovníku (například v zazvěřeném lese apod.)?
Ano, bude fungovat stejně. Zvířata cvičená pozitivním posilováním jsou v praxi využívána institucemi, jako je americká armáda nebo CIA, a to i při tzv. "ostrém nasazení". V tomto případě mám na mysli delfíny zneškodňující hlubinné miny - delfíny jsou "na volno" a v otevřeném moři kolem nich je spousta ryb, kterými by se mohli odměnit sami. Podobným příkladem jsou havrani, které CIA využívala při špionážních misích. Úkolem havranů bylo doletět k oknu, ke terému byli navedeni pomocí laserového ukazovátka, a pomocí v zobáku umístěné kamery pořídit snímky, obrazové a zvukové záznamy. Funguje-li tedy pozitivní posilování u zvířat, která nemají na člověka žádnou přirozenou vazbu, musí to jít i se psem, který je na člověku ze všech zvířat nejzávislejší, navíc dělá spoustu činností jen kvůli němu, svému pánovi. Nepůjde to ale ze dne na den, práce v rušivém prostředí vyžaduje dlouhodobý nácvik, metodicky přesný postup a jistou míru schopnosti "čtení" zvířete. I této problematice se budeme věnovat v některém z příštích dílů.
Otázka č. 3: Můj pes nejeví zájem o pamlsky ani o hračky, znamená to, že s ním nemůžu cvičit pomocí pozitivního posilování?
Opravdu neznamená. Pravděpodobně ale budete muset trochu citlivěji pracovat s odměnami, jejich hodnotou a rozložením, zejména v náročném prostředí. Výzkumy v oblasti chování a učení zvířat odhalily zajímavý jev, který s motivací k spolupráci bezprostředně souvisí. Zjistilo se, že jídlo, které zvíře dostane jako odměnu za svůj výkon, je pro něj daleko hodnotnější než to, které dostane "zdarma" a bez toho, aby pro jeho získání muselo vynaložit byť sebemenší úsilí. Tento jev se nazývá "contrafreelading" a je pozorován v celém spektru živočišných druhů. Příčiny jevu nejsou přesně známy, je také v rozporu s tvrzením, že se organismy snaží najít nejjednodušší cestu k zachování druhu, tzn. volit k zajištění životních potřeb takovou strategii, která je bude stát co možná nejméně úsilí a energie. Jedna z teorií o contrafreeloadingu říká, že situace, kdy se neomezené množství potravy stále k dispozici, je v přírodě tak neobvyklá a nepřirozená, že s ní přirozené instinkty zvířat nepočítají. Ať už je příčina jakákoliv, jisté je, že contrafreeloading je jedním ze základních stavebních kamenů pozitivního posilování a je v jeho metodice často aplikován. Pro nás majitele psů je nejdůležitější poznání, že zvíře hodnotu odměny pochopí a porozumí jí, že se dá vybudovat - i to i přesto, že pro něj ze začátku odměna jako taková hodnotu nemá, resp. nemá takovou hodnotu, aby pro její získání bylo zvíře ochotné pracovat. V praxi můžeme tento jev pozorovat poměrně často, např. u zvířat, když jsou řešeny jejich problémy s agresivním chováním - zvíře zpočátku odměny odmítá přijímat, později je už pamlsky schopno nejenom konzumovat, ale dokonce kvůli získání odměny i aktivně pracovat. Příkladem konkrétně pro mne jsou někteří "pejskaři" z bezprostředního okolí, kteří se svými psy začali cvičit a věnovat se nejrůznějším kynologickým disciplínám kvůli tomu, aby jejich psi přibrali na váze.
Otázka č. 4: Pokud pozitivní posilování vzniklo jako prostředek k tréninku živočišných druhů neschopných akceptovat tresty od lidí, má vůbec smysl tu to metodiku použít pro účely výcviku našich psů - ti tresty akceptují a jsou člověku schopni odpustit téměř vše - a připravit se o možnost využití aparátu trestů při výchově psa?
Vzhledem k tomu, že pes má za sebou několikatisíciletou historii soužití a spolupráce s člověkem, je schopen se člověku v lecčem přizpůsobit a akceptovat i to, co by jiné živočišné druhy přijmout nedokázaly. To je ostatně také důvod, proč existuje tolik různých a často protichůdných metodik výchovy a výcviku psů - a všechny můžou za jistých okolností fungovat. Pozitivní posilování rozhodně není jedinou možnou cestou a "jediným správným způsobem" výchovy psa, nemusí být ani způsobem nejrychlejším a nejefektivnějším. Přesto ale má tato metodika ve výcviku psů své místo, a nepochybně má i smysl. Důvodů a benefitů, které s sebou nese, je celá řada, postupně vás s nimi v jednotlivých článcích tohoto seriálu budu seznamovat. V tomto dílu uvedu jenom ten, který považuji za nejdůležitější. Známým problémem je ta vlastnost psů, že je extrémně obtížné vysvětlit jim, co dělat nemají, ale zároveň je extrémně jednoduché jim vysvětlit, co dělat mají. A buďte si jisti, že z jejich povahy nežádoucí chování "nedostanete" tresty - ty totiž chování nevytvářejí, ale potlačují. Jinými slovy: trest odpovídá na otázku "co je špatně", ale nenese žádnou informaci o tom, "co správně je". Tento problém je jednoznačně nejčastější příčinou nedorozumění mezi člověkem a psem. Pozitivní posilování tomuto problému předchází, při jeho využití nikdy neříkáme "co je špatně" - snažíme se říct "co je dobře". Což je z pohledu psa mnohem srozumitelnější a pochopitelnější styl vzájemné komunikace. Myslím si, že je to dobrý důvod, proč by se s pozitivním posilováním alespoň do jisté míry měl seznámit každý, kdo se výchově a výcviku psů věnuje, i kdyby se v praxi rozhodl jak od samotné metodiky, tak od některých jejích pravidel odchýlit.
Článek vyšel v časopisu č.11/12 2014