Pozitivní posilování ve výcviku psů. Jak to vlastně funguje, aneb výcvik je nejen umění, ale i věda

Publikováno: 19.2.2016
Autor: Jakub Beran
Foto: Kateřina Lišková, Táňa Kottová

Za dobu své kynologické praxe se často setkávám s názorem, že "z výcviku psů se v poslední době dělá příliš velká věda". A ono to tak doopravdy leckdy může působit. Ostatně člověk se psem vedle sebe žijí již tisíciletí a po celou dobu toto soužití úspěšně fungovalo na bázi "selského rozumu", bez složitých definic a vědeckých teorií.

Není tedy celá ta teorie o učení, chování a výcviku zvířat pro naše každodenní fungování se psy vlastně zbytečná a má nějaký smysl kromě toho, že celou věc pouze zbytečně komplikuje?

Jakub Beran se věnuje problematice učení a chování zvířat.Jak asi tušíte, důvodem, proč celý tento seriál vznikl, je moje přesvědčení, že nikoliv. To se zakládá na následující úvaze. Přestože po tisíce let žijeme a spolupracujeme se psy a po celou tu dobu jsme si vystačili převážně s "citem a rozumem", tato situace se v posledních letech změnila. Důvodem je změna životního stylu, odklon od "původního způsobu života", který byl nejen pro nás, ale především pro psy mnohem srozumitelnější a uchopitelnější. Zatímco v minulosti stálo naše soužití na oboustranně prospěšné spolupráci, ať už se jednalo např. o společný lov nebo ochranu obydlí, v současné době se role psů ve společnosti mění.

Existuje pouze několik málo plemen, která mají to štěstí, že stále mají uplatnění blížící se účelu, pro který byla původně člověkem ochočena a šlechtěna. Role těch ostatních se zásadním způsobem změnila, podobně jako prostředí, ve kterém s námi žijí. V současné době většina psů plní spíš roli našich společníků, v některých případech nám nahrazují lidské životní partnery a namísto společného lovu, který je pro ně jako pro predátory přirozenou činností, plní roli vodících a asistenčních psů pro zdravotně postižené. Kromě toho musejí být schopni pohybovat se v provozu a ruchu velkoměst a žít s námi v bytech, kde jsou "principy správného chování" a "strategie přežití" tolik odlišné od divočiny, ze které, stejně jako jejich nejbližší příbuzní, vlci, pocházejí. Z této změny jsme zcela bez úhony nevyšli ani my, lidé.

Na jednu stranu máme mnohem vyšší životní úroveň než naši předkové a zvyšuje se i průměrný věk, na druhou stranu nás sužuje celá řada civilizačních nemocí jak fyzické, tak i psychické povahy.

Na začátku byli lachtani

Je nutné brát v úvahu, že toto "nové prostředí" jsme vytvořili my, lidé. Proto je pro nás mnohem snadnější se mu přizpůsobit - ať už díky našim fyziologickým vlastnostem, tak schopnostem našeho mozku a uvažování, které se od toho psího značně liší. Zároveň s tím stoupají i nároky naší společnosti na psy samotné. Očekáváme, že budou s nasazením vlastního života chránit náš majetek, nicméně v naší společnosti je napadení člověka psem záležitostí končící u soudu nebo v médiích a pro psa smrtící injekcí. Kvůli řadě nedorozumění mezi člověkem a psem se plní psí útulky. Naši psi musejí chápat celou řadu z jejich pohledu nesrozumitelných konceptů, jako například "vybavení bytu není hračka na žvýkání" nebo "obývací pokoj není toaleta", které v jejich přirozeném prostředí nedávají smysl.

A tady někde možná nastala ta změna, která stojí za zvyšující se oblibou metodiky pozitivního posilování u psů.

V minulém díle jsem psal o tom, že za vznikem a rozvojem této metodiky stojí trenéři mořských savců v amerických akváriích. A jak akvária, tak zoologické zahrady se do značné míry odlišují od přirozeného prostředí zvířat, která jsou v nich chována. A stejně tak jako pro psa nedává žádný smysl neudělat si z vybavení bytu hračku na žvýkání, pro lachtana nedává žádný smysl nastavit ocasní ploutev a nechat do sebe zapíchnout jehlu pro účely odběru krve. Z jeho pohledu jde o přímé ohrožení, tedy situaci, ve které je ve svém přirozeném prostředí ochoten i zabít, aby si zajistil vlastní přežití. V akváriu nebo v zoologické zahradě je však naprosto nezbytné, aby tento úkon byl schopen podstoupit a nikoho z ošetřovatelů ani sebe samotného neohrozil. V principu podobný je i příklad s představením lachtanů pro veřejnost. Nyní se tedy nabízí otázka: Nevzniká nám tady náhodou paralela mezi lachtanem v zoo a psem ve velkoměstě?

Proč vás pes poslechne

Je tu však jeden, poměrně zásadní rozdíl. Zatímco lachtana nebo delfína k tomu, aby si nechal odebrat krev, silou nebo nátlakem nepřesvědčíme, u psa se nám to pravděpodobně podaří už jenom kvůli domu, kolik je nám toho jako druh ochoten odpustit. Jinými slovy - zatímco u psa vám pravděpodobně přístup "buďto si necháš ty drápky ostříhat, nebo...", popřípadě "buďto teď všeho necháš a přiběhneš na přivolání, nebo..." docela dobře projde, u lachtana nebo kosatky byste s tímto přístupem velmi rychle a pravděpodobně i bolestivě narazili.

Nicméně, zaprvé ani u psů ne vše a vždy jde řešit nátlakem, zadruhé dlouhodobé působení nátlaku zanechává na každé živé bytosti velmi nepříjemné a někdy nevratné následky. Proto dává smysl naučit psa, aby i chování, které je pro něj neužitečné a původně i nepříjemné, vykonával sám od sebe, z jeho vlastního rozhodnutí.

Když už tedy víme, proč by nás ta "šedá teorie" měla zajímat, podívejme se na základní principy učení a chování zvířat. 

Dlouhodobé působení nátlaku zanechává na každé živé bytosti velmi nepříjemné a někdy nevratné následky.

Klasické podmiňování

Je nejznámější formou učení zvířat. Všichni známe příklad se psy I.P. Pavlova se zvonečkem a potravou. Pokud po původně neutrálním podnětu (zazvonění zvonečku) přichází bezprostředně další podnět (potrava), vzniká podmíněný reflex - pes začne slinit už při zazvonění, tedy ještě předtím, než se objeví miska s potravou.

Operantní podmiňování

Je další, z pohledu trenérů zvířat pravděpodobně zajímavější formou učení. Na rozdíl od klasického podmiňování, které zavádí vazbu mezi podnětem a následkem na úrovni reflexu, tzn. něčeho, co subjekt není schopný vůlí ovlivnit, stojí principy operantního podmiňování na sekvenci spouštěč (anglicky Antecendent) - chování (Behaviour) - následek (Consequence). Proto se na základě prvních písmen anglických termínů pro jednotlivé části někdy mluví o sekvenci "A-B-C".

Spouštěč - může být cokoli, co danému chování předchází, například povel "sedni".

Chování - je samotná akce, kterou zvíře provede. V našem případě tedy pes zaujme polohu vsedě. Důležité je, že samotné chování je tím, čím zvíře do procesu aktivně stupuje a na rozdíl od podmiňování klasického je schopno vůlí ovlivnit.

Následek - nastane bezprostředně po chování. Z pohledu učení je následek tím, co rozhoduje, zda se pravděpodobnosti konkrétního chování bude do budoucna zvyšovat nebo snižovat. Z pohledu operantního podmiňování tedy každý následek spadá do jedné z následujících čtyř kategorií, označovaných také jako "kvadranty operantního podmiňování".

Pozitivní posílení - do systému (z pohledu zvířete) přibyde něco, o co v danou chvíli stojí. V našem příkladu je tedy pes za to, že si sednul, odměněn pamlskem. Pokud v danou chvíli pes o pamlsek doopravdy stojí, pravděpodobnost, že si v budoucnu znovu sedne, se zvyšuje. (Vzpomeňte si na minulý díl, ve kterém se uvádí, že zvíře určuje, co je posílení a co je trest, nikoli trenér, pokud tedy psa odměníte něčím, co mu nechutná, nebo dostane pamlsek ve chvíli, kdy o něj nestojí, nejde o posílení.) Příkladem pozitivního posílení z lidského života mohou být například mimořádné prémie za splnění pracovního úkolu.

Pozitivní trest - následkem chování přibyde něco, co je zvířeti nepříjemné. Klasickým příkladem je to, že pes štěká a majitel ho za to uhodí. Pravděpodobnost výskytu chování do budoucna se snižuje. Podobně bude fungovat "výchovná facka" u dítěte, které provádí nějakou nepřístojnost.

Negativní posílení - ze systému ubyde něco, co je v danou chvíli zvířeti nepříjemné. Příkladem negativního posílení může být situace, kdy nás začne bolet hlava, my spolkneme prášek a bolest hlavy zmizí. Pokud nás příště začne bolet hlava, pravděpodobně zopakujeme chování, které v minulosti fungovalo, tzn. zvýší se pravděpodobnost, že si jako reakci na bolest hlavy vezmeme prášek.

Stejně jako u pozitivního posílení se při negativním posílení pravděpodobnost výskytu chování do budoucna zvyšuje, v praxi se ale při tréninku mořských savců téměř nevyužívá. Na začátku sekvence totiž musí přijít něco, co je zvířeti nepříjemné a čeho se chce zbavit. Zároveň chování získané negativním posílením z povahy věci zvířete nevykonává na základě vlastního rozhodnutí, což je pravý opak základního principu tréninku mořských savců i metodiky pozitivního posilování.

Negativní trest - následkem chování je odebrání něčeho, o co zvíře v danou chvíli stojí. Příkladem může být situace, kdy se člověk se psem přetahuje o hračku a poté, co se pes při hře příliš rozvášní a omylem majitele kousne, majitel mu hračku sebere a hru ukončí. Pravděpodobnost výskytu chování do budoucna se snižuje.

Všimněte si, prosím, v definici jednotlivých kvadrantů dvou důležitých poznatků. Prvním z nich je, že "pozitivní" v kontextu operantního podmiňování neznamená "dobrý" a "negativní" neznamená "špatný". Pozitivní znamená pouze "něco přibylo" a negativní "něco ubylo". Definici pozitivního trestu tedy splňuje situace, kdy psa udeříme za to, že štěká. Z pohledu psa se samozřejmě nejedná o nic dobrého.

Druhý a možná ještě důležitější poznatek je, že posílením se rozumí cokoli, co způsobí zvýšení pravděpodobnosti výskytu chování do budoucna a trestem se analogicky rozumí cokoli, co pravděpodobnost výskytu chování sníží. Z tohoto pohledu tedy pojem "trest" nemá nic společného s "morální stránkou věci". Protože lidé intuitivně chápou termín "trest" často poněkud jinak, možná by bylo vhodnější použít termín "potlačení". Protože je však termín "trest" v této oblasti standardně používaný a zavedený, budeme se této terminologie dále držet. Přesto je jeho definice poněkud jiná, než jak tento pojem chápeme intuitivně, proto se u něj ještě na chvíli zastavíme - a to hned v příštím čísle. 

Článek vyšel v časopisu č.1/2 2015

logo Haf a Mňau

Kam dál: 

Pozitivní posilování aneb co nás trenéři delfínů naučili o výcviku psů

Trénink se “stopovačkou”? Pár praktických tipů, jak se do toho nezamotat

Přeskokové jednání

Chůze na vodítku by Ian Dunbar

Probíhající sbírky

Všechny články z této rubriky...