Stavební kameny clicker trainingu

Publikováno: 18.10.2014
Autor: Kateřina Lerlová
Foto: Lenka Frková, PesWeb - archiv

Clicker není hra nebo hračka, která se psovi hází, nebo se s ní cvaká, aby měl pes radost. Clicker training je spíše věda. Zakládá se na výzkumech a experimentech s chováním zvířat. Má velmi jednoduchá a jasná pravidla, která ale není vždycky snadné sledovat. Jakmile ale jednou najdete tu správnou páku, můžete pohnout zeměkoulí.

Clickr - Psi se snaží zopakovat chování, za které jsou odměňováni.

Jak se organismy učí

Podle teorie existují dva způsoby, jakými se mohou organismy něco naučit, tedy dokáží určitým způsobem reagovat na určité podmínky. Pojmem organismy myslím nejen psy, kočky, koně, papoušky, ale i lidi. Jsou to klasické a operantní podmiňování (classical and operant conditioning).

Klasické podmiňování

Působí na reflexy, reakce na podnět je automatická, nedokážeme ji ovlivnit a je často spojená s emocemi. Příklad klasického podmínění je, když hladový člověk při vůni čokolády začne mít na ni chuť, nebo když znervózní při pohledu na injekční stříkačku. Reakce, kterou nedokážeme ovlivnit, je podmíněný reflex.

Pokusy s klasickým podmiňováním prováděl na začátku 20. století Rus Ivan Pavlov. Zazvonil na zvonek a dal psovi krmení. Psi pak začali slinit už při samotném zvuku zvonku. Neutrální podnět (zvonek) spojil s příjemným (jídlem), ale reakce psů na zvonění byla nekontrolovatelná.

Nepříjemné zážitky se psovi s neutrálními podněty spojí dříve než příjemné, například jen po jednom nepříjemném zážitku s bouřkou pes následně znervózní při poklesu tlaku, protože to pro něj znamená, že budou hromy a blesky. Proto se nepřiměřený trest napravuje mnohem hůře než přehnané chválení, pokud psa tvrdě potrestáte po vyslovení povelu za to, že cvik nesplnil, příště pro něj samotné vyslovení povelu bude signalizovat blížící se trest.

Příjemné zážitky se také spojují, na svých psech můžete vidět, že se těší na procházku, jen když zacinkají známky na obojku. Radostné reakce psa na určité podněty se pak využívá při clicker trainingu - klik funguje jako signál, že přijde odměna.

Odměna tvoří a posiluje chování, takže se zvyšuje pravděpodobnost, že se bude chování opakovat i v budoucnu, třeba i s větší intenzitou (rychleji, přesněji, razantněji).

Operantní podmiňování

Zvířeti jeho chování přinese nějaké důsledky, buď pozitivní, nebo negativní. Pes tak může svoje chování kontrolovat a rozhodnout se pro to, co mu přinese něco příjemného. Psi se snaží zopakovat chování, za které jsou odměňováni, naopak se snaží vyhnout chování, po kterém následuje trest.

Odměna tvoří a posiluje chování, takže se zvyšuje pravděpodobnost, že se bude chování opakovat i v budoucnu, třeba i s větší intenzitou (rychleji, přesněji, razantněji). Příklad si můžete vzít opět ze sebe - když vypadne televizní signál, člověk se ho snaží opět získat tím, že manipuluje s televizní anténou. Pokud uspěje, při dalším výpadku signálu bude s anténou hýbat dříve a rychleji. Podívejte se schválně na Mr. Beana.

Žádná odměna nebo trest chování netvoří, protože jako vy byste neplýtvali svým časem v práci, kdyby vám za to nedávali plat, ani pes nebude plýtvat svou energií na chování, kterým nic nezíská, nebo mu vynese trest.

Pro každého psa (a nejen pro něj) je operantní chování přirozené, pes dělá to, co je pro něj příjemné. Například si převrátí koš, aby se mohl hrabat v odpadcích. Při výcviku s clickerem se psem většinou nemanipulujeme, málo se na něj mluví a co nejméně navádí hračkou nebo pamlskem. Pokud je pes naučení, že ho do každého cviku navedeme, je pes odměněn za to, že se nebrání naší manipulaci, je v učení pasivní, místo aktivní. Když je pes odměňován za to, že nabízí různé cviky sám od sebe, je v učení aktivní a lépe ovládá své reakce. Když na psa mluvíme, musí se soustředit na nás a snaží se najít v našem proslovu nějaké slovo, kterému by rozuměl, místo toho, aby se soustředil na cvičení. Nezapomeňte, že pes sám od sebe povelům nerozumí, tudíž je nemůže vykonat, ani kdybyste mu je řekli stokrát. "Operantní", pes, který rozumí clickeru, chápe, že nabízení cviků mu vynese odměnu a je schopen určit, za jaké chování byl odměněn a tím pádem ho také může zopakovat. Pak už záleží na trenérovi, jak přesně dokáže psovi označit důležitý okamžik v tréninku a jak dokáže psa dovést postupným upřesňováním kritérií a zvyšováním nároků až k požadovanému cviku.

Syntéza

Při výcviku psů se používá jak klasického, tak operantního chování. Klasickým podmínění se spojí zvuk clickeru s něčím příjemným - pamlskem, takže pes reaguje pozitivně na samotný klik Díky operantnímu podmiňování pak formujeme psí chování - pes něco udělá a buď mu klikneme, takže se může pokusit něco znovu udělat, nebo nijak nezareagujeme a on se pokusí udělat něco jiného. Takovému stylu tréninku se říká "shaping" - tvarování a přes obyčejné čuchnutí k čince můžeme psa naučit, aby pro ni doběhl, vzal ji do tlamy a aportoval ji nám zpátky. (Jak naklikat psa).

Pes, který rozumí clickeru, chápe, že nabízení cviků mu vynese odměnu a je schopen určit, za jaké chování byl odměněn a tím pádem ho také může zopakovat.

Následky chování

Každé chování má nějaké následky a pes se pak podle následků rozhoduje, jestli chování zopakuje. Slovníček:
pozitivní: je něco, co pes díky svému chování získá
negativní: je něco, co pes díky svému chování ztratí
upevnění: cokoli, co zvýší pravděpodobnost výskytu určitého chování v budoucnosti, pokud následuje rychle po výskytu chování
trest: cokoli, co sníží pravděpodobnost, že se chování bude opakovat i v budoucnosti, pokud následuje těsně za chováním

Pozitivní upevnění:Tím, že dáte psovi něco, co chce, zvýšíte pravděpodobnost, že odměněné chování zopakuje. Podle typu psa to může být pamlsek, hračka, pohlazení, pochvala...
Negativní upevnění: Přestanete dělat psovi něco nepříjemného, když se chová, jak chcete, například přestanete škubat vodítkem nebo na něj křičet. Pes odstranění nepříjemného pocitu vnímá s úlevou.
Pozitivní trest: Když pes dělá něco, co se vám nelíbí, taky mu uděláte něco, co se mu nebude líbit - postříkáte ho citronkou, praštíte, dáte elektrickou ránu.
Negativní trest: Pokud se pes přestane chovat podle vašich představ, vezmete mu bez emocí něco, co chce, například hračku nebo ho zavřete do klece.

Chování, které se upevňuje samo

Existují taková chování, často nežádoucí. Mezi ně patří skákání na lidi, hrabání na zahradě, vytahávání odpadků, trhání kalhot a rukávů, útěk a hra se psy. Takové chování se nedá ignorovat, protože samo o sobě nevymizí, právě naopak, jejich prováděním se zároveň odměňuje, takže je v budoucnosti opakuje znovu a znovu. Měli byste mít kontrolu nad prostředím (a nad psem) a včas vždy zabránit, aby pes mohl objevit rozkoš nějakého nežádoucího chování.

Při "pozitivním" výcviku se psovodi snaží pracovat především s pozitivním upevněním (odměněním hračkou nebo pamlskem) a negativním trestem (odebráním hračku, ukončením hry psů). Při negativním trestu musíte psa důsledně potrestat za nežádoucí chování pokaždé, aby si spojil trest s nežádoucí činností. Pokud se rozhodnete pro pozitivní trest a pes ani po třech trestech svoje chování nezmění, popřemýšlejte o jiném řešení problému, protože pes pravděpodobně nechápe, co mu chcete sdělit a každý nepřiměřený trest poškozuje vztah mezi psem a psovodem.

Kateřina Lerlová
http://katachyon.lerl.info/

Kam dál: 

Co se dá s clickerem dělat - Shaping

FAQ'S CLICKER

Jak naklikat psa

Jak klikr trénink na svět přišel

Bull sporty

Probíhající sbírky

Všechny články z této rubriky...