6 mythes over +R training

Oorspronkelijk artikel door Eileen Anderson

Positieve bekrachtiging (+R) minded clicker training is vaak het slachtoffer van misverstanden en onterechte slechte reputaties. Veel mensen begrijpen oprecht niet hoe het werkt, anderen lijken het opzettelijk verkeerd te interpreteren. Sommige van deze misverstanden en reputaties blijven lang hangen. Misverstanden, mythes-noem ze hoe je wil, ze zijn er en ze zijn sterk.

Hier zijn 6 die erg veel voorkomen, maar helaas zijn er nog veel meer. Ik raak bijvoorbeeld “geclickertrainde paarden zijn altijd te dik” of “+R training werkt alleen maar voor truukjes en met makkelijke paarden” of “werken met voer is omkoperij” nog niet eens aan! De volgende zes zullen wat licht schijnen op wat veel voorkomende misverstanden over +R training.

1)+R training is soft en toegeeflijk. Ik geloof dat dit een sterk misverstand is bij vele mensen. Voordat ik leertheorie begon te bestuderen had ik nog geen flauw idee hoe ik positieve bekrachtiging zou kunnen inzetten tijdens het trainen van mijn paard om bijvoorbeeld ongewenst gedrag te kunnen stoppen. Ik kon me alleen maar iemand voorstellen die lukraak koekjes uitdeelde voor goed gedrag. Leek me een goed recept voor chaos.. Wat zou die persoon doen als het paard iets “stouts” deed? Wat ik niet wist was dat +R trainers niet alleen gewenst gedrag bekrachtigen, maar ook verschillende humane technieken hebben om de bekrachtiging die het ongewenste gedrag in stand houden te beïnvloeden zodat het dier er niks meer mee wint, zijn motivatie verliest en er “vanzelf” mee op zal houden. Hieronder valt bijvoorbeeld het veranderen/regelen van de antecedenten, het bekrachtigen van alternatief gedrag, en in sommige gevallen negatief straffen. Er gaat erg veel planning en denkwerk vooraf aan +R, vooral als het wordt ingezet bij probleemgedrag. Het is precies, opzettelijk en het compleet tegenovergestelde van “we zien wel, alles komt vanzelf goed in ons droomwereldje”.

Negatief straffen (-P): Iets wat het paard graag wil (appetitief) weghalen om een gedrag te minder te laten voorkomen in het vervolg. Als jij je telkens omdraait of een stap achteruit doet als het paard tegen je aan wilt schuren met zijn hoofd, neem je hem de kans om te schuren af en zal het gedrag afzwakken omdat het niet meer bekrachtigd wordt. Negatief straffen gaat gepaard met Positief bekrachtigen omdat ze beide gaan over het beïnvloeden van het paard zijn gedrag met een appetitieve stimulus (het weghalen of toevoegen ervan). Negatief straffen kan echter frustratie opwekken bij het paard, dus proberen we dit zo min mogelijk te laten gebeuren en genoeg alternatief te bieden.

2) +R trainers negeren slecht gedrag alleen maar. Dit brengt ook wat nare beelden met zich mee: een pony die een meisje over het erf sleept, een paard dat op de tenen van zijn eigenaar gaat staan en die vervolgens ook een kopstoot geeft, paarden die bedelen en zakkenrollen.. Maar in de werkelijkheid ligt het anders. Wat we werkelijk doen met ongewenst gedrag is 1) in de eerste plaats proberen het te voorkomen; 2) het paard een alternatief gedrag aanleren (iets wat wél iets op zal leveren); 3) straffen door middel van negatief straffen.

We weten dat eerder bekrachtigde gedragingen alleen maar negeren ze niet zal doen weggaan. Om dingen nog wat ingewikkelder te maken, zijn hier twee situaties waar ‘negeren’ juist wel wordt toegepast in training. De eerste situatie is wanneer er nieuwe gedragingen worden geleerd en/of er verbale cues met dit nieuwe gedrag worden geassocieerd. In deze gevallen gebeurt er niks als de hond een fout maakt. We geven geen beloning. Maar in deze situatie hebben we niet te maken met een gevaarlijk gedrag of gewoonte dat op één of andere manier wordt of werd bekrachtigd. Het is gewoon een verkeerde gok in een gokspelletje. De andere situatie is wanneer aandacht hetgeen is wat het ongewenste gedrag in stand houdt en negeren dus wordt ingezet tijdens de training. Maar zelfs dan gebruiken we niet alléén negeren. (Lees meer bij punt 5)

3) +R trainers geloven dat er nóóit iets vervelends in het leven van het paard mag voorkomen en ze proberen het dier te beschermen tegen al de aversieven in het leven. Dit is onmogelijk. Milde tot redelijk aversieve prikkels zijn soms overal om ons heen, en wij – en onze dieren – laten veel gedragingen zien om deze prikkels te vermijden of doen verminderen. Misschien heeft het paard het te warm. Dit is aversief. Misschien vliegt er een vlieg om zijn hoofd of prikt er zelfs een daas in zijn hals. Dit is aversief. Misschien moet het paard een injectie krijgen van de dierenarts. Dat is ook aversief! Het punt is dat we aversieven vermijden tijdens het trainen van het paard, zelfs milde aversieven. Wanneer het paard van een auto schrikt en wegrent  wordt dit gedrag automatisch en natuurlijk negatief bekrachtigd. Het paard wordt bekrachtigd voor het rennen doordat hij meer afstand tussen zichzelf en de auto heeft gecreëerd en zichzelf in veiligheid heeft gebracht. Die auto is een aversief dat we niet kunnen voorkomen. We kunnen en zullen het paard leren om anders met de (angst voor de) auto om te gaan in plaats van weg te rennen, maar we zullen nooit het geluid van de auto of iets dergelijks inzetten tijdens onze training sessies om de angst te gebruiken, of om een bepaald gedrag te triggeren waar we naar zoeken. En als we het over zware aversieven hebben, bijvoorbeeld een vervelend bezoek aan de dierenarts, kunnen we het paard zo goed mogelijk voorbereiden zodat het een minder aversieve ervaring wordt. Dat is het tegenovergestelde van het opzettelijk gebruiken van de aversieve kenmerken van het bezoek.

4) Door 3) zullen +R trainers medische behandelingen die misschien pijn kunnen doen vermijden en paarden zo het verkeer in laten rennen zodat ze maar niet aan het leidtouw hoeven te trekken. Dit is een stropopredenering. (Het toeschrijven van een standpunt aan de tegenstander (bijvoorbeeld door met extra veel nadruk het tegengestelde standpunt te verkondigen) of het vertekenenvan zijn standpunt (bijvoorbeeld door het standpunt uit zijn context te halen,te simplificeren of te overdrijven). In beide gevallen wordt een standpunt gecreëerd dat gemakkelijker aangevallen kan worden.)  Ik denk dat de mensen die dit zeggen niet eens echt geloven dat wij als +R trainers ons paard echt gevaar zullen laten lopen of hun gezondheid op het spel zouden zetten.

In een noodgeval zullen wij het paard ook blokkeren, vastpakken, wegdrijven en druk op de lijn zetten zoals elk ander mens zou doen die om hun paard geeft. Ja, dit is aversief voor het paard. Maar dit is geen onderdeel van training of een opzettelijk leerscenario. Verschillend gedrag kan gevraagd of nodig zijn in moeilijke situaties. Een vriendin kan mij bijvoorbeeld vragen om met een naald een splinter te verwijderen waar ze zelf niet bij kan. Ik zou dit doen, zelfs al doet dit haar zeer. Dat ik bereid ben om haar in dit geval pijn te doen, betekent niet dat ik het ook prima vind om haar te prikken met een naald als ik haar een nieuwe vaardigheid probeer te leren en ze een fout maakt. Je zult een kind dat plots het verkeer in rent ook aan zijn arm trekken als hij niet op zijn naam reageert, maar dat betekent niet dat je thuis in de woonkamer elke dag even een paar keer aan zijn arm trekt om te kijken of hij er nog wel goed op reageert.

5) +R trainers gebruiken straf maar hebben het niet door (of ontkennen het). Dit is onnozel. We zijn over het algemeen juist degene die hun best doen om de mythologie en mysterie achter te laten en de wetenschap en waarheden achter goede training te vinden en studeren. Maar nogmaals, deze claim kan komen van iemand die niet begrijpt wat wij doen; iemand die dan maar klakkeloos aanneemt dat straf wel móet voorkomen tijdens onze training. Soms gebeurt het ook. En degenen die negatief straffen gebruiken weten ook wanneer ze dit doen. Maar een bekende variant van deze claim is “Wanneer je traint en niet altijd het snoepje geeft aan het paard houdt je de beloning achter en dat is negatief straffen ha-há!” maar dat is het niet. Wanneer er geen consequentie is voor de verkeerde gok van het paard is het geen straf. In dit geval is uitdoving aan het werk. Uitdoving is ook niet echt leuk voor de hond, maar over het algemeen gebruiken we niet alléén uitdoving. Meestal wordt er een ander gedrag of zelfs meerdere gedragingen bekrachtigd en helpen we het paard langzaam de overgang te maken tot het alléén uitvoeren van (één van) die gedragingen in plaats van het ongewenste gedrag waar we vanaf willen. We weten ook dat bepaalde hulpmiddelen misbruikt kunnen worden. Het is geen nieuws dat een doodgewoon halster gebruikt kan worden om een paard pijn te doen, en dat het ook per ongeluk kan gebeuren. Om deze reden beginnen we, als we tuig of andere middelen gaan introduceren in onze training, eerst counter-conditioneren om het paard te helpen positieve associaties te krijgen met het tuig. Daarbij leren we met positieve bekrachtiging wat het paard moet doen met dit tuig om de kans op ongemak te verkleinen. Dit is het tegenovergestelde van het (opzettelijk) gebruiken van de aversieve kwaliteiten van het hulpmiddel.

Uitdoving (extinction): Het afzwakken van een gedrag door non-bekrachtiging of negeren. Tijdens uitdoven wordt er niks toegevoegd of weggehaald van de omgeving. Zolang het gedrag niet zelf bekrachtigend is zal het paard uiteindelijk opgeven en ophouden met het aanbieden van het gedrag.

Counter-conditioneren: Valt onder de categorie Klassiek conditioneren. Het proces van associatie met een bepaalde prikkel van aversief naar appetitief veranderen, of andersom. Normaal gesproken wordt dit gedaan door de prikkel te paren met een prikkel met tegenovergestelde waarde. Een eng object zal bijvoorbeeld gepaard worden met het geven van een voerbeloning. Als dit langzaam wordt gedaan zal het enge object een voorspeller worden van iets leuks/lekkers. Als het wordt gehaast of het voer is niet even lekker of zelfs lekkerder dan dat het object eng is, dan zal het voer juist aversief worden net als het enge object.

6) +R training is net zo stressvol voor paarden als gemixte of traditionele training. Trainen met positieve bekrachtiging kan zeker stressvol zijn. Maar dit heeft vaak te maken met een gebrek aan vaardigheden en kennis van de trainer, of een nare situatie waar niet op was gerekend. Het is niet logisch om te beweren dat een bepaalde methode dat gebaseerd is op positieve bekrachtiging, het geven van eten, aandacht of kriebels als het paard het gewenste gedrag laat zien NET zo aversief is als een bepaalde methode dat gebaseerd is op negatieve bekrachtiging en het toepassen van ongemak, pijn en intimidatie.

De overeenkomsten

Elk van deze beweringen zijn gefocust op straf of aversieve prikkels. Dit is duidelijk een knelpunt wanneer mensen positieve bekrachtiging proberen te begrijpen. De beweringen passen netjes in 2 categorieën: De eerste 4 zijn slechte vertegenwoordigingen van +R training. Ze zetten het vreemd weg en impliceren dat het onmogelijk en/of ineffectief is. De laatste twee proberen de grens tussen +R training en dwangmatige training te vervagen.

In retorica worden het drogredenen genoemd. De eerste vier zijn stropopredeneringen en de laatste twee gebruiken de tu quoque variant (Het proberen een tegenstrijdigheid aan te tonen in woorden of daden van de tegenstander. Dit kan een verschil zijn tussen iemands huidige en vroegere opvatting, of een strijdigheid tussen wat iemand zegt en wat iemand doet. Spelen op de man in plaats van de bal.) en de continuum fallacy (Het beweren dat er geen verschil is tussen twee concepten om het verschil nog te onduidelijk zou zijn, en de concepten dus eigenlijk hetzelfde zijn.).

Hoe irritant het ook is om deze opnieuw en opnieuw te moeten aanhoren en lezen, probeer ik eraan te denken dat deze argumenten uit een stuk onwetendheid voortkomen en niet uit boze opzet. We zijn allemaal opgegroeid in een cultuur waarin ons wordt geleerd gedrag te veranderen met aversieven.

Bij ons zit onze conventionele gedachte in de weg om gedrag te kunnen begrijpen. Conventionele gedachten zijn de verklaringen/ideeën die in het algemeen als waarheid worden aanvaard. Dr. Susan Friedman noemde dit de ‘Cultural Fog’. Hierdoor worden we beperkt om nieuwe zaken te leren, en om ons eigen gedrag te veranderen.

Ik weet zeker dat de meeste mensen die deze argumenten gebruiken geen idee hebben van alle planning en precisie er in +R training gestopt worden. Ik had tot een paar jaar terug ook nog geen idee. Pas toen ik echt ging luisteren naar mensen die nog geduldig bereid zijn uit te leggen wat er allemaal komt kijken bij +R training, trok mijn ‘cultural fog’ een beetje weg en kon ik helder zien.

Advertenties

Geef een reactie

Vul je gegevens in of klik op een icoon om in te loggen.

WordPress.com logo

Je reageert onder je WordPress.com account. Log uit / Bijwerken )

Twitter-afbeelding

Je reageert onder je Twitter account. Log uit / Bijwerken )

Facebook foto

Je reageert onder je Facebook account. Log uit / Bijwerken )

Google+ photo

Je reageert onder je Google+ account. Log uit / Bijwerken )

Verbinden met %s