Maria Yttermyr talar om belöningsbaserad träning och de problem som kan uppstå när man istället använder straff i träningen med hästar.

Maria Yttermyr talar om belöningsbaserad träning och de problem som kan uppstå när man istället använder straff i träningen med hästar.

Belöningsbaserad hästträning

4 oktober 2023, 13:52

Problemen med straff

För många år sedan när jag var nyanställd på en relativt stor arbetsplats så lyckades jag utlösa inbrottslarmet när jag skulle lämna några remisser i utgående post på kansliet på väg hem. Larmet var verkligen öronbedövande, en sådan där hög drillande klocka som gjorde all tankeverksamhet omöjlig, trots fingrar instoppande i öronen. Några undersköterskor från vårdavdelningen kom så småningom springande och de visste vart man skulle ringa för att få stopp på eländet och avboka utryckningen från vaktbolaget. De var måttligt roade av att ha blivit störda och uppjagade i tron att det var inkränktare i farten. Jag skämdes över att ha ställt till det, ny på jobbet och allt. Men faktum var att ingen hade tänkt på att upplysa mig om att kansliet var larmat när den lilla handgjorda träskylten var vänd med texten ”Vi har gått för dagen!” utåt, och att larmet skulle gå även när man låste upp dörren med sin högst behöriga nyckel.  Efter denna traumatiska upplevelse såg jag noggrant till att bara gå in på kansliet när kanslipersonalen var på plats och dörren stod öppen. Om de t ex var på möte eller lunch och hade låst dörren, men inte larmat och vänt upp sin lilla skylt eftersom de skulle komma tillbaka, så gick jag inte in. Jag sparade min utgående post på rummet tills det var säkert att kanslisterna var på plats och själva ställt upp dörren. Jag vågade inte chansa på att det skulle kunna vara larmat och att de kanske bara hade glömt att vända upp skylten. Mitt undvikande beteende  - inte låsa upp dörren till kansliet – kvarstod under hela min anställning där.

Faktum är att jag idag, 20 år senare och på en helt annan arbetsplats, också har ett undvikande beteende gällande en dörr som ibland är larmad och som andra råkat utlösa.

Varför berättar jag det här? Vad i hela friden kan mina larmnojjor ha att göra med hästträning?

Jo, jag tycker att mina upplevelser med den där dörren ganska tydligt illustrerar några av problemen med straff.

Ett straff, eller som det också benämns i en del senare inlärningspsykologisk litteratur, en försvagning, är en konsekvens efter ett beteende som leder till att beteendet minskar eller upphör. Med inlärningspsykologisk terminologi är ett straff/försvagning som innebär att något tillförs som en konsekvens ett positivt straff. Positivt i bemärkelsen att något tillförs, adderas. Inte positivt i bemärkelsen önskvärd eller bra. Ett straff eller försvagning som innebär att konsekvensen efter ett beteende är att något försvinner kallas för negativ bestraffning/försvagning.

Exempel på positivt straff, dvs konsekvenser som tillförs och som gör att ett beteende på sikt minskar eller upphör – kan vara ett piskrapp, en knäpp på mulen, en verbal åthutning, en kick med skänkeln, eller i mitt fall ett högt och obehagligt ljud.

Exempel på negativt straff, dvs konsekvenser som innebär att något önskat och åtråvärt försvinner kan vara att hålla undan maten, gå ifrån hästen (om din närvaro är önskad av hästen), sluta klia hästen eller för en människa att få ett avdrag på veckopengen.

OBS! På förekommen anledning, det är fortfarande straff/försvagning även om du själv väljer att kalla det för en korrigering eller en hjälp när du tillför ett obehag för att minska förekomsten av ett beteende.

Straff KAN vara ett effektivt sätt att få ett beteende att minska eller upphöra. Mitt låsa-upp-låst kanslidörr-beteende upphörde ju omedelbart efter en enda administrering av obehagligt ljud.

Borde det inte bli betydligt mer effektiv träning om vi lär oss att dela ut vältajmade bestraffningar och bli av med oönskade beteenden i en enda repetition? Njae. Problemet är att straff i princip alltid också har biverkningar.

Ett straff måste för att påverka beteendet ha en viss intensitet av obehag, annars har det inte någon effekt på beteendet. Alltså är det obehagligt för mottagaren att uppleva en bestraffning. Det måste så klart ställas mot värdet för individen och omgivningen att ett oönskat beteende upphör. Hur mycket obehag kan man utsätta någon för i avsikt att få bukt med ett problem? Hur hårt kan man slå? Hur mycket kan man trycka med sporren eller rycka i kedjan? Var går din etiska gräns?

Men problemet med straff är inte bara intensitet i obehaget som delas ut. Förespråkare för straff vill gärna påstå att det är så enkelt som att väl avvägt och vältajmat obehag får ett beteende att upphöra – simsalabim.

Och det händer ibland, som med mig och den där dörren. Men väldigt ofta så glömmer man bort att beteenden inte existerar i vakuum. Beteendet har en funktion som förmodligen är viktig för individen. Om en väg stängs kommer individen att behöva leta efter andra sätt att få tillfredsställa behovet. Jag behövde fortfarande skicka post och jag hittade strategier för att kunna skicka post utan risk för obehag.

Många beteenden hos hästar och hundar fyller funktionen hitta och äta mat. Om vi delar ut straff för att hästen eller hunden sträcker sig efter eller tar mat som vi inte tänkt att den ska äta just nu, t ex höpåsar på stallgången, gräset på marken eller matrester på köksbänken, så är risken mycket stor att det hästen/hunden lär sig av straffet är att undvika att ta maten när människan är närvarande. Men den kommer att sträcka sig efter tillgänglig mat när den som delar ut straffet inte är närvarande. Det är t o m med så att beteenden som minskat genom bestraffning sedan kan öka i intensitet när den som delar ut straffet inte är närvarande.  Det finns ett evolutionärt värde i att passa på att förse sig med mat när mat är tillgänglig utan risk. Människor kan tolka detta som beräkning och ögontjäneri, men ur hästens eller hundens perspektiv handlar det inte om manipulation och ifrågasättande av något ledarskap, det handlar bara om att äta mat när mat finns utan risk för fara. Om det ibland blir farligt och obehagligt att äta när mat finns gäller det att bli duktig på att urskilja när faran är över och då passa på. Ren överlevnad, inget annat.

Vila och återhämtning är andra viktiga funktioner. Vi är väl många som någon gång suttit på ridskoleponnyn som ökar tempot när ridläraren närmar sig och sänker tempot när ridläraren är riktad åt ett annat håll. Vi säger att ponnyn maskar och är lat, medan ponnyn bara använder sina medfödda förmågor att hushålla med energi genom att urskilja när det är förhöjd risk för fara eller inte.

En annan påtaglig risk med att använda bestraffning är att den som blir straffad vill börja undvika den som delat ut straffet. Att använda sig av straff kommer att påverka relationen mellan den som delar ut straffet och den som får ett straff.  Så när du använder straff för att påverka beteende så måste du ta med i beräkningen att det samtidigt kommer att innebära en försämring av relationen.  Ett vanligt påstående för att försvara användning av bestraffning och hot om bestraffning är att prata om hur hästarna eller hundarna gör mot varandra. Och visst kan du se hur hästar både bits och kickar mot varandra i vissa interaktioner. Eller hur en hundtik tillrättavisar sin valp med en morrning. Men det som glöms bort i det sammanhanget är att djuren tillbringar tid med varandra 24/7 och studerar du deras tidsbudget är det en försvinnande liten del som används till aversiva interaktioner. (Om de inte hålls i begränsade och resursfattiga miljöer så klart. Att använda interaktioner mellan två hästar i en liten platt hage utan gräs och med fodring från Ikea-kassar 4 gånger per dygn som modell för hur hästar interagerar med varandra är som att titta på människor på sluten anstalt och säga att de är rollmodeller för mänskligt beteende.) När djur i en välfungerande flock ger varandra en åthutning för att komma åt en resurs eller säga till kompisen för att den kliade på fel ställe så har de ett ENORMT relationskonto att göra uttag från. Den enstaka otrevliga interaktionen kan vägas mot tusentals trivsamma, gynnande interaktioner under dygnet, veckorna, året. Har du den relationen till din häst? Hur stort uttag från relationskontot har du råd att göra om ni endast ses 1-2 timmar per dag? Det beror både på hur länge ni känt varandra och på hur trivsamt allt annat ni gör tillsammans faktiskt är för hästen.

En annan besvärande biverkning av straff är att det inte bara är utdelaren av straffet som blir förknippad med obehagliga upplevelser, även andra stimuli som finns närvarande i situationen kan  råka kopplas till den obehagliga upplevelsen.  Om vi t ex använder fysiskt obehag som skänkel, sporre, spö etc för att få en häst att gå förbi något som den upplever som skrämmande så kan hästen, trots att vi fick den att passera, koppla både platsen och andra stimuli till obehag som bör undvikas. Om hästen t ex reagerar med att stanna för att titta på en fladdrande presenning på grannens vedhög och sedan får uppleva fysiska obehag för att förmås gå förbi, så kan den nästa gång känna rädsla för vedhögen, hela garageuppfarten och nyplanterade astrar i kruka – bara för att det var stimuli som också fanns där när den blev straffad för att den stannade till och tittade på presenningen.

Det finns ett överlevnadsvärde i att snabbt identifiera och komma ihåg olika tecken i miljön på att det finns fara. Den förmågan träffar ibland helt fel och kopplar helt ofarliga, neutrala stimuli till fara. I mitt fall med den låsta, larmade dörren så var ju tanken att det stimuli jag skulle titta efter var skylten ”Vi har gått för dagen” men pga olyckliga omständigheter blev ju kopplingen för mig låst dörr = fara. Även om jag rent intellektuellt kunde resonera – ingen skylt, ingen fara – så hade jag som inte lust att chansa. Utifall.  Och jag är en människa. En häst tänker absolut inte chansa på den där krukan om det var där hans människa fullständigt tappade det och blev hårdhänt sist de passerade. Alltså vill han helst få gå åt ett annat håll fastän presenningen nu är borta.

Ytterligare en risk med straff är att det inte bara är det beteende som straffet avser som kan påverkas. Ibland minskar även andra beteenden som du inte avsett att straffa. Om du t ex har en häst som gärna kommer när du ropar på den i hagen men som buffar eller t o m nafsar lite när den kommer fram. Du bestämmer dig för att åtgärda beteendet du ogillar med några vältajmade fysiska daskar på mulen eller du kanske inte ens nuddar hästen men viftar med grimskaftet mot hennes huvud för att påverka beteendet buffa/nafsa. Kanske ser du att beteendet buffa/nafsa minskar men också att beteendet komma till dig förändras. Hästen kanske kommer mer sällan, långsammare eller inte ända fram.  Det var ju inte din avsikt men du har råkat få en biverkan av straffet för buffa/nafsa.

Ett av de största problemen med straff är att straff inte leder till någon inlärning av vad hästen/hunden/människan ska göra i stället för det oönskade beteendet. Vilket bara ökar risken för att häst och människa hamnar i nya situationer där människan känner behov av att straffa fler oönskade beteenden eftersom hästen fortfarande inte gör ”rätt”. Att bli straffad för ett beteende innebär inte automatiskt att du vet vad du ska göra i stället, vare sig du är häst, hund eller människa.

För dig är det logiskt att hästen skulle uppleva minst obehag av att bara stå stilla vid uppsittningspallen medan du klättrar ombord. Det är ju det en häst ska göra vid uppsittningspallar - stå stilla – hur svårt kan det vara? Men i stället för att en enstaka vältajmad tillrättavisning leder till häst som omedelbart slutar trampa runt och faktiskt stå stilla så ser en ibland hästar och människor hamna i långa kedjor av beteenden runt pallen som korrigeras med olika tillrättavisningar och till slut en häst som tycker att både pall, människa och uppsuttet arbete är saker som helst borde undvikas helt och hållet om det går. Om fokus och tid i stället lagts på att metodiskt förstärka ”stå stilla med huvudet rakt fram vid pallen” hade situationen blivit trevligare för alla inblandade. Om du väljer att påverka önskade beteenden med positiv förstärkning så förvinner många oönskade beteenden av sig självt, utan bestraffning. Helt enkelt därför att det sker en faktiskt inlärning om vad som är önskat beteende i en given situation. Hästen kan inte stå stilla med huvud rakt fram och trampa runt samtidigt. Han kan inte buffas och bitas heller med huvud rakt fram. Väl förstärkta grundbeteenden löser problem innan de ens har uppstått. Och den enda biverkningen är att träning med positiv förstärkning leder till insättningar på relationskontot i stället för uttag.

Så trots alla dessa kända biverkningar, varför fortsätter vi använda straff för att påverka beteende?

Svaret ligger i vår egen förstärkningshistorik. Vi har från unga år lärt oss att vi ska bestraffa hästen när den gör oönskade saker. Vi applicerar också mänskliga moraliska värderingar på djurs beteenden och vår mänskliga kultur säger oss att dåliga beteenden som att stjäla, skada eller försöka undvika arbete ska ha straff. Men varken hästar eller hundar stjäl, maskar eller ägnar sig åt skadegörelse. I deras värld finns inte äganderätt eller arbetsmoral. Att ta tillfällen i akt, att undvika obehagligheter och att prova vilka beteenden som ger resultat är överlevnadsstrategier.

Vi är duktiga häst- eller hundmänniskor när vi reagerar och agerar. Vi känner oss handlingskraftiga. Vi får beröm och uppskattning för det. Vi får också förebråelser och kritik från omgivningen och kanske oss själva om vi inte använder straff för att på verka oönskade beteenden. (Om Hippson upplåter ett kommentarsfält till det här inlägget så lovar jag att där kommer att finnas kommentarer av typen Man Måste Faktiskt Få Säga Till och Hästar Blir Farliga Om Man Inte…. ) Så oavsett den faktiska effekten på det oönskade beteendet hos hästen så upplever vi att vårt eget beteende ”utdela ett straff” får förstärkning, både positiv (Duktig Hästmänniska) och negativ (undvika vara Dålig Hästmänniska)

Jag säger inte att du aldrig någonsin ska straffa ett beteende. Jag säger bara att innan du gör det bör du först fråga dig själv

  • Vilken funktion fyller det oönskade beteendet och kan jag ändra på förutsättningarna så att hästen inte har behov av att utföra det oönskade beteendet?

  • Vad är det jag faktiskt vill att hästen ska göra i stället för det oönskade beteendet?

  • Kan jag i stället förstärka andra önskade beteenden som gör att det oönskade beteendet avtar eller försvinner?

Om du har svaret på ovanstående frågor så finns det ingen poäng alls med att använda straff för att påverka beteendet.

Men om du ändå vill använda straff behöver du också fundera på följande:

  • Är det etiskt försvarbart för mig att dela ut ett tillräckligt obehagligt straff för att beteendet ska minska/upphöra?

  • Kommer beteendet att upphöra eller bara döljas/hållas tillbaka när jag är i närheten?

  • Har jag råd med det här uttaget från vårt relationskonto? Är jag beredd att ta risken att jag uppfattas som obehaglig att vara med och att min häst/hund helst vill undvika att vara nära mig om den kan välja?

  • Är jag beredd att ta risken att hästen/hunden kopplar ihop obehaget av straffet med platsen och andra stimuli och i framtiden blir rädd eller osäker i den miljön?

  • Är jag beredd att ta risken att även andra, önskade beteende kopplas till obehaget och också blir försvagade?

  • Gör jag det här för att jag faktiskt tror att det kommer att förändra beteendet eller gör jag det för att känna mig duktig och/eller undvika kritik?

Alla metodval kommer med biverkningar. Genom att göra medvetna riskkalkyler slipper du vara ett offer för din egen förstärkningshistorik!