Savner mer belønningsbasert trening: – Tradisjon for press og ettergift
– Mange forbinder belønningsbasert trening kun med hund og klikkertrening. I ridemiljøet er det mange som rynker på nesen, da det er en tradisjon for press og ettergift. Det er verktøyene som brukes, og det man læres opp til. Men det gjør noe med relasjonen til hesten, sier Grete H. M. Jørgensen.
Hun har en doktorgrad i etologi, husdyrmiljø og dyrevelferd, og jobber hos Norsk institutt for bioøkonomi (NIBIO). I tillegg har hun forsket mye på sosial atferd hos hest, og hun driver besøksgård, rideskole og oppdrett av nordlandshester.
– Det trenger ikke være enten eller! Man kan nå målene sine også ved å bruke hele læringsteorien, fortsetter hun.
Positiv og negativ forsterkning og straff
De to hovedgruppene innen assosiativ læring er klassisk betinging og operant betinging. Førstnevnte handler om å koble to hendelser opp mot hverandre. Klikkertrening er et eksempel på slik læring, der en lyd kobles til at hesten senere belønnes. Men det kan også dreie seg om ubehagelige koblinger.
Operant betinging favner positiv og negativ forsterkning og straff. Enkelt forklart er «forsterkning» noe som øker sannsynligheten for at ønsket atferd oppstår, mens «straff» er noe som reduserer sannsynligheten for at uønsket atferd oppstår på nytt. «Positiv» betyr at du legger til noe og «negativ» betyr at du tar bort noe.
Jørgensen forklarer at positiv straff altså ikke er en god straff, men en tilført straff. Som bruk av pisk eller et rykk i tøylen. Negativ straff er å ta bort noe hesten ønsker seg.
Positiv forsterkning er å belønne ønsket atferd, for eksempel med en godbit, mens negativ forsterkning er å ta bort ubehag. Det betyr at det å trene med press og ettergift, er negativ forsterkning.
Men hvor går grensene mellom disse fire pilarene? Det er det faktisk bare hesten som bestemmer.
Hva skjer i hesten når den utsettes for straff?
Vi mennesker lærer best når vi er interesserte og motiverte. Det gjør dyra også, viser forskningen. Det betyr at hestene lærer dårlig når de er stresset, redde eller sinte.
Derfor oppfordrer Jørgensen til varsomhet ved bruk av positiv straff, og særlig straff som fører til smerte eller trussel om smerte.
– Også negativ straff kan aktivere stresshormoner, ved at vi tar bort noe hesten vil ha. Men få hester går rett over i sinne – de fleste er positivt innstilt.
Negativ forsterkning og positiv straff spiller utelukkende på stress og fryktsenteret i hjernen. Hesten kan bli redd, irritert og føle på ubehag. Da kommer stresshormonene.
Jørgensen trekker her inn Maslows behovspyramide. Nederst finnes de fysiske behovene, som dekkes av mat, vann, skygge, hvile og bevegelse. Over finnes de psykiske behovene, som dekkes av trygghet, sosial kontakt, læring og utvikling. Øverst finnes de individuelle behovene, som dekkes av lek, utforskning, læring og optimal prestasjon.
Både ubehag og minne om ubehag påvirker pyramiden oppover, og reduserer derfor hestens overskudd til å prestere.
Ulike former for belønning
Tilbake til at det er hesten som bestemmer grensene. Det er en glidende overgang mellom hva hesten oppfatter som belønning, og hva den oppfatter som straff.
– Der må vi være kjempeforsiktige, og derfor råder jeg til å lese seg godt opp på dette. Få lærer disse tingene gjennom tradisjonell rideundervisning.
Jørgensen presenterer et eksempel på hvordan hestens opplevelse avgjør. Ved å bruke positiv forsterkning, venter hesten hele tiden på å få mer. Det kan skape frustrasjon og aggresjon, og ventingen kan faktisk oppleves som negativ straff, ved at forventet belønning ikke kommer.
– Mine råd er å vite når du beveger seg fra det ene til det andre. Da er du nødt til å kjenne hesten du jobber med, men også læringsteorien godt.
– Hva er eksempler på ulike måter å belønne hesten?
– Vi har vel alle lært at den beste belønningen er å avslutte treningsøkten og la hesten få fri. Da skal man være skikkelig god og evne å gi seg etter kanskje fem minutter. Hvis det var akkurat da den ønskede adferden oppstod. De færreste greier det – man vil jo ri hele timen sin. Hvis vi evner å endre tankesettet vårt, og deretter sette dette ut i praksis, skal det egentlig være slik at hesten vil være med oss, og da er det kanskje ikke belønning at treningen er slutt?
Mer konkrete eksempler på belønninger kan være gulrot, kraftfôr, kløing eller gressing. Det er individuelt hva hesten opplever som den beste belønningen, sier Jørgensen.
Hun benytter klikkertrening i stor grad selv. Fordelen med det, er at hun kan gi umiddelbar respons til korrekt atferd, før belønningen kommer. Det er hesten vel vitende om. Det er en løsning som også fungerer fra vogn, og som lærer hesten å være tålmodig. Klikkerlyden kan komme fra en fysisk klikker, men den kan også være et ord, eller et spesifikt lydsignal man enkelt kan lage. Jørgensen bruker et tungeklikk – en dyp smattelyd.
– Den kan jeg lage uten å bruke hender og lyden betyr «Bra! Flink hest! Vent litt, så får du godis». Hesten stopper da opp, selv om den var i galopp, og venter pent på belønningen sin.
Læringsteori i en stressende situasjon
Det er ikke et ukjent scenario å skulle ut på reise, men så blir man stående ved rampen på hengeren. Helt fast. Da er gode råd, dyre, mener Jørgensen.
– Har du det travelt, lukter hesten det. Har du ikke tid til å løse situasjonen på en fin måte, tyr du kanskje til tau og jaging. Det forsterker hestens ubehagelige opplevelse av situasjonen. Så ender den kanskje på en stevneplass med mye stress og kaos – hvilket også vil befeste seg. Med så mye spenninger både fysisk og psykisk, går det sjeldent veldig godt, når du skal konkurrere, hevder hun.
– Så hvis hesten merker den lille spenningen i kroppen din og nekter, hva gjør du da?
– Alt ligger i grunnlaget. Lei hesten innom hengeren i hverdagen og gi den kraftfôr der. Bruk positiv forsterkning i tilvenningen til henger. Det tar ikke så mye tid å snu den spenningen og frykten, med positiv forsterkning. Men da må du også greie å puste, og bestemme deg på forhånd. Utstyr deg med en mageveske full av gulrøtter fremfor å piske hesten om bord. Bruk lokking eller lei en annen hest om bord, som går rett på. På stevneplassen kan det kanskje være lurt å ta en runde rundt plassen for å puste, sier etologen og forskeren, og fortsetter:
– Men med hest er det veldig vanskelig å unngå press og ettergift totalt i alle situasjoner. Noen mener det ene ikke kan brukes sammen med det andre, og det skjønner jeg. Hjemme kan du med fordel øve inne på et inngjerdet område med hesten helt løs. Men vi kan sjelden slippe hesten løs på stevneplassen, så å ha på grime og tau for å kunne guide den i riktig retning, er ofte en forutsetning. Samtidig finnes det en balansegang der. Unngå å være så oppkavet og brå i din bruk av leietauet at det oppleves som negativt for hesten, for da kommer stresshormonene. Ikke vift, pisk eller dra voldsomt.
Jørgensen forklarer at dersom du bruker for mye straff, trumfer det alt av godbiter i hele verden. Hesten har for mye adrenalin og kortisol i kroppen, og den tar ikke til seg godbit engang.
– Den er ikke motivert for noe belønningsbasert trening før det har gått lang tid. Står du i en slik situasjon på stevneplassen, så kan timene fort gå. Selv om hesten har fått tid til å nullstille seg så kan et negativt minne om hestehengeren gi en sperre for å gå på den neste gang igjen.
Husk også at det finnes ulike måter å håndtere stress på, og hestene som reagerer med lært hjelpeløshet, kan gå under radaren.
– Påføres hesten så stort press at den ikke greier mer, vil den drukne i sanseinntrykk og stimulans, og kanskje reagere med å stenge ute all påvirkning. Hesten kan være tilsynelatende medgjørlig, men plutselig kan hesten også eksplodere reaksjonsmessig. Vil den da lære noe? Nei. Det vi ønsker, er en våken men tenkende hest som vi har god kontakt med.
Lær å bruke godbiter riktig
– De fleste rideinstruktører i Norge i dag har fortsatt ikke god kjennskap til positiv forsterking og klikkertrening, og ler kanskje av deg hvis du møter opp på en trening med gulrotbiter i lomma. Det er «fy, fy». Og du blir beskyldt for å bestikke hesten eller lære den å bite, fortsetter Jørgensen.
Det er en vesentlig forskjell på belønningsbasert trening og det å ha med godbiter og gi dem inkonsekvent til hesten. Man gir ikke godbit ved masing, men krever en atferd først. Denne måten å trene på må settes i system – du kan ikke bare stappe godis i hesten hele tiden.
– Reglene må være avklart først, og min anbefaling er å gå på kurs. Finnes det ikke gode kurs for hest i din nærhet, ta et kurs for hund for eksempel. Her er det mye å lære.
Har du tenkt over hva slags hormoner og emosjoner du fyller hesten din med når du trener og jobber med den?
– Flere ønsker en bedre relasjon med hesten sin, men aner ikke hvor de skal begynne. Hesten kan ha med seg traumer fra langt tilbake i tid som det er vanskelig å få bukt med. Kanskje løper den bare sin vei når du kommer med grima. Hvorfor vil den ikke være sammen med deg? En fin måte å aktivere de gode hormonene og emosjonene på, er ved å ha det gøy sammen. Lek, gå på leieturer eller jobb løst på banen eller med tau. Legg fra deg høye ambisjoner og forventninger og benytt sjansen til å gjøre tilvenningen til gress til kvalitetstid sammen med din hest. Og så kan du jo begynne å utforske belønningsbasert trening, når du føler deg klar for det, avslutter Jørgensen.