Overblog
Editer l'article Suivre ce blog Administration + Créer mon blog

Je rebondis sur un sujet débattu sur un forum en ce moment autour des récompenses données au cheval et de l'apprentissage, et vous fait partager quelques unes de mes notes de lecture sur le sujet, n'hésitez pas à alimenter le débat avec vos propres avis!

Rimg0267.jpg

 

Un premier extrait d'article http://www.cheval-savoir.com/224-impulsion-economie-sensibilisation

Le cheval apprend par essais et erreurs, c’est-à-dire que lorsqu’on lui présente un stimulus ou lorsque l’on interagit avec lui, il va tester différentes réactions et leurs résultats. L’effet cadenas

Par instinct, le cheval va toujours rechercher son confort. Si le cavalier lui prodigue du confort (ou plus de confort) lorsque le cheval réagit de la manière voulue, cela va avoir ce que j’appelle « l’effet cadenas ». Dès l’instant où les trois chiffres du cadenas sont corrects, celui-ci s’ouvre. Ainsi le cheval, face à une demande du cavalier, va tester différentes combinaisons, différentes réactions. Si l’une d’elle lui procure du confort et les autres pas, celle-ci va être associée dans la tête du cheval à la demande.
Par exemple :

  1. La dame sur mon dos tire sur les rênes.
  2. Je vais :
    • a) tirer plus fort qu’elle,
    • b) lever très haut la tête pour me soulager,
    • c) enfoncer ma bouche contre mon poitrail,
    • d) m’enfuir parce que je souffre et tenter de m’éloigner de ce qui me fait mal, etc.
    • (Le rôle du bon cavalier est de ne pas arriver à ces extrêmes, nous avons vu comment dans l’article sur le demi-arrêt.)
  3. Le cheval, en essayant différentes réactions, s’arrête.
  4. Si le cavalier lui rend immédiatement les rênes, le cheval associera :
    La dame tire sur les rênes + Je m’arrête = retour du confort.
  5. Par contre, si le cavalier ne rend pas les rênes suffisamment vite, cet essai sera classé « sans résultat » et l’on risque d’imprimer chez le cheval :
    La dame tire sur les rênes + Je lui arrache les rênes des mains = c’est ce qui me donne le plus de confort même si ça fait mal.


C’est la répétition de ce que l’on appelle les associations positives qui confirmera au cheval qu’il a bien compris et que l’association est juste. Un grand nombre de répétitions rendra ses réactions automatiques lors de la reconnaissance du signal.
Si l’exemple peut paraître un peu simpliste, il est néanmoins extrêmement important de garder cela à l’esprit durant tout le dressage du cheval, même pour des exercices aussi complexes que le piaffé ou le passage.
Combien de cavaliers ne voit-on en effet pas dire que leur cheval est bête parce qu’il ne comprend pas ce qu’ils lui demandent ? Pensez à la frustration des cavaliers qui ne sont pas compris de leur cheval ainsi qu’à la frustration de l’animal qui ne trouve pas la solution et ne sait donc pas quoi faire pour que l’inconfort s’arrête.

 

travail à pied cheval

Personnellement, je suis une adepte du renforcement positif et de l'adage "tout travail mérite salaire", un effort manifeste du cheval mérite bien son sucre - bonbon - carotte ou autre récompense alimentaire .

 

Le tout est que dans la tête du cheval cela soit clair... et là, ça ce complique... qu'il associe bien la récompense et le comportement que l'on veut récompenser et reproduire à l'avenir...

Pour cela, il faut réagir avec promptitude, s'extasier de la voix à l'instant même de la réponse positive du cheval, cheval qui associera bien vite vos "Ouiiiiiiiiiiiii, bravoooooooooooo" enthousiastes avec l'annonce d'une pause (ou le clicker à la mode en ce moment) , caresse, papouille, ou d'une récompense alimentaire.

 

La récompense c'est en effet aussi l'arrêt de la solicitation (de la descente des aides à mettre pied à terre après un exercice réussi.)

 

Il semblerait toutefois que les friandises soient mieux appréciées par le cheval...

extrait de Cheval Pratique n°256, juillet 2011 sur le forum http://equinethique.forumperso

Par Sandrine Dhondt


Des bonbons ou des gratouilles? Quelle récompense est la plus efficace?

Est-il préférable de caresser ou de donner un bonbon dans le cadre de la récompense (ou "renforcement positif" en langage scientifique) ? Vous ne vous étiez peut-être jamais posé la question mais une équipe de chercheurs de rennes l'a fait pour vous. Voici les conclusions de cette étude présentée lors de la 37e journée de la recherche équine, en février.

En équitation comme dans l'éducation des chevaux en général (prise des pieds, mise à l'attache...), la récompense alimentaire est peu utilisée, contrairement à ce qui est pratiqué avec toutes sortes d'animaux, que ce soit dans les cirques ou les centres aquatiques où le lion a appris à sauter dans un cerceau de feu, récompensé d'un morceau de viande, et le dauphin à faire d'un signe ses facéties aquatiques dans l'attente d'un poisson. Des animaux qui ont, à bien les regarder, des dents plus redoutables que celles de nos chevaux, pourtant il est traditionnellement dit, dans les écuries, que les friandises incitent les chevaux à mordre.
Une précédente étude menée par Carol Sankey, de l'université de Rennes ( que nous avions relatée dans le Cheval Pratique n°228) prouvait déjà le contraire puisque le groupe de poulains au débourrage récompensé avec des friandises avait tapé et mordu 5 et 6 fois moins que le groupe témoin qui était entrainé sans récompense. La jeune chercheuse avait même déjà constaté que les bonbons avaient eu des effets positifs non seulement sur l'apprentissage mais aussi sur la relation entre ces jeunes chevaux et les êtres humains.
Par ailleurs, une autre étude menée par Séverine Henry (elle aussi de l'université de Rennes) avait déjà suggéré que la caresse n'est pas immédiatement perçue comme un événement positif par le jeune cheval. Et pourtant, nous sommes beaucoup à penser qu'elle peut suffire comme récompense. Un choix qui peut apparaitre étonnant puisque, sur une journée, dans leur "budget temps", les chevaux vont avoir des contacts tactils un peu moins de 1% de leur temps contre les 65% qu'ils passent à manger.
Alors, dans l'apprentissage, comme dans la relation, que faut-il privilégier: le bonbon ou la gratouille? Une nouvelle recherche pour Carol Sankey. Et comme toujours, pour étudier l'impact de l'un ou de l'autre, il a fallu comparer un groupe par rapport à l'autre.


L'expérience
Les cobayes sont 20 chevaux de race konik polski, des petits chevaux polonais proches du tarpan, âgés d'un à deux ans, qui vivent en groupe dans une écurie où ils ont du fourrage et de l'eau à volonté. Ils sont sortis dans un paddock quelques heures par jour. Depuis leur naissance, les contacts avec l'homme ont été assez restreints puisque limités uniquement à la distribution des rations et à ces transferts "écurie/paddock/écurie".
Les vingt chevaux ont été soumis au même protocole d'entrainement mené par la même expérimentatrice dans une écurie qui leur était familière. Chacun était déplacé en longe, arrêté, puis l'expérimentatrice posait la longe sur l'encolure, le regardait et prononçait l'ordre vocal "reste". Il devait rester immobile en réponse à cet ordre vocal par paliers progressifs de 5 secondes, puis 10, 30, 45 et 60 secondes. Le test devait être réussi lors de 3 essais consécutifs avant de passer au palier suivant (soit 3 fois 5 secondes avant de passer à 10 secondes...). Tous ont été entrainés durant six jours à raison de 5 minutes par jour, soit un total de 30 minutes. Pour un groupe, chaque essai réussi était récompensé par un morceau de carotte tandis que l'autre groupe écopait d'un grattage au garrot de 5 à 10 secondes.

________________________________________________________________________________________________________________________________

encadré: pourquoi le choix du garrot?
L'allogrooming, ou toilettage mutuel, s'effectue sur des zones particulières du corps entre partenaires privilégiés. Autrement dit: chez les équidés, on ne se gratte pas si l'on ne se connait pas bien! Deux études passées, dont celle de Claudia Feh (spécialiste des chevaux de Przewalski) avaient montré que la restitution de ce grattage au niveau du garrot par un humain amenait une diminution du rythme cardiaque, d'où l'hypothèse que cela pouvait être positif et favoriser la relation homme/cheval. Beaucoup d'adeptes de l'équitation éthologique se sont emparés de cette étude pour tisser une relation avec leur cheval. Andy Booth a beaucoup posé devant les objectifs, en grattant sa jument Okies ou sa zorse Stormy, l'une et l'autre semblant grimacer de plaisir! Si le garrot apparait souvent comme un endroit privilégié, chaque cheval étant un individu, chacun a sa propre préférence: derrière les oreilles, sous la queue, sous la crinière, sur le dos... Comme le suggérait Pat Parelli dans son jeu de la gentillesse: "cherchez l'endroit où votre cheval aime être gratté". Après ce temps de découverte, d'échange et d'apprentissage, tous les propriétaires attentifs savent que leurs chevaux apprécient ces séances de "gratouilles" et qu'ils viennent eux-mêmes chercher à être grattés en présentant à l'évidence l'endroit favori.
_______________________________________________________________________________________________________________________________

Afin d'évaluer la performance d'apprentissage, les chercheurs ont évalué l'obéissance par le temps pendant lequel les chevaux étaient capables de maintenir l'immobilité au cours de chaque séance. La relation à l'homme a été évaluée selon le test de la "présence passive": pendant 5 minutes, un expérimentateur se tenait immobile au centre de l'écurie et chaque cheval était libre de venir l'approcher ou non? Le temps de latence pour s'approcher était relevé ainsi que le temps passé proche de l'expérimentatrice, c'est-à-dire à une distance inférieure à 0,5 mètre.


Bilan et résultats
Bien sûr, des différences sont apparues en fonction du type de récompense utilisée. Tous les chevaux qui devaient être gratouillés n'ont pas semblé apprécier et ont même parfois présenté des réponses négatives ou tout simplement souhaité s'éloigner de l'expérimentatrice. Ceux récompensés d'un bout de carotte ont progressé rapidement, surtout les trois premiers jours. Le dernier jour de l'expérimentation, 90% de ce lot avait attein le palier maximal du temps d'immobilité (soit une minute), contre 40% de ceux qui étaient récompensés par le grattage du garrot.
Dans le test de "l'homme passif", les chevaux du groupe "carotte" s'approchaient plus rapidement de l'homme et passaient plus de temps proche de lui, contrairement au groupe "grattage au garrot", un renforcement qui n'a semblé avoir apporté aucune amélioration dans ce sens!
Bref, le grattage de garrot n'a pas permis de réel progrès ni dans l'entrainement ni pour la relation. Les chercheurs supposent que ce grattage n'a pas été perçu comme suffisamment positif pour être associé à une récompense, contrairement à la compensation alimentaire dont les effets positifs ont été observés rapidement, tant sur la progression des chevaux à répondre à l'ordre "reste" que dans la relation homme/cheval.
Quid des précédentes études qui avaient suggéré un bien-être lié au grattage? Nos chercheuses de Rennes font l'hypothèse que la durée de 3 minutes qui avait été choisie alors apportait un effet "massage". Quant à l'abaissement du rythme cardiaque qui avait été constaté, elles estiment qu'il ne permet pas de conclure vraiment sur la valeur positive ou négative de l'action. Et l'on peut lire dans leur rapport de cette 37e journée de la recherche équine: "les réactions négatives de certains individus suggèrent en tout cas qu'il ne s'agit pas d'un renforcement positif universel", en effet, la caresse nécessite chez le cheval un apprentissage, comme le savent tous ceux qui ont eu des poulains à manipuler.
Reste à savoir pourquoi, si elles sont si efficaces, les récompenses alimentaires ne sont pas plus utilisées dans la pratique équestre, qu'elle soit éducation ou équitation?

 

RIMG0026.JPG

A lire http://saint-vaulry.pagesperso-orange.fr/pages/articles07.htm extraits

Encore faut-il connaître et respecter sa logique simple : une récompense ne fait d'effet que dans la seconde qui suit le mouvement réussi. Ignorant ce point essentiel, bien des cavaliers gaspillent leurs efforts : pendant ¾ d'heure, ils font normalement travailler leur cheval, puis soudain, ils lui laissent tomber le Ciel sur la tête ! Alleluia, ils lui rendent les rênes, le laissent marcher librement puis s'immobiliser, le délestent de 80 kg en le caressant, le dessanglent, débouclent sa gourmette, puis le raccompagnent à son écurie chérie, où comme par miracle des carottes ont poussé dans la mangeoire… Pas moins de 9 récompenses qui s'enchaînent, dessellage non compris ! Récompenses ? Pas vraiment, si l'on considère le fameux délai de 1 seconde entre l'action et sa conséquence. Ainsi le fait de mettre pied à terre a récompensé un temps de repos, ainsi les carottes ont récompensé le retour au box… était-ce bien nécessaire ?

 

des pistes pour favoriser les apprentissages http://www.cheval-savoir.com/184-main-sans-jambes-cote-scientifique

L’apprentissage social : « positive et negative social modeling »

Beaucoup d’espèces font preuve d’apprentissage d’un mouvement particulier par imitation ou d’une stratégie pour solutionner un problème par apprentissage vicariant. L’état émotionnel de l’animal donnant l’exemple peut jouer un rôle important. Quand un cheval a par exemple peur de passer un gué, il vaut mieux le laisser précéder par un congénère étant habitué que de commencer à lutter. Inversement, la vue d’un cheval présentant des signes de peur dans une situation particulière, par exemple lors du transport, peut induire la même réaction chez des individus qui y sont exposés pour la première fois. [...]

L’« occasion setting »

En thérapie du comportement, il arrive que lorsqu’on désapprend certaines réactions indésirables au centre équestre X ou dans le cabinet du thérapeute, l’animal les produit à nouveau rapidement de retour à la maison. Il est donc parfois nécessaire d’opérer sur place. C’est le cas classique des chevaux maltraités qui paniquent en voyant un obstacle, qui reprennent confiance montés par leur propriétaire lors des leçons chez un instructeur compétent, mais qui paniquent à nouveau à la maison.

On ne peut toujours récompenser avec un biscuit, une carotte ou une caresse (bien que ce qu’on conçoit par cette dernière est un autre problème qui mérite une étude) . On peut donc faire précéder cette expérience agréable par un mot (par exemple « bien ») de façon que ce mot puisse être employé à tout moment  A l’origine, ce mot ne possède pas de valeur particulière, mais reçoit une valeur de récompense grâce à cette association. Il pourra ensuite servir pour renforcer un comportement désiré en étant prononcé tout de suite après un même pendant (shaping).[ ...]

Il règne actuellement la mode du clicker-training. La procédure est la même, le clic obtenant une valeur positive par association. L’avantage est que le stimulus est bien standardisé tandis que le mot peut être prononcé avec des intonations diverses et dans la conversation à un moment inopportun. Le désavantage est qu’il faut tenir un objet (en plus) en main. Le clicker-training peut aider certaines personnes à mieux se concentrer sur un processus d’apprentissage, mais nous ne voyons pas quel avantage il apporte à une personne bien expérimentée. Nous avons aussi vu des gens sans tact créer plus de confusion avec le clicker.

[...]


  Quoi qu’il en soit, intéressez-vous en premier à votre cheval. Lorsque vous mettez pied à terre, regardez l’œil de votre cheval et faites votre examen de conscience pour voir si vous avez bien agi envers lui car son bien-être et la conservation de son intégrité physique sont indispensables.

*www.equitationscience.com
autour des méthodes d'apprentissage
Premièrement, que si nous voulons que chaque stimulus provoque une réaction différente, l’animal doit pouvoir bien les distinguer. Si une pression des mollets doit induire par exemple, soit un mouvement en avant, soit un déplacement de côté (cession à la jambe), ou encore le piaffer, il sera nécessaire d’établir un langage clair pour le cheval. Par exemple la pression d’arrière en avant induira le mouvement en avant, la pression perpendiculaire le déplacement latéral, la combinaison avec le demi-arrêt aura un effet de rassembler etc…Plus le cavalier établira au cours du dressage des moyens de communication variés, plus subtile sera son équitation.

Le fait de réagir à des stimuli les plus faibles possibles contribue à la légèreté. On ne peut que regretter que cette qualité essentielle de l’équitation réellement académique s’observe rarement de nos jours, même au niveau international, mais cela n’est pas le sujet de cet article.
Revenons à l’exemple du chien. Si l’animal à appris à saliver en entendant une sonnette d’une fréquence de 1.000Hz, il y a des chances qu’il salive également en entendant une fréquence de 950Hz (= généralisation), mais plus de 850Hz (discrimination). On peut exploiter ce mécanisme. Quand le cheval a appris à réagir à une pression des jambes de par exemple 300 g, il faut ensuite employer 250 g. Une fois qu’il réagit instantanément à 250 g, il faut employer 200 g et ainsi de suite, jusqu’à atteindre le seuil de sensibilité de chaque cheval en particulier.

 

Un aspect supplémentaire est le niveau de base à partir duquel on donne le stimulus. Cela n’a pas encore été mesuré à notre connaissance, mais on peut raisonnablement penser qu’un cheval va être plus sensible à la transition d’une pression de 0 g à 100 g qu’au passage de 200 g à 300 g. La différence est la même, mais la discrimination sera plus aisée. Voilà pourquoi l’on conseille en équitation académique de laisser pendre les jambes le long du cheval sans exercer de pression et de ne jamais utiliser de pressions fortes des jambes. Il faut immédiatement sensibiliser le cheval par la leçon de la jambe avec la cravache ou la chambrière lors du débourrage, faute de quoi il s’habituera aux aides fortes et s’abrutira. Il ne connaîtra alors jamais la véritable impulsion. Il conservera au mieux son rythme d’une façon mécanisée et terne. Le même apprentissage sera fait plus tard avec les éperons. Le cheval apprend ainsi graduellement (et avec un peu de tact il comprendra très vie) par association de la cravache aux éperons, des éperons aux mollets, des mollets aux fesses, à réagir aux aides les plus fines.

 

Descente de mains, descente de jambes, descente de voix…

Voilà probablement un des principes de base de l’équitation académique qui est le plus souvent ignoré par l’équitation moderne, et le dressage en particulier. Cela paraît simple : cesser toute aide quand le cheval est dans l’attitude requise ou au rythme désiré. Accompagner et ne pas gêner. Cela demande cependant suffisamment de sensibilité afin de détecter un changement et de donner alors l’aide adéquate avec l’intensité adéquate afin de retourner au stade désiré. Les anciens parlaient de descente de jambes et de mains.
Dans le conditionnement dit « opérant » (certains auteurs pensent que ce conditionnement peut s’expliquer par les mécanismes du conditionnement pavlovien, mais ça c’est une autre histoire) on renforce ou inhibe un comportement en le faisant suivre respectivement par une expérience agréable (récompense) ou désagréable (punition). La récompense est « positive » quand on présente quelque chose qui en soi est agréable, par exemple une carotte ou un biscuit. La récompense se dit « négative » quand elle consiste en la disparition ou l’évitement (par anticipation) d’une expérience désagréable. [...] Imaginons qu’un cavalier désire apprendre l’appuyer à droite à son cheval en touchant le flanc en arrière de la sangle avec l’éperon gauche. Pour bien conditionner, il devra cesser la pression dès que le cheval fait un pas de côté à droite. Une expérience désagréable cesse par évitement. Ensuite la présence de la jambe gauche à cet endroit permettra au cheval d’éviter l’éperon en se déplaçant à droite. Si le cavalier continue à donner de l’éperon, le cheval ne comprendra pas ce qu’il doit faire : la récompense négative ne peut avoir lieu.
http://www.cheval-savoir.com/archive-fevrier-2010-7.php
Apprentissage et économies des aides
Il est primordial de voir les aides et les signaux que l’on donne à l’animal comme quelque chose dont l’intensité peut varier. Tout comme vous pouvez augmenter le volume sonore de votre chaîne hi-fi, il faut considérer les aides comme des actions dont l’intensité peut être de plus en plus importante jusqu’à obtenir une réaction de la part du cheval.
Durant les leçons avec de nouveaux élèves, j’aime prendre l’exemple de la manière dont on demande à un enfant de venir à table pour le repas. S’il est évident que nous allons d’abord lui demander gentiment et doucement, nous allons lui demander avec plus de fermeté en cas de refus ou s’il ne réagit pas, jusqu’à, en cas de grande désobéissance, aller le chercher ou le punir si nécessaire. Cela n’implique bien sûr pas de brutalité mais il est parfois nécessaire de montrer à un enfant qu’il a tout intérêt à réagir rapidement afin de ne pas entrer en conflit car la demande des parents ne peut être ignorée.
Il en va de même pour le cheval car l’animal plus encore que l’enfant va avoir régulièrement besoin de tester les limites. Il a en effet énormément besoin d’être rassuré en vérifiant qu’il a bien compris ce que l’on attend de lui et il n’y a pas pire situation que la confusion provoquée par le manque d’homogénéité des demandes.
Ainsi, et les lecteurs attentifs l’auront sans doute déjà compris lors des demandes d’arrêt par le dos, nous allons TOUJOURS demander au cheval un type de réaction particulier en utilisant les MEMES AIDES.

D’autre part, nous allons TOUJOURS commencer par demander au cheval de réagir à l’aide la plus fine et discrète possible.
Ce n’est qu’en cas d’absence de réaction que nous allons augmenter progressivement l’intensité de celles-ci jusqu’à obtenir une réaction. Ainsi, nous donnons à chaque répétition la possibilité au cheval de réagir à l’aide fine AVANT de devoir utiliser une aide de plus en plus inconfortable.
http://www.cheval-savoir.com/224-impulsion-economie-sensibilisation

 

 

et enfin deux trois petites phrases toutes simples à garder en tête:


  • « questions simples et précises »
  • « ne jamais accepter sur le moment ce que l’on refusera plus tard »
  • «commencer par se remettre en question soi-même"
  • "toujours finir sur une réussite"
Tag(s) : #séance de travail du cheval -dressage - CSO...
Partager cet article
Repost0
Pour être informé des derniers articles, inscrivez vous :