Su questo sito usiamo i cookies. Navigandolo accetti.

Stampa


addestrare cane

Il tasso di rinforzo.

Prima di parlare di tassi di rinforzo, un piccolo riassunto. Un rinforzo NON è qualcosa che piace al cane. Perché qualcosa sia definito un rinforzo, deve avere un effetto sul comportamento del cane: deve AUMENTARE un comportamento. Un comportamento può aumentare in frequenza (il cane lo fa più spesso), in intensità (es. nel target naso/mano il cane tocca la mano con più forza), in durata. Perché qualcosa sia definito un rinforzo, deve avere un secondo requisito: il cane deve essere disposto a spendere energie per ottenerlo. Nel clicker training, la sequenza degli eventi è:
il cane esibisce un certo comportamento - CLICK - rinforzo.

target click

Rinforzi continui (tasso fisso 1=1)
Se il cane sta imparando qual è il comportamento che funziona per ottenere il rinforzo (es. un gustoso boccone), per aiutarlo a capire è necessario fare click e dare il boccone OGNI volta che il cane esibisce il comportamento gradito.
Es. il cane alza la zampa destra, click e boccone. Ogni volta che il cane alza la zampa destra, click e boccone. In questo caso si parla di tasso di rinforzo fisso, ma anche se date 1 boccone ogni 5 volte è un tasso fisso, con un diverso rapporto  (5=1). Più correttamente questo è un rinforzo continuo: 1 comportamento = 1 rinforzo. Alcuni autori, come Bob Bailey, consigliano di usare molto a lungo un tasso di rinforzo continuo, per fissare il comportamento gradito.

Rinforzi variabili
Quando il cane ha imparato qual è il comportamento che funziona per ottenere il rinforzo, si consiglia spesso di iniziare a variare il rinforzo. Il non otterrà quindi il rinforzo ogni volta che esibisce il comportamento corretto, ma lo ottiene secondo uno schema. Se state lavorando alla condotta, il cane può ottenere il click e la pallina dopo 1 passo, 4 passi, 10 passi, 2 passi... Non poter prevedere quando otterrà il rinforzo porta il cane a insistere nel comportamento, un meccanismo noto nel gioco di azzardo.

cucciolo border addestrare

Dalla teoria alla pratica

Fin qui la teoria. Il problema con la teoria è che funziona molto bene per descrivere il comportamento dei topi e dei ratti di laboratorio, ma può essere del tutto insufficiente e lacunosa per descrivere la straordinaria complessità della comunicazione uomo/cane. Cercherò di riassumere in alcuni punti le variazioni rispetto alla teoria classica sui tassi di rinforzo.

Tassi variabili o rinforzi variabili.
Uno dei nostri obiettivi nell’addestramento del cane, è insegnare al cane a accettare rinforzi di diverso valore. Invece di variare il tasso di rinforzo, variamo il rinforzo. Un cane con corrette competenze accetta di passare dal cibo al gioco, e viceversa, di passare da un giocattolo a un altro, o da un gioco a un altro tipo di gioco. Variare il rinforzo permette di dare all’informazione contenuta nel rinforzo una maggiore complessità e un maggior dettaglio.
Tasso continuo e principio di Premack.
Nel confronto con addestratori che hanno esperienza di lavoro con specie diverse, emerge che gran parte del lavoro viene svolta in rinforzo continuo. In pratica, l’animale ogni volta che esibisce il comportamento corretto, viene rinforzato. Questo da all’animale una informazione coerente e consistente nel tempo. Questo non significa affatto dover dare cibo ogni volta (il cibo è considerato un rinforzo primario), perché è possibile utilizzare dei comportamenti come rinforzo, secondo quello che è conosciuto come principio di Premack.
Tasso continuo e rinforzi sociali.
In diversi contesti io preferisco non usare il clicker, e usare un rinforzo di tipo sociale. Si tratta di contesti nei quali voglio focalizzare l’attenzione del cane non su un proprio comportamento, ma sull’interazione con me (o con il proprietario). In questo caso il rinforzo è continuo, è variato modulando l’informazione sociale (es. attenzione visiva, voce, contatto fisico...).
malin condotta

Comportamenti di durata e tassi variabili.
I tassi di rinforzo variabili sono consigliati e usati nei comportamenti di durata, come il terra resta o la condotta. In tutti e due i casi, per me la parte importante del lavoro non è associare il comportamento a un rinforzo, ma costruire le competenze necessarie perché il cane sia in grado di fare ciò che gli chiediamo. Nel terra resta le competenze richieste sono l’auto controllo, la confidenza, la fiducia. Nella condotta io insegno un insieme di comportamenti, che formano la mia unità di base. La durata della condotta è la capacità del cane di ripetere questa unità senza andare in frustrazione. Si tratta quindi di competenze fisiche (postura, andatura, uso del corpo), mentali (posizione, attenzione), emotive (attivazione, frustrazione).
Comportamento rigido o fluido?
Uno degli errori più frequenti è considerare il comportamento come un elemento rigido, qualcosa che una volta che è stato insegnato non cambia più nel tempo. Il comportamento in realtà è soggetto a continue variazioni, legate alle informazioni che il cane riceve intenzionalmente o non intenzionalmente da noi (nell’addestramento formale e fuori da questo contesto). Proprio perché il comportamento è fluido, mutevole, è importante arginare le naturali variazioni con informazioni coerenti, che aiutino il cane a fare la scelta corretta.

 

Testo Alexa Capra

Fotografie Daniele Robotti

Tutti i diritti riservati - All rights reserved