There is plenty of information
on clicker training in English in the Internet, such as
the
famous web page by Karen Pryor. However, there is almost
none of it in Spanish. Therefore, I decided to write a summary in
Spanish so that people can get an idea about it, without the necesity
to know the English language. I even published a
very short summary in German on my blog.
El
clicker training
Un divertido método de aprendizaje
© mayo 2005, Heike Ebelt
Índice
1. Tiempo libre con mi perrita
Maggie
Cuando es posible paso mi tiempo libre con mi perrita Maggie, una
beagle de dos años. A ella le encanta correr y jugar con otros
perros. También necesita “trabajo mental” para
quedar sana y feliz. Por eso, de vez en cuando le enseño trucos
con un método especial conocido como el clicker
training el cual me gustaría explicar cómo funciona.
2. ¿Qué es
el clicker training?
El clicker training describe una manera de enseñar a los animales,
la cual se basa en el hecho de que los animales tienden a repetir
acciones que tienen una consecuencia positiva y que funciona como
refuerzo.
3. ¿Qué animales
se pueden entrenar?
Se pueden entrenar caballos, gatos, ratas, delfines y, por supuesto,
perros, entre otros, - de cualquier raza y de cualquier edad. Los
cachorros aman este método y los perros viejos aprenden nuevos
trucos. La única restricción es la condición
de salud del perro y el tipo de trucos que le quieres enseñar.
4. El refuerzo condicionado –
El clicker
Sin embargo, para que el animal asocie el refuerzo con su conducta,
el refuerzo tiene que suceder exactamente en el momento que la conducta
ocurra, no después.
Una forma para que el animal se dé cuenta de que hace algo
correctamente en un momento específico es
el uso de un refuerzo condicionado. Este
refuerzo puede ser un sonido inmutable de clic producido por cualquier
instrumento como el clicker, el cual uso con Maggie. Es una cajita
plástica con una barra de metal que produce un sonido duro
con doble tono producido cuando se empuja y se libera.
Su valor es que tiene un sonido único el cual no se pierde
en la burbuja de palabras que usualmente tiramos a nuestras mascotas.
Funciona como un comunicador claro. Además, es más
rápido que decir “¡Órale, niñita,
bien hecho!”
y nos permite marcar con gran precisión el momento de la conducta
deseada, como si se tomase una foto de eso.
Algunos perros tienen miedo con el fuerte tono. Si eso ocurre con
tu mascota es recomendable poner el clicker en la bolsa de tus pantalones
o cubrirlo con una pieza de tela para disminuir el volumen del sonido
al principio hasta que el perro se acostumbre.
La función primaria del refuerzo condicionado es un indicador
que el animal no trata de obtener. Eso es más comprensible
si preguntamos
¿por qué el perro debe estar interesado en un sonido
como el clic? La respuesta es que en realidad no lo está.
5. El refuerzo primario –
Los premios
El refuerzo primario, por otro lado,
es algo que al animal le gusta verdaderamente y lo considera como
un refuerzo. Estos refuerzos pueden ser juguetes o comida. Para enseñar
algo completamente nuevo a Maggie prefiero usar premios suaves y
muy sabrosos, como especiales para perros o piezas de vegetales o
frutas, como sandía, plátano, manzana o zanahoria los
cuales corto en porciones pequeñas para que el perro las pueda
deglutir rápidamente.
Cuando el refuerzo condicionado es combinado con un refuerzo primario,
éste alcanza igual importancia para el animal. Es necesario
que del clic siempre siga un premio. De tal manera, el clicker se
convierte en una herramienta poderosa.
Ahora podrías preguntarte ¿por qué es necesario
dar un premio a tu mascota de cualquier modo? Tal vez sueñas
con que un perrito hace todo por amor y por gracia porque tú lo
cuidas. La realidad es que los perros son egoístas (como nosotros).
No pierden energía costosa en acciones inútiles, como
sentado en frente de un refrigerador esperando que se abra automáticamente
y le dé comida. Tal vez intenta pocas veces. Sin embargo el
perro se rinde muy pronto cuando se da cuenta de que no funciona.
Sin embargo, su naturaleza oportunista no lo hace menos amable.
Al contrario, eso muestra que los perros son muy inteligentes. Por
eso es importante que les demos una razón muy buena y los
convenzamos para que muestren una conducta en especial. Hacemos un “contrato” con
nuestro perro con el cual le prometemos algo que quiere si ofreció algo
antes que nosotros queremos. Ese dicho contrato existe entre tú
y tu perro por el clicker al que le sigue siempre un premio.
De esta manera, el proceso del entrenamiento se vuelve un dialogo
entre ustedes dos: El perro te mira buscando tus instrucciones, las
informaciones sobre lo que quieres, y confirmaciones, si te ofreció lo
que quisiste. Además, trabaja muy contento, disfrutando el
tiempo contigo.
Sin embargo, no es necesario que siempre se tenga que dar un premio
durante toda la vida del perro. ¿Cómo se hace?, voy
a explicar más adelante.
6. El clic al momento correcto
Lo que tienes que hacer antes de empezar con el entrenamiento es
aprender a presionar el clicker al momento correcto. No es fácil.
Puedes detectarlo cuando dejas caer una pelota e intentas presionar
el clicker exactamente en el momento cuando la pelota toca el piso.
Si el clic aparece demasiado tarde reforzarás probablemente
conductas en tu mascota que no quieres.
Eso pasó con la instructora de delfines Karen Pryor quien
estaba interesada en esforzar a que un delfín nadara voluntariamente
de una alberca a la otra. El delfín nadaba a través
de la puerta a la otra piscina, e inmediatamente daba una vuelta
para regresar a la primera alberca antes de que el manejador tuviera
oportunidad de cerrar la puerta. Cuando Karen, por fin, encontró a
alguien quien observó
el proceso, le dijo que ella dio siempre la señal del refuerzo
(por un pito que también funciona como un clicker) cuando
el delfín empezó a dar la vuelta. Así, reforzó una
vuelta hacia la primera alberca en lugar de nadar directamente de
una a otra. Cuando ajustó su tiempo por sólo una fracción
de un segundo, el problema desapareció.
Esta experiencia nos muestra que es fundamental que el entrenador
revise lo que refuerza, y observe a su mascota muy bien.
Según mis observaciones, es mejor usar el clicker aún
un poco más temprano, antes de alcanzar la conducta querida,
para evitar que sea demasiado tarde cuando la conducta ya desaparezca,
porque todavía podemos intentar prolongar el clic un poco
más para obtener la conducta final.
7. El clic significa el
premio
Antes de enseñar algunos trucos, el animal tiene que establecer
una conexión entre el sonido de clic y la apariencia del premio.
Para esto, se lleva al animal a un cuarto silencioso para evitar
cualquier posible distracción. Se hace el sonido clic y se
da premio unas veces sin pedir una conducta en particular, hasta
que el animal empiece a buscar el premio siempre cuando escuche el
sonido, y lo asocie con algo positivo.
8. Captar una conducta
Para reforzar la conducta, hay que captar una
conducta al principio. Algunas de estas conductas ocurren naturalmente,
como sentarse o echarse, aún cuando hay certidumbre del comportamiento.
Así, es posible captar la conducta poniendo el animal en una
situación en la cual es más probable que la conducta
ocurra y esperando con mucha paciencia a que suceda.
9. Mucha paciencia
Aquí se hace claro: La paciencia – contigo y con tu
mascota
– es la clave para el éxito del clicker training, en
particular al principio cuando la mascota todavía no sabe
que tiene que descubrir una conducta en especial y no recibe ninguna
ayuda, excepto por el sonido. Sin embargo, después de pocas
sesiones con el clicker, tu entrenamiento resulta más eficaz.
Tu mascota sabe que tiene que detectar lo que quieres de ella, y
ofrece varias conductas las cuales puedes reforzar.
Para enseñar conductas no naturales a un animal hay la alternativa
de indicar con comida en la posición apropiada. Sin embargo,
de esta manera el animal sigue tu mano con el premio sin pensar en
su conducta. Además, no queremos que nuestro perro ofrezca
conductas sólo cuando ve un premio. Aquí es importante
que el premio como indicador desaparezca tan pronto como sea posible.
Para evitar eso, los entrenadores del clicker training usan un target
stick, un palo con un punto marcado en otro color, lo cual
sigue el animal con su nariz. Para hacer eso, por supuesto, fue
reforzado antes. El target stick te
permite dirigir el perro en cualquier posición, o enseñar
movimientos, como dar una vuelta en el sentido de las manecillas
del reloj.
10. El clic termina la conducta
Tal vez te diste cuenta de que el perro termina su
conducta cuando escucha el sonido de clic para recoger su premio.
El perro ofreció la conducta y merece su premio, como indicaste
con el clicker. No te preocupes, vuelve a repetir la misma conducta
para obtener otro premio.
11. La motivación
y la concentración
El clicker training vive de la motivación de tu animal. Si
pierde su interés, todo el método resulta infructuoso.
Pero, para que se quede motivado el animal no es suficiente darle
premios. Aunque tu mascota puede continuar horas y horas con las
sesiones del clicker training es recomendable dejarlas muy breves,
entre dos y cinco minutos, diez minutos máximo, para asegurar
que se concentre y sea motivado durante todo el tiempo del entrenamiento.
También es deseable terminar cuando el animal lo disfruta
mucho, preferiblemente con un “premio gordo”, una mano
llena de premios, si el animal hizo algo particularmente fabuloso.
Además, una sesión no siempre es muy progresiva y exitosa,
en particular si somos demasiado exigentes con nuestro perro. En
ese caso se puede terminar el entrenamiento con un ejercicio que
el perro seguramente sabe y le gusta hacer. El “premio gordo” y
el “gran final” nos dan un buen sentimiento lo cual influye
nuestra actitud para la próxima sesión. Esto lo puedo
ver con la reacción de Maggie: Siempre cuando saco el clicker,
recibo toda su atención inmediatamente.
12. Moldear una conducta
Tanto para la mascota como para el dueño es importante tener éxito.
Todos los buenos premios son inútiles si el animal no tiene
la oportunidad de ganarlos. Para garantizar el éxito es muy
ventajoso moldear la conducta y separarla en pequeños pasos.
Se refuerzan aproximaciones más y más cercanas a la
conducta final. El sonido indica que la mascota está en la
pista correcta para alcanzar la conducta deseable.
Por ejemplo, si yo deseara enseñar a mi perrita a que brinque
a través de mis brazos formando una llanta, entonces yo refuerzo
al principio sólo sus aproximaciones a un aro; más
tarde las tocas, sea con sus patas, su boca o su nariz. Entonces
requiero que ella camine parcialmente a través de la llanta,
después completamente. Posteriormente empiezo a subir la llanta
del suelo. Luego formo con mis brazos una llanta, todavía
cargando el aro. Y finalmente remuevo el aro, sólo mostrando
mis brazos.
13. Las conductas más
complejas
Las conductas moldeadas pueden ponerse juntas en una cadena para
producir una secuencia, una nueva conducta. De esta manera el perro
puede aprender trucos bastante complejos, como traer una pelota cuya
secuencia sería la siguiente: (1) sentarse al lado del
dueño, (2) quedarse quieto hasta que el dueño
tira la pelota y envía al perro, (3) correr a la pelota,
(4) quizá buscar la pelota, (5) recoger la pelota,
(6) regresar corriendo al dueño, (7) sentarse en
frente del dueño, y (8) entregar la pelota en la mano
del dueño.
Es recomendable entrenar cada uno de los ejercicios, paso a paso,
y al revés, empezando con el último ejercicio y terminando
con el primero para que el perro sepa muy bien los ejercicios que
aparecen al final de la secuencia. En el caso que he mencionado,
el perro debe ser muy bueno para sentarse y entregar la pelota, y
aún mejor si le encanta. Entonces, pasando la secuencia, las
partes posteriores, que son más fáciles, funcionan
como refuerzos para las partes anteriores, que son tal vez no tan
fáciles. Ese proceso refuerza y fortalece la completa secuencia.
14. Añadir una clave
Una vez que el perro ofrece la conducta final querida en una base
regular, puedes empezar a añadir la clave a
la conducta.
Yo prefiero usar la palabra clave en
lugar de comando porque el comando implica
que ponga mi voluntad encima de la de mi perro, rompiendo la suya
para que me obedezca, sin voluntad propia. La clave, sin embargo,
implica que una señal casi automáticamente provoca
la conducta del perro, pero todavía ofreciendo su voluntad.
Una señal puede ser un ademán con la mano o una palabra.
Debido a que nuestros perros no entienden nuestro lenguaje, una palabra
sólo se convierte en una señal con significado cuando
está
acompañado con una acción después de muchas
repeticiones. Otra vez, la paciencia es importante.
En general se puede decir que los perros, como son buenos observadores,
entienden mucho mejor las señales corporales que verbales.
Es evidente si se hace una prueba, dando una señal corporal
para una conducta, como sentarse, y al mismo tiempo una señal
verbal para otra conducta, como echarse. Muy probablemente, el perro
va a ofrecer la conducta que se ensaña por el cuerpo y se
sienta.
15. La generalización
Ahora es el tiempo para empezar a generalizar la conducta. ¿Por
qué es necesario hacerlo? El perro asocia su conducta aprendida
con todo su ambiente, sea el cuarto, tu ropa, o tu posición
corporal. Por ejemplo, cuando siempre enseñaste a tu perro
que se siente en frente de ti y lo hace frecuentemente, se presenta
inseguro cuando quieres que se siente a tu lado. Seguramente el perro
va a intentar hacer una vuelta pequeña para alcanzar la posición
conocida. Esa falta de generalización puede ser muy útil,
por ejemplo cuando quieres permitir que tu perro se suba en la cama
de un cuarto, pero no en la cama de otra habitación. Sin embargo,
muchas veces la discriminación del perro se presenta como
un obstáculo, cuando queremos un perro sentado aún
en lugares desconocidos.
¿Qué podemos hacer para obtener un perro que entiende
mi señal y muestra la conducta querida, independientemente
del ambiente? Tenemos que entrenar la generalización con nuestro
perro. Poco a poco añadimos detalles diferentes y aumentamos
el nivel de distracción. Siempre cuando estamos casi seguros
que nuestro perro no va a fallar podemos avanzar un nivel de la dificultad.
Por ejemplo, si siempre entrenamos la mascota en la cocina, vamos
ahora a la sala. Después podemos ir al parque donde hay poca
distracción, como unas personas sentadas en un banco lejos,
a continuación con mucha distracción con otros perros
que estén cerca. Con repeticiones tu mascota aprende que su
conducta no depende del ambiente, sino sólo de la conducta
misma. Es una experiencia muy importante. Una vez entendido este
principio, tu perro va a ser muy rápido con la generalización
de nuevos trucos aprendidos.
16. Varias categorías
en una conducta
Tal vez quieres enseñar a tu perro que se siente muy rápido
en una distancia de cinco metros lejos de ti, y se quede por diez
segundos. La conducta contiene tres categorías: (1) el
tiempo entre tu señal y la conducta mostrada, (2) la
distancia entre el perro y tú, y (3) la duración
de la conducta.
Para asegurar el éxito es importante que enseñemos
a nuestro perro cada categoría separada y en pasos pequeños.
Empezamos con un sentado rápido.
Cuando el perro se siente después de cinco segundos en promedio,
vamos a reforzar sólo todos los sentados que se ofrecen después
de cinco segundos o menos. Si el perro ofrece un sentado más
rápido, subimos el nivel de dificultad y sólo damos
un clic con premio para un sentado después de tres segundos.
De esta manera continuamos hasta que alcancemos nuestra meta de un sentado
rápido de un segundo.
Cuando enseñamos un sentado en distancia,
empezamos con un medio metro y aumentamos la distancia al perro poco
a poco. Al mismo tiempo, sin embargo, bajamos la dificultad de nuestra
primera categoría de un sentado rápido y
reforzamos también los sentados que duran más que cinco
segundos hasta que el perro ofrezca un sentado. Sólo nos concentramos
en la categoría que queremos reforzar en este momento.
Lo mismo hacemos con la categoría de un sentado
con duración. Entablamos al principio un sentado
de dos segundos, posicionándonos cerca de nuestro perro
y esperando por la conducta hasta que la ofrezca. Lentamente aumentamos
el tiempo, siempre considerando que el perro debe tener la experiencia
del éxito, que quiere decir que no debemos ser exigentes,
aumentando el tiempo demasiado pronto. Es aconsejable que no sólo
aumentamos gradualmente el tiempo, sino también pedimos
de vez en cuando un sentado de breve duración para
que el perro no tiene el sentimiento que todo sólo se dificulta.
Eso sube su motivación.
Posteriormente es posible combinar las diferentes categorías,
aumentado el nivel de dificultad progresivamente otra vez. Vas a
darte cuenta de que esta vez es más fácil aumentar
la dificultad porque el perro se encuentra en terreno familiar y
recuerda cada uno de los ejercicios.
17. La erupción de
extinción
Cuando el perro ofrece la conducta por la clave, los refuerzos, el
clicker como los premios, se pueden desaparecer poco a poco. Un premio
ocasionalmente es suficiente y aún muy útil. ¿Por
qué? Eso se explica mejor con un ejemplo:
Cuando llamamos al elevador y presionamos el botón, lo cual
presenta nuestra conducta, esperamos que el elevador, nuestro premio,
aparezca, como nuestra experiencia anterior ya nos mostró.
Ahora, sin embargo, digamos que el elevador no aparece; no nos rendimos
inmediatamente y empezamos a subir todas las escaleras. En vez de
eso, intentamos a presionar el botón otra vez, un poquito
más fuerte, más largo o más veces. Ahora, si
el elevador no viene, subimos las escaleras, pensando que el elevador
no funciona. Eso es la extinción de una conducta.
Sin embargo, si suponemos que el elevador sí viene, aprendemos
que a veces el elevador aparece, a veces no. Cuando ofrezco una conducta
aún mejorada (presionar el botón más fuerte,
más largo, más veces) es más probable que reciba
mi premio, el elevador.
Así, el perro va a ofrecer un sentado más rápido,
más correcto, por ejemplo, lo que puede reforzar, y no se
rinde rápidamente si no hay premios para cada oferta . El
perro sabe que hay premios, tarde o temprano, pero sí hay.
Al mismo tiempo, si reforzara cada conducta, también las más
fáciles, otra y otra vez, el perro pierde su interés
por la falta de un reto. Funcionamos como una máquina de juego
de azar. El perro nunca sabe cuándo gana un premio, ni cuál.
Eso le convierte en un “adicto” del clicker training.
18. La jerarquía
de los premios
Como ya indiqué, el perro no debe saber qué tipo de
premio va a recibir. Decidir eso correctamente, es un arte verdadero.
Maggie, por ejemplo, le gusta comida y se vuelve loca con juguetes.
Cuando Maggie hace algo bien, le doy un buen premio de comida. Si
hace algo extraordinario, le doy su peluche “Dino”. El
peluche asegura que Maggie ofrece conductas ya aprendidas muy rápidamente.
19. Eliminar una conducta
no querida
Podría ser que te interese eliminar una conducta no querida
de tu perro que muestra habitualmente en algunas situaciones, como,
por ejemplo, brincar a las visitas cuando llegan a la casa.
En este caso aparece muy difícil usar el clicker porque
el perro sólo ofrece una conducta ya aprendida. Al principio
es útil analizar por qué el perro muestra la conducta
una y otra vez. ¿De dónde saca su premio? Las visitas
no dan comida, obviamente. Sin embargo, cuando el perro brinca en
ellos, reciben una reacción, sea amable con muchos toques
y palabras o una reacción rechazada con un paso detrás
y palabras de calmarse. De cualquier modo, el perro ya recibió lo
que quiso: su atención.
En este caso es útil que podamos reemplazar una conducta
no querida por otra, como sentarse. Si el perro tiene que sentarse
para saludar a las visitas, no es posible que brinque a ellos al
mismo tiempo. Al principio las visitas tienen que ignorar el perro
hasta el momento cuando se siente. Después del clic el perro
recibe su atención, el mejor premio para él en esta
situación.
Como ya existe una conducta aprendida, dura más hasta que
la conducta nueva toma lugar de la anterior. Si el perro experimenta
durante el entrenamiento otra vez un éxito brincando a una
persona, la conducta anterior se refuerza lo que hace muy difícil
eliminarla. Eso tiene que ver con la erupción de extinción.
Paciencia y consecuencia son muy importantes.
20. Sin fuerza bruta,
sólo mucha diversión
El clicker training significa mucha diversión, para ti y tu
perro. Le pones mucha atención y te comunicas con él
en una manera tranquila. En lugar de forzar el perro en la conducta
deseable, el perro es guiado, sin tocarlo. No se usa violencia, ni
fuerza. Los castigos solamente le ponen a tu mascota miedo y lo dejan
estático. Con el clicker training, por otra parte, tu mascota
aprende a ser creativa y activa. Todo es un juego. Además,
clicker training mejora la relación entre tú y tu mascota.
|