Download:
Clicker Training.doc (366 KB, ES
)

Link:
Clicker Training (pdf in EN)
Clicker Training (blog in DE)

 

There is plenty of information on clicker training in English in the Internet, such as the famous web page by Karen Pryor. However, there is almost none of it in Spanish. Therefore, I decided to write a summary in Spanish so that people can get an idea about it, without the necesity to know the English language. I even published a very short summary in German on my blog.

El clicker training
Un divertido método de aprendizaje
© mayo 2005, Heike Ebelt

Índice

Clicker
  1. Tiempo libre con mi perrita Maggie
  2. ¿Qué es el clicker training?
  3. ¿Qué animales se pueden entrenar?
  4. El refuerzo condicionado – El clicker
  5. El refuerzo primario – Los premios
  6. El clic al momento correcto
  7. El clic significa el premio
  8. Captar una conducta
  9. Mucha paciencia
  10. El clic termina la conducta
  11. La motivación y la concentración
  12. Moldear una conducta
  13. Las conductas más complejas
  14. Añadir una clave
  15. La generalización
  16. Varias categorías en una conducta
  17. La erupción de extinción
  18. La jerarquía de los premios
  19. Eliminar una conducta no querida
  20. Sin fuerza bruta, sólo mucha diversión

Rewards

1. Tiempo libre con mi perrita Maggie
Cuando es posible paso mi tiempo libre con mi perrita Maggie, una beagle de dos años. A ella le encanta correr y jugar con otros perros. También necesita “trabajo mental” para quedar sana y feliz. Por eso, de vez en cuando le enseño trucos con un método especial conocido como el clicker training el cual me gustaría explicar cómo funciona.

2. ¿Qué es el clicker training?
El clicker training describe una manera de enseñar a los animales, la cual se basa en el hecho de que los animales tienden a repetir acciones que tienen una consecuencia positiva y que funciona como refuerzo.

3. ¿Qué animales se pueden entrenar?
Se pueden entrenar caballos, gatos, ratas, delfines y, por supuesto, perros, entre otros, - de cualquier raza y de cualquier edad. Los cachorros aman este método y los perros viejos aprenden nuevos trucos. La única restricción es la condición de salud del perro y el tipo de trucos que le quieres enseñar.

4. El refuerzo condicionado – El clicker
Sin embargo, para que el animal asocie el refuerzo con su conducta, el refuerzo tiene que suceder exactamente en el momento que la conducta ocurra, no después.

Una forma para que el animal se dé cuenta de que hace algo correctamente en un momento específico es el uso de un refuerzo condicionado. Este refuerzo puede ser un sonido inmutable de clic producido por cualquier instrumento como el clicker, el cual uso con Maggie. Es una cajita plástica con una barra de metal que produce un sonido duro con doble tono producido cuando se empuja y se libera.

Su valor es que tiene un sonido único el cual no se pierde en la burbuja de palabras que usualmente tiramos a nuestras mascotas. Funciona como un comunicador claro. Además, es más rápido que decir “¡Órale, niñita, bien hecho!” y nos permite marcar con gran precisión el momento de la conducta deseada, como si se tomase una foto de eso.

Algunos perros tienen miedo con el fuerte tono. Si eso ocurre con tu mascota es recomendable poner el clicker en la bolsa de tus pantalones o cubrirlo con una pieza de tela para disminuir el volumen del sonido al principio hasta que el perro se acostumbre.

La función primaria del refuerzo condicionado es un indicador que el animal no trata de obtener. Eso es más comprensible si preguntamos ¿por qué el perro debe estar interesado en un sonido como el clic? La respuesta es que en realidad no lo está.

5. El refuerzo primario – Los premios
El refuerzo primario, por otro lado, es algo que al animal le gusta verdaderamente y lo considera como un refuerzo. Estos refuerzos pueden ser juguetes o comida. Para enseñar algo completamente nuevo a Maggie prefiero usar premios suaves y muy sabrosos, como especiales para perros o piezas de vegetales o frutas, como sandía, plátano, manzana o zanahoria los cuales corto en porciones pequeñas para que el perro las pueda deglutir rápidamente.

Cuando el refuerzo condicionado es combinado con un refuerzo primario, éste alcanza igual importancia para el animal. Es necesario que del clic siempre siga un premio. De tal manera, el clicker se convierte en una herramienta poderosa.

Ahora podrías preguntarte ¿por qué es necesario dar un premio a tu mascota de cualquier modo? Tal vez sueñas con que un perrito hace todo por amor y por gracia porque tú lo cuidas. La realidad es que los perros son egoístas (como nosotros). No pierden energía costosa en acciones inútiles, como sentado en frente de un refrigerador esperando que se abra automáticamente y le dé comida. Tal vez intenta pocas veces. Sin embargo el perro se rinde muy pronto cuando se da cuenta de que no funciona.

Sin embargo, su naturaleza oportunista no lo hace menos amable. Al contrario, eso muestra que los perros son muy inteligentes. Por eso es importante que les demos una razón muy buena y los convenzamos para que muestren una conducta en especial. Hacemos un “contrato” con nuestro perro con el cual le prometemos algo que quiere si ofreció algo antes que nosotros queremos. Ese dicho contrato existe entre tú y tu perro por el clicker al que le sigue siempre un premio.

De esta manera, el proceso del entrenamiento se vuelve un dialogo entre ustedes dos: El perro te mira buscando tus instrucciones, las informaciones sobre lo que quieres, y confirmaciones, si te ofreció lo que quisiste. Además, trabaja muy contento, disfrutando el tiempo contigo.

Sin embargo, no es necesario que siempre se tenga que dar un premio durante toda la vida del perro. ¿Cómo se hace?, voy a explicar más adelante.

6. El clic al momento correcto
Lo que tienes que hacer antes de empezar con el entrenamiento es aprender a presionar el clicker al momento correcto. No es fácil. Puedes detectarlo cuando dejas caer una pelota e intentas presionar el clicker exactamente en el momento cuando la pelota toca el piso. Si el clic aparece demasiado tarde reforzarás probablemente conductas en tu mascota que no quieres.

Eso pasó con la instructora de delfines Karen Pryor quien estaba interesada en esforzar a que un delfín nadara voluntariamente de una alberca a la otra. El delfín nadaba a través de la puerta a la otra piscina, e inmediatamente daba una vuelta para regresar a la primera alberca antes de que el manejador tuviera oportunidad de cerrar la puerta. Cuando Karen, por fin, encontró a alguien quien observó el proceso, le dijo que ella dio siempre la señal del refuerzo (por un pito que también funciona como un clicker) cuando el delfín empezó a dar la vuelta. Así, reforzó una vuelta hacia la primera alberca en lugar de nadar directamente de una a otra. Cuando ajustó su tiempo por sólo una fracción de un segundo, el problema desapareció.

Esta experiencia nos muestra que es fundamental que el entrenador revise lo que refuerza, y observe a su mascota muy bien.

Según mis observaciones, es mejor usar el clicker aún un poco más temprano, antes de alcanzar la conducta querida, para evitar que sea demasiado tarde cuando la conducta ya desaparezca, porque todavía podemos intentar prolongar el clic un poco más para obtener la conducta final.

7. El clic significa el premio
Antes de enseñar algunos trucos, el animal tiene que establecer una conexión entre el sonido de clic y la apariencia del premio. Para esto, se lleva al animal a un cuarto silencioso para evitar cualquier posible distracción. Se hace el sonido clic y se da premio unas veces sin pedir una conducta en particular, hasta que el animal empiece a buscar el premio siempre cuando escuche el sonido, y lo asocie con algo positivo.

8. Captar una conducta
Para reforzar la conducta, hay que captar una conducta al principio. Algunas de estas conductas ocurren naturalmente, como sentarse o echarse, aún cuando hay certidumbre del comportamiento. Así, es posible captar la conducta poniendo el animal en una situación en la cual es más probable que la conducta ocurra y esperando con mucha paciencia a que suceda.

9. Mucha paciencia
Aquí se hace claro: La paciencia – contigo y con tu mascota – es la clave para el éxito del clicker training, en particular al principio cuando la mascota todavía no sabe que tiene que descubrir una conducta en especial y no recibe ninguna ayuda, excepto por el sonido. Sin embargo, después de pocas sesiones con el clicker, tu entrenamiento resulta más eficaz. Tu mascota sabe que tiene que detectar lo que quieres de ella, y ofrece varias conductas las cuales puedes reforzar.

Para enseñar conductas no naturales a un animal hay la alternativa de indicar con comida en la posición apropiada. Sin embargo, de esta manera el animal sigue tu mano con el premio sin pensar en su conducta. Además, no queremos que nuestro perro ofrezca conductas sólo cuando ve un premio. Aquí es importante que el premio como indicador desaparezca tan pronto como sea posible.

Para evitar eso, los entrenadores del clicker training usan un target stick, un palo con un punto marcado en otro color, lo cual sigue el animal con su nariz. Para hacer eso, por supuesto, fue reforzado antes. El target stick te permite dirigir el perro en cualquier posición, o enseñar movimientos, como dar una vuelta en el sentido de las manecillas del reloj.

10. El clic termina la conducta
Tal vez te diste cuenta de que el perro termina su conducta cuando escucha el sonido de clic para recoger su premio. El perro ofreció la conducta y merece su premio, como indicaste con el clicker. No te preocupes, vuelve a repetir la misma conducta para obtener otro premio.

11. La motivación y la concentración
El clicker training vive de la motivación de tu animal. Si pierde su interés, todo el método resulta infructuoso. Pero, para que se quede motivado el animal no es suficiente darle premios. Aunque tu mascota puede continuar horas y horas con las sesiones del clicker training es recomendable dejarlas muy breves, entre dos y cinco minutos, diez minutos máximo, para asegurar que se concentre y sea motivado durante todo el tiempo del entrenamiento.

También es deseable terminar cuando el animal lo disfruta mucho, preferiblemente con un “premio gordo”, una mano llena de premios, si el animal hizo algo particularmente fabuloso. Además, una sesión no siempre es muy progresiva y exitosa, en particular si somos demasiado exigentes con nuestro perro. En ese caso se puede terminar el entrenamiento con un ejercicio que el perro seguramente sabe y le gusta hacer. El “premio gordo” y el “gran final” nos dan un buen sentimiento lo cual influye nuestra actitud para la próxima sesión. Esto lo puedo ver con la reacción de Maggie: Siempre cuando saco el clicker, recibo toda su atención inmediatamente.

12. Moldear una conducta
Tanto para la mascota como para el dueño es importante tener éxito. Todos los buenos premios son inútiles si el animal no tiene la oportunidad de ganarlos. Para garantizar el éxito es muy ventajoso moldear la conducta y separarla en pequeños pasos. Se refuerzan aproximaciones más y más cercanas a la conducta final. El sonido indica que la mascota está en la pista correcta para alcanzar la conducta deseable.

Por ejemplo, si yo deseara enseñar a mi perrita a que brinque a través de mis brazos formando una llanta, entonces yo refuerzo al principio sólo sus aproximaciones a un aro; más tarde las tocas, sea con sus patas, su boca o su nariz. Entonces requiero que ella camine parcialmente a través de la llanta, después completamente. Posteriormente empiezo a subir la llanta del suelo. Luego formo con mis brazos una llanta, todavía cargando el aro. Y finalmente remuevo el aro, sólo mostrando mis brazos.

13. Las conductas más complejas
Las conductas moldeadas pueden ponerse juntas en una cadena para producir una secuencia, una nueva conducta. De esta manera el perro puede aprender trucos bastante complejos, como traer una pelota cuya secuencia sería la siguiente: (1) sentarse al lado del dueño, (2) quedarse quieto hasta que el dueño tira la pelota y envía al perro, (3) correr a la pelota, (4) quizá buscar la pelota, (5) recoger la pelota, (6) regresar corriendo al dueño, (7) sentarse en frente del dueño, y (8) entregar la pelota en la mano del dueño.

Es recomendable entrenar cada uno de los ejercicios, paso a paso, y al revés, empezando con el último ejercicio y terminando con el primero para que el perro sepa muy bien los ejercicios que aparecen al final de la secuencia. En el caso que he mencionado, el perro debe ser muy bueno para sentarse y entregar la pelota, y aún mejor si le encanta. Entonces, pasando la secuencia, las partes posteriores, que son más fáciles, funcionan como refuerzos para las partes anteriores, que son tal vez no tan fáciles. Ese proceso refuerza y fortalece la completa secuencia.

14. Añadir una clave
Una vez que el perro ofrece la conducta final querida en una base regular, puedes empezar a añadir la clave a la conducta.
Yo prefiero usar la palabra clave en lugar de comando porque el comando implica que ponga mi voluntad encima de la de mi perro, rompiendo la suya para que me obedezca, sin voluntad propia. La clave, sin embargo, implica que una señal casi automáticamente provoca la conducta del perro, pero todavía ofreciendo su voluntad.

Una señal puede ser un ademán con la mano o una palabra. Debido a que nuestros perros no entienden nuestro lenguaje, una palabra sólo se convierte en una señal con significado cuando está acompañado con una acción después de muchas repeticiones. Otra vez, la paciencia es importante.

En general se puede decir que los perros, como son buenos observadores, entienden mucho mejor las señales corporales que verbales. Es evidente si se hace una prueba, dando una señal corporal para una conducta, como sentarse, y al mismo tiempo una señal verbal para otra conducta, como echarse. Muy probablemente, el perro va a ofrecer la conducta que se ensaña por el cuerpo y se sienta.

15. La generalización
Ahora es el tiempo para empezar a generalizar la conducta. ¿Por qué es necesario hacerlo? El perro asocia su conducta aprendida con todo su ambiente, sea el cuarto, tu ropa, o tu posición corporal. Por ejemplo, cuando siempre enseñaste a tu perro que se siente en frente de ti y lo hace frecuentemente, se presenta inseguro cuando quieres que se siente a tu lado. Seguramente el perro va a intentar hacer una vuelta pequeña para alcanzar la posición conocida. Esa falta de generalización puede ser muy útil, por ejemplo cuando quieres permitir que tu perro se suba en la cama de un cuarto, pero no en la cama de otra habitación. Sin embargo, muchas veces la discriminación del perro se presenta como un obstáculo, cuando queremos un perro sentado aún en lugares desconocidos.

¿Qué podemos hacer para obtener un perro que entiende mi señal y muestra la conducta querida, independientemente del ambiente? Tenemos que entrenar la generalización con nuestro perro. Poco a poco añadimos detalles diferentes y aumentamos el nivel de distracción. Siempre cuando estamos casi seguros que nuestro perro no va a fallar podemos avanzar un nivel de la dificultad.

Por ejemplo, si siempre entrenamos la mascota en la cocina, vamos ahora a la sala. Después podemos ir al parque donde hay poca distracción, como unas personas sentadas en un banco lejos, a continuación con mucha distracción con otros perros que estén cerca. Con repeticiones tu mascota aprende que su conducta no depende del ambiente, sino sólo de la conducta misma. Es una experiencia muy importante. Una vez entendido este principio, tu perro va a ser muy rápido con la generalización de nuevos trucos aprendidos.

16. Varias categorías en una conducta
Tal vez quieres enseñar a tu perro que se siente muy rápido en una distancia de cinco metros lejos de ti, y se quede por diez segundos. La conducta contiene tres categorías: (1) el tiempo entre tu señal y la conducta mostrada, (2) la distancia entre el perro y tú, y (3) la duración de la conducta.

Para asegurar el éxito es importante que enseñemos a nuestro perro cada categoría separada y en pasos pequeños. Empezamos con un sentado rápido. Cuando el perro se siente después de cinco segundos en promedio, vamos a reforzar sólo todos los sentados que se ofrecen después de cinco segundos o menos. Si el perro ofrece un sentado más rápido, subimos el nivel de dificultad y sólo damos un clic con premio para un sentado después de tres segundos. De esta manera continuamos hasta que alcancemos nuestra meta de un sentado rápido de un segundo.

Cuando enseñamos un sentado en distancia, empezamos con un medio metro y aumentamos la distancia al perro poco a poco. Al mismo tiempo, sin embargo, bajamos la dificultad de nuestra primera categoría de un sentado rápido y reforzamos también los sentados que duran más que cinco segundos hasta que el perro ofrezca un sentado. Sólo nos concentramos en la categoría que queremos reforzar en este momento.

Lo mismo hacemos con la categoría de un sentado con duración. Entablamos al principio un sentado de dos segundos, posicionándonos cerca de nuestro perro y esperando por la conducta hasta que la ofrezca. Lentamente aumentamos el tiempo, siempre considerando que el perro debe tener la experiencia del éxito, que quiere decir que no debemos ser exigentes, aumentando el tiempo demasiado pronto. Es aconsejable que no sólo aumentamos gradualmente el tiempo, sino también pedimos de vez en cuando un sentado de breve duración para que el perro no tiene el sentimiento que todo sólo se dificulta. Eso sube su motivación.

Posteriormente es posible combinar las diferentes categorías, aumentado el nivel de dificultad progresivamente otra vez. Vas a darte cuenta de que esta vez es más fácil aumentar la dificultad porque el perro se encuentra en terreno familiar y recuerda cada uno de los ejercicios.

17. La erupción de extinción
Cuando el perro ofrece la conducta por la clave, los refuerzos, el clicker como los premios, se pueden desaparecer poco a poco. Un premio ocasionalmente es suficiente y aún muy útil. ¿Por qué? Eso se explica mejor con un ejemplo:

Cuando llamamos al elevador y presionamos el botón, lo cual presenta nuestra conducta, esperamos que el elevador, nuestro premio, aparezca, como nuestra experiencia anterior ya nos mostró. Ahora, sin embargo, digamos que el elevador no aparece; no nos rendimos inmediatamente y empezamos a subir todas las escaleras. En vez de eso, intentamos a presionar el botón otra vez, un poquito más fuerte, más largo o más veces. Ahora, si el elevador no viene, subimos las escaleras, pensando que el elevador no funciona. Eso es la extinción de una conducta.

Sin embargo, si suponemos que el elevador sí viene, aprendemos que a veces el elevador aparece, a veces no. Cuando ofrezco una conducta aún mejorada (presionar el botón más fuerte, más largo, más veces) es más probable que reciba mi premio, el elevador.

Así, el perro va a ofrecer un sentado más rápido, más correcto, por ejemplo, lo que puede reforzar, y no se rinde rápidamente si no hay premios para cada oferta . El perro sabe que hay premios, tarde o temprano, pero sí hay.
Al mismo tiempo, si reforzara cada conducta, también las más fáciles, otra y otra vez, el perro pierde su interés por la falta de un reto. Funcionamos como una máquina de juego de azar. El perro nunca sabe cuándo gana un premio, ni cuál. Eso le convierte en un “adicto” del clicker training.

18. La jerarquía de los premios
Como ya indiqué, el perro no debe saber qué tipo de premio va a recibir. Decidir eso correctamente, es un arte verdadero.

Maggie, por ejemplo, le gusta comida y se vuelve loca con juguetes. Cuando Maggie hace algo bien, le doy un buen premio de comida. Si hace algo extraordinario, le doy su peluche “Dino”. El peluche asegura que Maggie ofrece conductas ya aprendidas muy rápidamente.

19. Eliminar una conducta no querida
Podría ser que te interese eliminar una conducta no querida de tu perro que muestra habitualmente en algunas situaciones, como, por ejemplo, brincar a las visitas cuando llegan a la casa.

En este caso aparece muy difícil usar el clicker porque el perro sólo ofrece una conducta ya aprendida. Al principio es útil analizar por qué el perro muestra la conducta una y otra vez. ¿De dónde saca su premio? Las visitas no dan comida, obviamente. Sin embargo, cuando el perro brinca en ellos, reciben una reacción, sea amable con muchos toques y palabras o una reacción rechazada con un paso detrás y palabras de calmarse. De cualquier modo, el perro ya recibió lo que quiso: su atención.

En este caso es útil que podamos reemplazar una conducta no querida por otra, como sentarse. Si el perro tiene que sentarse para saludar a las visitas, no es posible que brinque a ellos al mismo tiempo. Al principio las visitas tienen que ignorar el perro hasta el momento cuando se siente. Después del clic el perro recibe su atención, el mejor premio para él en esta situación.

Como ya existe una conducta aprendida, dura más hasta que la conducta nueva toma lugar de la anterior. Si el perro experimenta durante el entrenamiento otra vez un éxito brincando a una persona, la conducta anterior se refuerza lo que hace muy difícil eliminarla. Eso tiene que ver con la erupción de extinción. Paciencia y consecuencia son muy importantes.

20. Sin fuerza bruta, sólo mucha diversión
El clicker training significa mucha diversión, para ti y tu perro. Le pones mucha atención y te comunicas con él en una manera tranquila. En lugar de forzar el perro en la conducta deseable, el perro es guiado, sin tocarlo. No se usa violencia, ni fuerza. Los castigos solamente le ponen a tu mascota miedo y lo dejan estático. Con el clicker training, por otra parte, tu mascota aprende a ser creativa y activa. Todo es un juego. Además, clicker training mejora la relación entre tú y tu mascota.