Publicado originalmente en www.clickersolutions.com
Autora: Melissa Alexander
Traducción: Marcela Díaz / www.adiestramiento.cl
ABE: Primera empresa que aplicó comercialmente los principios del Condicionamiento Operante al adiestramiento animal. Fundado por Keller y Marian Breland, en casi 45 años de existencia, el personal de ABE adiestró 15.000 animales de 140 especies diferentes.
Adiestramiento Balanceado: Es un tipo de adiestramiento que utiliza los cinco principios del Condicionamiento operante y un marcador de evento (el clicker) para modificar la conducta. Este tipo de adiestramiento es más conocido como «adiestramiento combinado». El adiestramiento balanceado implica el uso de cantidades iguales de refuerzo y castigo. Sin embargo, el apresuramiento asociado con el castigo, hace que este tipo de «balance» sea una pobre opción de adiestramiento.
Adiestramiento combinado: Tipo de adiestramiento que utiliza los cinco principios del Condicionamiento operante y una señal como marcador (el clicker) para modificar la conducta.
Adiestramiento de Compulsión: Es el estilo tradicional de adiestramiento que se caracteriza por modelar u obligar al perro a ejecutar la conducta y castigarlo físicamente por no obedecer.
Adiestramiento con clicker (clicker training): Término acuñado por Karen Pryor y definido por ella como un subconjunto del Condicionamiento operante que utiliza refuerzo positivo, extinción, castigo negativo y un marcador de evento para modificar la conducta.
Aversivo: Algo por el cual el animal estará deseoso de trabajar para evitar.
Bailey, Bob (Robert E.): Químico y zoólogo pionero en los métodos basados en el Condicionamiento Instrumental (operante) utilizado en el adiestramiento de animales, tanto en ambientes libres como ambientes controlados. Bob y su esposa, Marian Breland Bailey, enseñaron los principios del Condicionamiento Instrumental a adiestradores de perros en sus campamentos de «adiestramiento de pollos».
Bailey, Marian Breland: Segunda estudiante graduada con B.F Skinner. Marian y su primer marido, Keller Breland, trabajaron con Skinner en el proyecto «pigeon bombing» («paloma bombardera») en la Segunda Guerra Mundial; luego dejó sus estudios para fundar ABE ( Animal Behavior Enterprises) . Marian obtuvo su Ph.D en 1978 y fue profesora de la universidad durante veinte años. Aunque ella se retiró en 1998, Marian y su segundo marido, Bob Bailey, continuó enseñando los principios del Condicionamiento en sus campamentos de «adiestramiento de pollos».
Breland, Keller: Es el primer estudiante graduado con B.F. Skinner, trabajó con Skinner en el proyecto «pigeon bombing» en la Segunda Guerra Mundial; luego dejó sus estudios para fundar ABE, junto a su esposa. Keller fue el primero en usar un marcador de evento al que llamó «estímulo puente», debido a que hace un puente entre la respuesta deseada y la entrega del refuerzo primario.
Castigo: En el condicionamiento instrumental es una consecuencia de una conducta en que algo se agrega o se quita de una situación y que hará menos probable que la conducta se repita en el futuro.
Castigo negativo (P-): Quitar algo que el animal trabajará para suprimir (disminuir la frecuencia de) una conducta. Por ejemplo, el perro salta para conseguir atención. Dándose vuelta o alejándose de él, usted aplica el Castigo negativo quitándole la atención que él desea.
Castigo Positivo (P+): Agregar algo que el animal trabajará para evitar suprimir (disminuir la frecuencia de) una conducta . Por ejemplo, dar un tirón de correa para detener al perro si salta sobre una persona es un Castigo positivo, suprimiendo la conducta de saltar. Otros ejemplos muy comunes de Castigo Positivo incluyen gritar, golpecitos a la nariz, golpes, choques eléctricos y una gran gama de recursos.
Clicker: Juguete que hace ruido (clásica «ranita» de las fiestas de cumpleaños). Los adiestradores de animales usan el clicker como un marcador de evento para marcar un comportamiento deseado. El clicker es un excelente marcador porque es único, rápido, y consistente.
Collar de cabeza o ronzal: Similar al cabestro de un caballo, el ronzal permite al adiestrador tener el control de la cabeza del perro, haciéndole más fácil conducirlo con la traílla hasta que le enseñe al perro a caminar junto al guía.
Condicionamiento clásico: El proceso de asociar un estímulo neutro con una respuesta involuntaria hasta que el estímulo provoque la respuesta.
Condicionamiento Instrumental u operante: El proceso de cambiar la conducta de un animal a un cierto estímulo manipulando las consecuencias del comportamiento. Los cinco principios del Condicionamiento operante fueron desarrollados por B.F. Skinner. El adiestramiento con clicker es un subconjunto del Condicionamiento operante, utilizando el refuerzo positivo, la extinción, y en menor grado, el castigo negativo.
Conducta: Cualquier cosa que un animal hace.
Consecuencia: El resultado de una acción. Las consecuencias frecuentemente -pero no siempre- afectan la conducta futura, haciendo más o menos probable que la conducta se repita. Los cinco principios del Condicionamiento operante describen los resultados potenciales.
Contra-condicionamiento: Técnica con la cual se emparejan estímulos que evocan una respuesta determinada con una respuesta opuesta, para que el estímulo evoque la nueva respuesta. Por ejemplo, el caso de un perro tiene miedo a los hombres con sombrero de determinado tipo. Cuando un hombre con sombrero se acerca, se le da al perro su comida favorita repetidamente. El objetivo es reemplazar el miedo con el placer proporcionado por la comida. Debe hacerse gradualmente, pues si el proceso fuera precipitado, la comida favorita podría asumir la asociación de miedo.
Criterio: Respuesta específica, definida por el adiestrador en una sesión de entrenamiento. El adiestrador clickea al momento en que el animal alcanza el criterio específico. El criterio no sólo puede incluir la conducta física, sino también elementos como latencia, duración y distancia.
Criterio permanente: Criterio que se encuentra en la conducta final. Un criterio permanente debe ser adiestrado hasta obtener mayores niveles de fiabilidad que un criterio temporal.
Criterio temporal: Criterio que es una transición de la conducta final y que, en su forma actual, no será parte de ella. Un criterio temporal debe ser entrenado hasta lograr un 80% de fiabilidad antes de «hacerlo más difícil». Si un criterio temporal se refuerza demasiado, el animal puede ser renuente a cambiar su conducta.
Crossover-dog: Perro que ha sido previamente adiestrado por un método tradicional y que luego se adiestra con clicker.
Crossover-trainer: Adiestrador que previamente utilizó los métodos tradicionales para adiestrar animales y que ahora adiestra con clicker.
Cuatro cuadrantes del Condicionamiento operante: Referencia incorrecta del comúnmente visto cuadro que ilustra los conceptos de refuerzo y castigo. Esta descripción es falsa de dos maneras. Olvida mencionar la extinción, e implica que los otros principios del Condicionamiento operante son de igual valor en un programa de adiestramiento.
Desensibilización: El proceso de aumentar la tolerancia a un estímulo particular aumentando la presencia del estímulo gradualmente.
Encadenado: El proceso de combinar múltiples conductas hasta lograr una sola conducta continua bajo una sola señal.
Encadenado hacia atrás: Adiestrar en primer lugar la última conducta en una cadena de comportamientos, luego la anterior y luego la anterior a esa. El encadenado hacia atrás se aprovecha del Principio de Premack.
Estímulo: Es un cambio en el ambiente. Si el estímulo no tiene ningún efecto en el animal, es un estímulo neutro. Un estímulo que destaca en el ambiente -que el animal nota más que otros estímulos del ambiente- es un estímulo notable. Un estímulo que causa un cambio en el estado del animal -por ejemplo, provoca que realice una conducta específica- es un estímulo discriminativo.
Estímulo puente: Es un marcador de evento que identifica la conducta deseada y es un puente de tiempo entre la respuesta y la entrega del refuerzo primario. El clicker es un estímulo puente.
Extinción: Debilitación de una conducta a través del no-refuerzo, «ignorando» la conducta. En la extinción, nada se agrega o quita del ambiente. Por ejemplo, hay un trozo de comida al otro lado de la reja. Un perro intenta alcanzarlo con la pata, pero no puede. Después de varios intentos y al ver que no funcionan -porque no son reforzados con el éxito- el perro eventualmente dejará de hacerlo.
Intervalo fijo: Cronograma de refuerzo en el que el adiestrador premia la primera repuesta correcta después de un período específico de tiempo, por ejemplo, después de un minuto.
Intervalo variable: Cronograma de refuerzo en el que el adiestrador refuerza la primera respuesta correcta después de variados períodos de tiempo dentro de un cierto contexto.
Jakpot o Bingo: Es un mega-premio entregado después de un esfuerzo particularmente excepcional.
Latencia: Tiempo entre la señal y la respuesta. Idealmente este tiempo es cero o tan cercano a eso como sea posible.
Marcador de evento: Una señal que marca la conducta deseada en el instante en que ocurre. El clicker es un marcador de evento.
Principio de Premack: Teoría que declara que una respuesta más fuerte reforzará una respuesta más débil.
Programa de refuerzo variable: Técnicamente, es un intervalo inconstante o proporción inconstante de refuerzo. Sin embargo, la mayoría de los adiestradores usan el programa de refuerzo variable para significar una proporción inconstante.
Proporción del Refuerzo: Número de refuerzos entregados en un período específico de tiempo. Una proporción alta de refuerzos es crítica para adiestrar con éxito.
Proporción variable: Cronograma de refuerzo en el que se refuerza el primer comportamiento correcto después de un número variable de respuestas correctas.
Proporción fija: Cronograma de refuerzo en que el adiestrador premia la primera respuesta correcta después de un número específico de respuestas. » Two-fers» y «three-fers» son ejemplos de proporción fija.
Pryor, Karen: Autora y entrenadora de delfines reconocida por acuñar el término de «adiestramiento con clicker» y por popularizar el método con adiestradores caninos.
Recuperación espontánea: Característica de la extinción en que una conducta que se pensaba que estaba extinta inexplicablemente reaparece. Si el adiestrador se asegura de no reforzarla, desaparecerá rápidamente.
Reforzador secundario: Refuerzo condicionado. Es un refuerzo que el animal no necesita. Un reforzador condicionado puede ser tanto o más poderoso que un refuerzo primario.
Reforzamiento continuo: El cronograma más simple de refuerzo. Cada respuesta correcta se refuerza.
Refuerzo: En el Condicionamiento operante, es una consecuencia de una conducta en que algo es agregado o removido de la situación, haciendo más probable que la conducta se repita en el futuro.
Refuerzo condicionado: Estímulo neutro apareado con un reforzamiento primario hasta que el estímulo neutro asuma las propiedades del primero. El sonido del clicker, después de ser repetidamente asociado con un premio de comida u otro refuerzo, se vuelve un refuerzo condicionado.
Refuerzo diferencial: Algunas respuestas correctas se premian y otras no. Todos los programas de refuerzo, excepto el refuerzo continuo, son un tipo de refuerzo diferencial.
Refuerzo primario: Refuerzo que el animal necesita por naturaleza. Comida, agua y sexo son reforzadores primarios.
Refuerzo positivo (R+): Agregar algo por lo que el animal trabajará para consolidar (aumente la frecuencia de) una conducta. Por ejemplo, dar al perro un premio por sentarse, aumentará la probabilidad de que el perro se siente otra vez.
Refuerzo negativo (R -): Quitar algo que hará que animal trabaje para evitar fortalecer (aumente la frecuencia de) una conducta. Caminar junto se enseña tradicionalmente con refuerzo negativo. El perro recibe una corrección cuando camina en cualquier otro lado, excepto junto al guía. Caminar en posición junto se incrementa, porque es el único lugar «seguro» – la amenaza de corrección desaparece si camina allí. La clave del refuerzo negativo es que es un aversivo que primero debe ser aplicado en regla, para luego ser removido.
Señal: Estímulo que produce una conducta. Las señales pueden ser verbales, físicas (es decir, una señal de la mano), o ambientales (por ejemplo, el bordillo de una acera puede convertirse en una señal para sentarse si el perro siempre es ordenado a sentarse antes de cruzar la calle).
Señal de ausencia de refuerzo: Pretende ser una señal para decir «No, eso no es lo que yo quiero, intenta de nuevo». En la perspectiva del Condicionamiento operante, pretende agregar una señal verbal a la extinción. Sin embargo, una vez que algo se ha agregado a la situación, es imposible saber si un cambio ocurrió a través de extinción o castigo. La señal de ausencia de refuerzo es usualmente un nivel innecesario de complejidad en un programa de adiestramiento.
Señal de avance: Señal, verbal o de otro tipo, que se da en el medio de una conducta para decirle al animal que está realizando correctamente el ejercicio y debe seguir con el resto de la rutina. La señal de avance es un nivel de complejidad innecesario en el adiestramiento.
Señales de calma: Señales corporales sutiles, usadas por los perros para indicar tensión, evitar la confrontación y disuadir la agresión.
Skinner, BF: Científico que definió los principios del Condicionamiento operante.
Sesión de adiestramiento: Es el tiempo pre-establecido para el adiestramiento o una cantidad pre-establecida de repeticiones. Su criterio debe permanecer constante durante una sola sesión. Al final de una sesión de entrenamiento, usted evalúa el progreso del animal y decide si hacer la próxima sesión más compleja o quedarse al mismo nivel.
Target: Es algo que se enseña a tocar al animal con alguna parte de su cuerpo. Un target o blanco es generalmente inmóvil.
Target Stick: Es un target o blanco móvil que el animal es enseñado a seguir. Los target sticks son usados frecuentemente como señuelos.
Three-fer: (se mantiene el vocablo en inglés pues es de común utilización) El animal tiene que realizar tres conductas correctas para ganar un click y un premio.
Timing: El momento justo en que suena el clicker. Idealmente, el clicker debería sonar en el instante preciso en el que el criterio es alcanzado. El timing es una habilidad mecánica que requiere práctica. El adiestrador debe ser capaz de reconocer la conducta que precede a la conducta final para clickear al mismo tiempo que ésta ocurre.
Two-fer: El animal tiene que realizar dos conductas correctas para ganar un clic y un obsequio.
mcalex@clickersolutions.com
copyright 1999 Melissa Alexander
«Está PROHIBIDA la reproducción total o parcial de este artículo en cualquier medio (gráfico, electrónico, etc) sin autorización escrita de su autor y de los responsables de Adiestramiento.cl»