Psicología

Condicionamiento operante: qué es, teoría, principios, ejemplos, programa


condicionamiento operante con rata

¿Qué es el condicionamiento operante?

El condicionamiento operante es un sistema de aprendizaje que se basa en la aplicación de refuerzos y castigos frente a determinados comportamientos para hacer más o menos probable su repetición en el futuro. Mediante el uso de estos refuerzos y castigos, el individuo crea una asociación entre una forma de actuar y sus consecuencias.

Se trata de una de las herramientas más importantes dentro de la psicología en general, y tiene una importancia especial dentro del conductismo. Fue descubierto a principios del siglo XX por B. F. Skinner, un psicólogo conductista que amplió las teorías propuestas por sus compañeros mediante el estudio con animales.

Al contrario que para muchos otros defensores de la psicología conductista, Skinner creía que las personas tenemos cierto libre albedrío y que podemos escoger en cierta medida nuestros comportamientos. Sin embargo, pensaba que el condicionamiento operante era el responsable de la mayoría de nuestras acciones, por lo que utilizando esta técnica se podrían cambiar todas las conductas de un individuo.

Hoy en día el condicionamiento operante ha dejado de ser la herramienta más utilizada dentro del mundo de la psicología, al haber aparecido otras más centradas en los pensamientos y las emociones. Sin embargo, incluso ahora sigue teniendo una gran importancia en ámbitos como el terapéutico y el educativo.

Características del condicionamiento operante

Las consecuencias controlan los comportamientos

El condicionamiento operante se basa en la idea de que la mayoría de nuestros comportamientos pueden hacerse más o menos probables en función de la consecuencia que recibamos por parte del entorno cuando los llevamos a cabo.

Si la consecuencia es positiva tenderemos a realizar esa acción más a menudo en el futuro; pero si es negativa, la frecuencia de la misma disminuirá.

Se da en la vida diaria

Para los psicólogos defensores de corrientes como el conductismo, este proceso se daría de forma automática en nuestro día a día. Así, según esta teoría nuestros comportamientos son independientes de nuestras creencias y formas de pensar, y solo tienen que ver con la evitación de castigos y la búsqueda de recompensas.

El condicionamiento operante se basa en replicar este mismo proceso de manera consciente para modificar la conducta de un individuo. Su efectividad ha sido comprobada en múltiples estudios, y se sabe que funciona tanto con seres humanos como con muchas especies de animales.

Herramientas básicas

Al realizar una intervención basada en el condicionamiento operante se busca modificar las consecuencias que se le proporcionan a la persona o animal para que esta cambie su conducta.

Para ello básicamente pueden utilizarse cinco herramientas: refuerzo positivo, refuerzo negativo, castigo positivo, castigo negativo y extinción. A continuación veremos exactamente en qué consiste cada una de ellas.

Conceptos básicos del condicionamiento operante (teoría)

– Refuerzo

El refuerzo es el responsable de la emisión de respuestas. Existen dos tipos de refuerzo: positivo y negativo. Ambos tienen la misma finalidad de aumentar la probabilidad de que la respuesta se emita en situaciones futuras. Además, para Skinner los reforzadores se definen por medio de las conductas que son observables y medibles.

Refuerzo positivo

El refuerzo positivo ocurre siempre que un comportamiento va seguido por una consecuencia que el individuo percibe como positiva, por ejemplo al proporcionarle placer de algún tipo. De esta manera, se incrementa la probabilidad de que el comportamiento inicial se repita más a menudo en el futuro.

Existen muchas maneras de ofrecer refuerzos positivos a las personas. Algunos de los elementos que pueden servir como reforzadores incluirían la comida, la atención, el cariño, el sexo o la diversión. Siempre que estos reforzadores se presenten después de que un individuo lleve a cabo una acción determinada, esta tenderá a repetirse con más frecuencia.

Refuerzo negativo

Al igual que la técnica anterior, el refuerzo negativo se utiliza para aumentar la frecuencia con la que ocurre una conducta. Sin embargo, en lugar de conseguirlo proporcionando una recompensa al individuo, lo hace eliminando un estímulo dañino para él. Precisamente de esta eliminación de un estímulo dañino viene el nombre de esta herramienta.

Por ejemplo, si después de tomar una cerveza una persona siente menos ansiedad e inseguridad, será mucho más probable que decida beber más en el futuro. Este sería un caso clásico de refuerzo negativo, que estaría detrás de muchos casos de adicción al alcohol o a otras sustancias similares.

Reforzadores primarios

Serían todos aquellos reforzadores básicos que no necesitan de ninguna historia de condicionamiento previa para funcionar como tales. Algunos ejemplos serían el agua, la comida y el sexo.

Reforzadores secundarios

Los reforzadores secundarios si estarían basados en historias previas de condicionamiento gracias a la asociación con estímulos incondicionados. Algunos ejemplos serían el dinero y las calificaciones.

– Castigo

El castigo también se mide por sus efectos en la conducta del sujeto. En cambio, a diferencia del refuerzo, lo que se pretende es la disminución o supresión de una determinada conducta.

Un castigo reduce la probabilidad de emisión de una conducta en situaciones posteriores. No obstante, no elimina la respuesta, ya que si la amenaza de castigo disminuye, la conducta puede volver a aparecer.

En el castigo también existen dos tipos o procedimientos diferentes; castigo positivo y castigo negativo.

Castigo positivo

El castigo positivo implica la aplicación de un estímulo que el individuo percibe como dañino como consecuencia de una de sus acciones. De esta manera se consigue el efecto contrario que en los dos casos anteriores: la frecuencia con la que actuará de la misma forma en el futuro tenderá a disminuir.

El ejemplo más evidente de castigo positivo es la aplicación de la violencia física y del dolor para evitar que se repita una conducta. Sin embargo, existen muchas otras maneras de aplicar esta técnica que no conllevan el uso de la fuerza y por lo tanto están más aceptadas a nivel social.

Castigo negativo

Al igual que ocurre con el castigo positivo, esta herramienta del condicionamiento operante busca disminuir la frecuencia con la que una persona realizará una conducta determinada en el futuro. Para ello se elimina algo que el individuo percibe como positivo, de tal manera que este siente algún tipo de malestar.

Una de las formas más comunes de utilizar el castigo negativo con seres humanos es mediante la retirada de atención. Debido a nuestra naturaleza social buscamos constantemente que los demás nos validen y nos hagan caso. Cuando esto no ocurre, el dolor emocional que sentimos nos lleva a cambiar nuestra forma de actuar para recuperar la aprobación del resto.

– Extinción

La extinción es un poco diferente al resto de técnicas del condicionamiento operante, ya que sirve para eliminar una conducta que había sido reforzada previamente (ya fuera de manera casual o premeditada). Se basa en la eliminación de todos los refuerzos y castigos que habían hecho que la forma de actuar que se quiere cambiar fuera la preferida del organismo.

Por ejemplo, un experimentador podría hacer que una rata tirase de una palanca mediante la aplicación de refuerzos positivos en forma de comida. Sin embargo, si de repente se dejase de administrar estos refuerzos, el animal acabaría abandonando la conducta.

– Generalización

Ante una situación o estímulo determinado se condiciona una respuesta, que puede aparecer ante otros estímulos o situaciones parecidas.

– Discriminación

Este proceso es el opuesto al de generalización, en él se responde de manera diferente según el estímulo y el contexto.

Principios del condicionamiento operante

Contingencia de tres términos

Es el modelo básico del condicionamiento operante y está formado por tres componentes: el estímulo discriminativo, la respuesta y el estímulo reforzador.

Un estímulo discriminativo sería aquel que indica al sujeto que el reforzador está disponible, señalando que si lleva a cabo una determinada conducta podrá obtener dicho reforzador. Por ejemplo, si una luz se enciende en la caja de Skinner indica que si se aprieta la palanca se recibirá comida.

Animated GIF - Find & Share on GIPHY

En contraposición tenemos el estímulo delta o estímulos que indican que la conducta no va a llevar a la obtención de ningún tipo de reforzador.

La respuesta sería la conducta que realizará el sujeto, cuya ejecución le llevará o no a la obtención del estímulo reforzador. Un estímulo reforzador es el responsable de la emisión de la conducta, ya que gracias a su aparición la probabilidad de emisión de una respuesta aumentará o disminuirá en el futuro.

Factores que influyen en la efectividad del condicionamiento operante

La efectividad de los refuerzos y castigos a la hora de modificar la conducta de un individuo puede variar en base a varios factores. Los más importantes son los siguientes:

– Inmediatez. Un refuerzo o castigo que se produzcan inmediatamente después de que se haya presentado la conducta que se quiere modificar será mucho más efectivo que si se aplica pasado un tiempo. Cuanta mayor sea la diferencia temporal entre ambos fenómenos más débil será el condicionamiento.

– Deprivación y saciedad. Los refuerzos positivos tienen más poder cuando el individuo desea con mucha fuerza la recompensa que estos le proporcionan. Por el contrario, el condicionamiento será menos efectivo si el organismo se encuentra “saciado”.

– Contingencia. Si una conducta es reforzada o castigada siempre que se presenta, el condicionamiento se dará de forma más rápida pero también será más fácil de extinguir. Todo lo contrario ocurre si se produce un refuerzo o castigo intermitente.

– Fuerza del estímulo. El tamaño o la fuerza del estímulo condicionante también influye en la efectividad de esta técnica. Por ejemplo, recibir $1000 después de realizar una tarea nos invitará a repetirla mucho más que si solo hubiésemos recibido 100.

Programas de reforzamiento

Para utilizar correctamente el condicionamiento operante no basta con aplicar de forma aleatoria las herramientas que hemos visto anteriormente. Por el contrario, en la mayoría de casos se usan lo que se conoce como “programas de reforzamiento”, que permiten usar las técnicas de este tipo de condicionamiento de manera sistemática y aumentar su efectividad.

Los programas de reforzamiento varían sobre todo en función de la frecuencia con la que se aplican los refuerzos y castigos. En general se dividen en programas de refuerzo continuo y de refuerzo parcial, pudiendo encontrar varios subtipos dentro de la segunda categoría.

Programas de reforzamiento continuo

En este tipo de programas de reforzamiento, la conducta que se quiere modificar va seguida en todas las ocasiones por un refuerzo o un castigo.

De esta manera, el aprendizaje se realizará de forma mucho más rápida, pero la extinción también se producirá con facilidad una vez que dejen de presentarse los estímulos condicionantes.

Programas de reforzamiento intermitente o parcial

En los programas de reforzamiento parcial no todas las ocasiones en las que se presenta la conducta que se quiere manipular van seguidas de un premio o un castigo.

Los programas de reforzamiento parcial tienen la desventaja de que con ellos se tarda más en conseguir que el individuo modifique su conducta. Sin embargo, si se plantean de forma correcta y se llevan a cabo adecuadamente, sus resultados son mucho más duraderos. En algunas ocasiones podrían llegar a ser prácticamente permanentes.

En función del caso, se elegirá presentar los estímulos condicionantes cada vez que pase cierto espacio de tiempo (programas de intervalo fijo o variable), o siempre que la conducta se repita un número determinado de veces (de razón fija o variable).

Programas de razón fija

En estos programas el reforzador se proporciona cuando el sujeto genera respuestas fijas y constantes. Por ejemplo, en un programa de razón 10 la persona obtiene el reforzador tras haber realizado diez respuestas cuando se presenta el estímulo.

Programas de razón variable

El reforzador seguiría dependiendo del número de respuestas emitidas por el sujeto pero con una razón variable, gracias a la cual se evita que el sujeto llegue a predecir cuándo obtendrá el reforzador. Por ejemplo, una rata recibe comida tras presionar la palanca 10 veces, en la siguiente ocasión 5 veces, en la siguiente 15 veces…

Programas de intervalo fijo

En los programas de intervalo la obtención del reforzador no depende del número de respuestas que el sujeto dé, sino que está determinado por el tiempo transcurrido. En consecuencia se refuerza la primera respuesta producida después de haber pasado un periodo de tiempo determinado.

En los programas de intervalo fijo el tiempo entre reforzador y reforzador es siempre el mismo.

Programas de intervalo variable

En estos programas el reforzador se obtiene después de un tiempo, aunque el tiempo es distinto para cada reforzador recibido.

Aplicaciones del condicionamiento operante

A continuación veremos algunos de los ámbitos en los que es común aplicar el condicionamiento operante. Por supuesto hay muchos más, pero estos son algunos de los más importantes.

Adicción y dependencia

El condicionamiento operante juega un papel central tanto en la aparición de adicciones de todo tipo como en la extinción de las mismas. Por eso, muchos de los tipos de terapia que luchan contra las adicciones están basados en técnicas operantes.

Entrenamiento animal

El condicionamiento operante es especialmente útil para modificar el comportamiento de los animales, ya que con ellos no es posible utilizar técnicas educativas basadas en el habla.

Por ejemplo, para enseñar a un perro a comportarse de forma adecuada en una casa lo más sencillo es reforzar sus comportamientos deseables y castigar los que no lo sean.

Programas de intervención

El condicionamiento operante se diseñó con el objetivo de cambiar la conducta de las personas para que estas pudieran llevar una mejor vida. De esta manera, esta técnica puede utilizarse para reducir la frecuencia con la que aparecen comportamientos indeseados y aumentar la de alternativas más saludables o deseadas.

Por ejemplo, si una persona quiere perder peso podría examinar qué estímulos están reforzando los comportamientos que la hacen comer más de lo necesario, y diseñar un programa de reforzamiento que después aplicaría a conductas alternativas más beneficiosas.

Educación de niños

Los niños (especialmente aquellos que todavía no saben hablar) responden mejor al condicionamiento operante que a otras técnicas educativas basadas en el lenguaje. A pesar de que los castigos tradicionales no están bien vistos hoy en día, solo con el uso de los refuerzos es posible conseguir cambios de conducta muy significativos en este ámbito.

Ejemplos de casos con condicionamiento operante

A través del condicionamiento operante, una persona o animal hace una asociación entre un comportamiento particular y una consecuencia. Veamos varios ejemplos:

– Los padres recompensan las buenas calificaciones de un niño con dulces o algún otro premio (reforzamiento positivo).

– Un maestro premia a aquellos estudiantes que son tranquilos y educados. Los estudiantes se dan cuenta de que al comportarse así reciben más puntos (reforzamiento positivo).

– Un alimento se da a un animal cada vez que presiona una palanca (reforzamiento positivo).

– Los padres de un niño de dos años le aplauden y sonríen cada vez que hace sus necesidades en el baño en lugar de utilizar un pañal. Con el tiempo, el niño aprende a ir solo al servicio gracias a este refuerzo positivo (reforzamiento positivo).

– Se retira el uso de la videoconsola a un niño cuando ha suspendido un examen (castigo negativo).

– Se pone líquido en las uñas de los niños para evitar la onicofagia. El niño saborea el mal sabor del líquido y se reduce la probabilidad de que vuelva a comerse las uñas (castigo positivo).

– Dar comida a un perro después de que se siente. En este caso se estaría reforzando el comportamiento de sentarse (refuerzo positivo).

– Si un niño es maltratado en casa y cuando sale a la calle no tiene ese maltrato, estaría siendo reforzado el comportamiento de salir a la calle (refuerzo negativo).

– Si no se da dinero a un niño a pesar de que se queje constantemente, se extinguiría el comportamiento de quejarse (extinción).

– Una persona descubre que cuando hace ejercicio físico gran parte de su fatiga y su malestar emocional desaparecen. Aunque al principio entrenar le suponía un gran esfuerzo, este refuerzo negativo le ayuda a hacer deporte con cada vez mayor facilidad (refuerzo negativo).

– Un perro recién adoptado tiene la costumbre de orinar dentro de la casa de sus dueños; pero estos le retiran su atención cuando lo hace y en cambio le otorgan “premios” cuando se espera a hacerlo durante sus paseos diarios (refuerzo negativo y refuerzo positivo).

¿Cuál es la diferencia entre el condicionamiento operante y el condicionamiento clásico?

En el condicionamiento operante, una respuesta voluntaria es seguida por un reforzador. De esta manera, la respuesta voluntaria (por ejemplo, estudiar para un examen) es más probable que se realice en el futuro.

Al contrario, en el condicionamiento clásico un estímulo activa automáticamente una respuesta involuntaria. Por ejemplo, la comida que ve un perro hace que produzca saliva.

Referencias

  1. “Skinner – Operant Conditioning” en: Simply Psychology. Recuperado de Simply Psychology: simplypsychology.com.
  2. “What Is Operant Conditioning and How Does It Work?” en: VeryWell Mind. Recuperado de VeryWell Mind: verywellmind.com.
  3. “Operant conditioning theory” en: Positive Psychology. Recuperado de Positive Psychology: positivepsychology.com.
  4. “Operant conditioning examples” en: Your Dictionary. Recuperado de Your Dictionary: examples.yourdictionary.com.
  5. “Operant conditioning” en: Wikipedia. Recuperado de Wikipedia: en.wikipedia.org.