Teoría del reforzamiento de Skinner: bases y ejemplos
La teoría del reforzamiento de Skinner es una de las bases de la llamada psicología cognitivo – conductual. Se basa en la idea de que los organismos aprenden unas conductas u otras en función de premios (llamados refuerzos) o castigos.
A pesar de la aceptación por parte de la comunidad científica del condicionamiento clásico de Pavlov, Skinner creía que este modelo era demasiado simple como para poder explicar completamente el aprendizaje humano.
Por lo tanto, basándose en la ley del efecto de Thorndike, empezó a investigar cómo los animales aprendían a realizar diferentes conductas. Tras la formulación de la teoría, el conodicionamiento operante sirvió durante muchos años como única explicación del comportamiento humano.
Más adelante, surgieron muchos otros enfoques psicológicos que pusieron en duda algunos de los fundamentos de la Psicología Conductista basada en las teorías de Skinner.
En concreto, en los años 70 apareció otro enfoque (la psicología cognitiva), que complementaba la teoría del condicionamiento. De esta manera, surgió el modelo predominante actualmente en Psicología, la teoría cognitivo – conductual.
Índice del artículo
- 1 Bases de la teoría del reforzamiento de Skinner
- 2 Tipos de respuestas en la teoría de Skinner
- 3 Ejemplos de reforzamientos
- 4 Referencias
Bases de la teoría del reforzamiento de Skinner
Skinner creía que la mejor forma de entender el comportamiento (tanto humano como animal) era observando las causas de una acción y sus consecuencias. Este enfoque fue más adelante conocido como “condicionamiento operante”.
El nombre surge debido a los llamados “operantes”, que son acciones que realiza un organismo y que tienen un efecto en el entorno. Este efecto puede ser positivo (como que un animal encuentre comida si va por un determinado camino) o negativo (como quemarse la mano al tocar el fuego).
Si el organismo consigue un efecto positivo, se considera que la conducta queda “reforzada”, y por lo tanto es más probable que vuelva a producirse en el futuro. Por el contrario, si el efecto que se consigue es negativo, la conducta es “castigada” y tenderá a disminuir su frecuencia en el futuro, o incluso a desaparecer.
Skinner estudió las leyes del condicionamiento operante utilizando animales, especialmente palomas, que introducía en la llamada “Caja de Skinner”.
En ella, los animales eran premiados o castigados en función de las conductas que exhibieran, permitiendo que el científico observase los efectos de diferentes tipos de refuerzos y castigos, su frecuencia…
Tipos de respuestas en la teoría de Skinner
A pesar de que comúnmente tan solo oímos hablar de refuerzos y castigos, realmente Skinner dividió las posibles respuestas a la conducta de un organismo en cinco tipos: respuesta neutral, refuerzo positivo, refuerzo negativo, castigo positivo y castigo negativo.
Aunque cada una de ellas tiene un efecto diferente en la conducta del organismo, se pueden agrupar en tres tipos: las que no provocan cambios en la conducta, las que aumentan la probabilidad de que se vuelva a producir en el futuro, y las que la disminuyen.
Respuesta neutral
Los operantes neutrales son todas las consecuencias de una acción que ni aumentan ni disminuyen la probabilidad de que ésta vuelva a producirse en el futuro. Son las menos comunes de todos los tipos de respuestas: en general, muy pocos operantes son totalmente neutrales.
Un ejemplo de operante neutral sería el siguiente. Si un estudiante sale a exponer un trabajo delante de toda su clase, y no recibe una respuesta calurosa (aplausos, felicitaciones…) pero tampoco una mala respuesta, es probable que no se sienta ni más ni menos predispuesto que antes a volver a presentar un trabajo en público.
Refuerzo positivo
Como ya sabemos, un refuerzo es un operante que aumenta la probabilidad de que una conducta vuelva a producirse en el futuro. Sin embargo, ¿qué significa que un refuerzo sea positivo?
La etiqueta de “positivo”, tanto para refuerzos como para castigos, no tiene nada que ver con que la respuesta sea buena o mala. Por el contrario, se considera un operante como positivo si se le da algo al organismo, y como negativo si se le quita algo.
Por lo tanto, un refuerzo positivo es un operante en el que el organismo recibe algo que hace que se vuelva más probable la repetición de la conducta premiada en el futuro.
El ejemplo clásico es el siguiente: si una rata pulsa una palanca y recibe comida, será más probable que vuelva a pulsarla en el futuro.
Refuerzo negativo
Ya hemos visto que “refuerzo” significa que se aumenta la probabilidad de una conducta en el futuro, y “negativo”, que se elimina algo como respuesta al organismo.
Es decir, un refuerzo negativo sería un operante en el que se elimina algo desagradable para el animal, lo que hace que la probabilidad de que se vuelva a producir la conducta aumenta.
Un ejemplo en el que se ve claramente cómo funciona este tipo de refuerzo es con la conducta de rascarse. Cuando nos pica una parte del cuerpo, tenemos una sensación desagradable de la que nos queremos deshacer; al rascarnos, esa molestia desaparece, por lo que la conducta queda reforzada y es más probable que volvamos a realizarla en el futuro.
Castigo positivo
La otra cara de la moneda de los refuerzos son los llamados “castigos”: operantes que provocan que la conducta se repita con menos frecuencia, o incluso, que desaparezca por completo.
El castigo positivo es lo que comúnmente entendemos como castigo en el lenguaje coloquial. Consiste en una respuesta desagradable para el organismo, que al recibirla, tenderá a disminuir la conducta que le ha llevado a experimentar el castigo.
Ejemplos de castigo positivo serían los siguientes: quemarse al tocar algo caliente, recibir un grito después de hacer algo mal, sentirse enfermo tras comer algo en mal estado…
Castigo negativo
El último tipo de operante es, tal vez, el más complicado de entender para la mayoría de la gente. Se trata de un castigo, por lo que su función principal es reducir la frecuencia de una conducta; sin embargo, la forma de castigar al organismo consiste en quitarle algo que es placentero para él.
Un ejemplo muy claro es el de quitarle un juguete a un niño si se está portando mal, para que deje de hacerlo, o retirarle la atención a alguien si nos está tratando mal.
Ejemplos de reforzamientos
La hora de comer del perro
Uno de los ejemplos más claro dentro del reforzamiento es el experimento de Pavlov, el cual jugaba con el condicionamiento clásico.
Este experimento consistía en hacer sonar una campana cada vez que se le servía comida al canino. Con el tiempo, el perro empezó a asociar la campana con comida, salivando cada vez que esta sonaba hubiese puesto o no el dueño el plato.
El madrugador
Una persona dormilona se percata que si madruga 20 minutos más al día evita atascos para ir al trabajo y además encuentra plaza de parking cerca de la oficina. Aunque le gusta mucho dormir, se sacrifica para detener el estímulo desfavorable de los atascos y aparcamientos.
Las comisiones del vendedor de seguros
El comercial de una casa de seguros recibe una llamada de su jefe en la que le indica que obtendrá un 10% de las comisiones por cada acuerdo que cierre durante el mes de diciembre. Este será un refuerzo positivo, donde se apareja el comportamiento a unos resultados deseados.
El nuevo rol dentro del equipo
El jugador estrella de un club de fútbol baja su rendimiento en la última temporada. Aunque sigue siendo el mejor jugador del club y mantiene el mismo sueldo, su entrenador decide relegarlo a la suplencia. En este caso se lleva a cabo un refuerzo negativo de castigo, con el fin de que el futbolista vuelva a rendir acorde a su salario y calidad.
El hijo ordenado
El refuerzo positivo suele ser una de las opciones de los padres para lograr que sus hijos actúan de manera correcta. Por ejemplo, es muy común que se utilice el elogio, el dinero o alguna promesa (refuerzo de estímulo) para que el niño haga los deberes, ordene sus juguetes o ayude en las tareas del hogar (comportamiento).
Referencias
- “Operant Conditioning” en: Instructional Design. Recuperado en: 17 Enero 2018 de Instructional Design: instructionaldesign.org.
- “Operant Conditioning Examples” en: Psychestudy. Recuperado en: 17 Enero 2018 de Psychestudy: psychestudy.com.
- “Skinner’s Theory on Operant Conditioning” en: Psychestudy. Recuperado en: 17 Enero 2018 de Psychestudy: psychestudy.com.
- “Classical and Operant Conditioning” en: Learning Theories. Recuperado en: 17 Enero 2018 de Learning Theories: learning-theories.com.
- “Skinner – Operant Psychology” en: Simply Psychology. Recuperado en: 17 Enero 2018 de Simply Psychology: simplypsychology.org.