B. F. Skinner, uno de los teóricos clave de la orientación conductista, definió el reforzamiento como un tipo de aprendizaje basado en la asociación de una conducta con las consecuencias derivadas de esta, que aumentan o disminuyen la probabilidad de que sea ejecutada de nuevo. Cuando son negativas hablamos de castigo, y cuando son positivas de refuerzo.
Dentro del aprendizaje por reforzamiento distinguimos dos tipos de consecuencia: el refuerzo positivo y el negativo. Mientras que el refuerzo positivo se da cuando la conducta conlleva la obtención de un premio, el refuerzo negativo consiste en la evitación o retirada de un estímulo aversivo. Veamos las características principales de ambos procedimientos.
- Artículo relacionado: "5 técnicas de modificación de la conducta"
Reforzamiento y condicionamiento operante
Los conceptos “refuerzo positivo” y “refuerzo negativo” se enmarcan en el paradigma del condicionamiento instrumental u operante. A diferencia del condicionamiento clásico o pavloviano, en que se aprende la asociación entre un estímulo y una respuesta, en el instrumental el sujeto asocia la realización de una conducta con unas consecuencias determinadas.
El condicionamiento operante surgió de la obra de los conductistas Edward Thorndike, que estudió el proceso por el cual gatos conseguían escapar de “cajas-problema”, y Burrhus F. Skinner, que describió de forma sistemática las características de este procedimiento de aprendizaje y lo aplicó a ámbitos diversos, especialmente a la educación.
Skinner distinguió tres tipos de aprendizaje instrumental: el de castigo, que consiste en la aparición de un estímulo aversivo tras la ejecución de la conducta, el de omisión, en el cual la respuesta se asocia con la ausencia de recompensa, y el de reforzamiento, en que la conducta es premiada. Dentro de este procedimiento encontramos el refuerzo positivo y el negativo.
En el marco del condicionamiento operante las consecuencias de la conducta pueden ser positivas o negativas para quien las recibe; no obstante, esta diferenciación no es la que separa al refuerzo positivo del negativo, sino que cuando el comportamiento tiene consecuencias apetitivas hablamos de refuerzo, y de castigo cuando son aversivas.
Cuando nos referimos al refuerzo o al castigo, los términos “positivo” y “negativo” no hacen referencia a la agradabilidad de la consecuencia, sino a la aparición o desaparición de un estímulo determinado: en el reforzamiento positivo se aprende que se obtendrá una recompensa si se hace algo, y en el negativo que se evitará o se eliminará un estímulo desagradable.
- Artículo relacionado: "Condicionamiento operante: conceptos y técnicas principales"
¿Qué es el refuerzo positivo?
En el aprendizaje por reforzamiento positivo se asocia la realización de una conducta con la obtención de una consecuencia agradable. Ésta no tiene por qué ser un objeto, ni siquiera tangible; comida, sustancias, una sonrisa, un mensaje verbal o la aparición de una emoción agradable son susceptibles de ser entendidos como refuerzos positivos en muchos contextos.
Un padre que felicita a su hija pequeña cada vez que utiliza el retrete correctamente fortalece un aprendizaje por reforzamiento positivo; lo mismo sucede cuando una empresa otorga primas económicas a sus trabajadores más productivos, e incluso cuando obtenemos una bolsa de patatas fritas tras meter una moneda en una máquina expendedora.
El concepto “refuerzo positivo” hace referencia al premio que sigue a la conducta, mientras que el reforzamiento positivo es el procedimiento por el cual el sujeto que aprende realiza la asociación. No obstante, con frecuencia se utilizan los términos “refuerzo” y “reforzamiento” de forma intercambiable, probablemente porque en inglés no existe esta distinción.
Desde un punto de vista técnico podemos decir que en el reforzamiento positivo existe una contingencia positiva entre una respuesta concreta y un estímulo apetitivo. La conciencia de esta contingencia motiva al sujeto a ejecutar la conducta por tal de obtener la recompensa (o refuerzo).
Definiendo el refuerzo negativo
A diferencia de lo que sucede en el positivo, en el reforzamiento negativo la respuesta instrumental conlleva la desaparición de un estímulo aversivo, es decir, un objeto o situación que motiva al sujeto a escapar o a procurar no entrar en contacto con esta.
En términos conductuales, en este procedimiento el refuerzo es la desaparición o la no aparición de la estimulación aversiva. Como hemos planteado previamente, la palabra “negativo” hace referencia a que la recompensa no consiste en la obtención de un estímulo sino en su ausencia.
Este tipo de aprendizaje se divide a su vez en dos procedimientos: el entrenamiento de escape y el de evitación. En el reforzamiento negativo de evitación la conducta impide la aparición del estímulo aversivo; por ejemplo, cuando una persona agorafóbica evita utilizar el transporte público para evitar la ansiedad que le supone está siendo reforzada negativamente.
Por contra, el escape consiste en la desaparición de un estímulo aversivo que se encuentra presente antes de que el sujeto ejecute la conducta. Algunos ejemplos de refuerzo negativo de escape son que un despertador se pare al pulsar un botón, que una madre compre a su hijo lo que le pide para que deje de llorar o que consumir un analgésico alivie un dolor.