Resumen y clasificación de los programas de reforzamiento. Unsplash.

A lo largo de nuestra vida estamos aprendiendo continuamente. En casa, en la escuela, en el trabajo… y no hablamos solo de un aprendizaje derivado de la educación en sí, sino del que también se deriva de la experiencia directa. Aprendemos a caminar, a sonreír socialmente, a hablar, a hacer o no hacer determinadas acciones, a que del grifo sale agua si lo abrimos o a que si trabajamos duro podemos obtener beneficio sea interno (satisfacción del hecho de hacerlo) o externo (un salario, aprobación social, muestras de afecto…).

Aunque aprender depende de una gran cantidad de variables, algunos de estos aprendizaje se obtienen a través de la asociación entre una conducta y sus consecuencias. Por ejemplo, es posible incrementar la probabilidad de una conducta si ello tiene consecuencias positivas. Y en este sentido es posible llegar a crear lo que se considera un programa de reforzamiento, de manera que dicha conducta sea mucho más probable y se incorpore a nuestro repertorio.

¿Qué es exactamente un programa de reforzamiento? ¿Qué tipos de programas de reforzamiento existen? Veámoslo a lo largo de este artículo.

Programas de reforzamiento: ¿qué son?

Un programa de reforzamiento no es más que un procedimiento reglado a través del cual es posible lograr el aprendizaje e incremento de la probabilidad de realizar una conducta determinada en base a la asociación de la realización de dicha conducta con una consecuencia vivida como positiva.

Dicha consecuencia, la cual es algún tipo de estimulación que nos resulta apetecible (y que puede o puede no ser una recompensa física), recibe el nombre de reforzador, al permitir su presencia fomentar e incrementar la realización de la conducta: la refuerza.

La consideración de la existencia de este tipo de programas parte de una de las principales y más conocidas ramas de la psicología, la psicología conductista, la cual se centró en la conducta observable como objeto de estudio y que pretendía el estudio objetivo y en base a pruebas evidenciables del que se considera el único correlato directamente observable de la psique: la conducta.

Concretamente parte del condicionamiento operante de Skinner, el cual consideraba que la conducta se explica como consecuencia de la asociación entre la emisión de una conducta y la percepción de unas consecuencias de dicha conducta, de tal forma que si al hacer algo tenemos consecuencias negativas o aversivas dejaremos de hacerlo o disminuiremos la probabilidad de repetir dicha acción y si al emitir una conducta obtenemos consecuencias apetitivas aumentaremos la probabilidad de hacerlo con el fin de seguir obteniendo dicha gratificación.

Más habituales de lo que parece

Si bien a simple vista el término de programa de reforzamiento puede parecer algo complejo y extraño, lo cierto es que en el día a día y de manera inconsciente nos solemos encontrar inmersos en ellos de una manera u otra. De hecho, aún de manera inconsciente, todos y cada uno de nosotros ha estado en alguna situación que podríamos considerar que forma parte de un programa de reforzamiento.

Es lo que ocurre por ejemplo cuando le enseñamos a una mascota cuál es el sitio para orinar y defecar o cuando le damos premios al enseñarles algún truco.

A nivel humano también es fácil de encontrar: aprender a caminar, hablar, utilizar un lavabo o incluso el simple hecho de aprender que abriendo un grifo sale agua pueden suponer la aplicación de programas de reforzamiento, aunque no estemos ante un programa elaborado conscientemente para ello. También cuando premiamos el esfuerzo en lo académico o lo laboral estamos llevando a cabo un reforzamiento, que si se da de manera contínua puede llegar a configurar un programa de estas características.

Tipos de programas de reforzamiento según su temporalidad

Uno de los principales elementos o criterios por los que nos podemos guiar para clasificar los diferentes tipos de programa de reforzamiento lo podemos encontrar en el grado de contingencia entre la realización de la conducta y la posible llegada del reforzador. En este sentido podemos encontrar dos tipos de programa básicos.

1. Programas de reforzamiento continuo

Consideramos que un programa es de reforzamiento continuo siempre que todas y cada una de las emisiones de la conducta objetivo reciben reforzamiento. Es decir, en una condición experimental, cada vez que se lleve a cabo la conducta deseada o estudiada esta va a tener como consecuencia la llegada del reforzador.

Por ejemplo, podemos encontrarnos con que cada vez que abrimos la puerta de la nevera se enciende la luz, o que cada vez que pulsamos un interruptor nos caiga comida o agua.

2. Programas de reforzamiento intermitente

En el caso de los programas de reforzamiento intermitente o parcial, nos encontramos con que únicamente algunas de las veces que se lleva a cabo la conducta se recibe un reforzador, de manera que no siempre que hagamos la conducta vamos a obtener una recompensa.

Los programas en los que se da este tipo de reforzamiento son por lo general los que mayor éxito tienen a la hora de mantener en el tiempo una conducta, ya que ya de base se sabe que no siempre tiene por qué aparecer el reforzador.

Dentro de los programas de reforzamiento intermitente podemos encontrar dos subtipos: los programas de reforzamiento fijo y los reforzamiento variable, los cuales van asociados a la condición que se elija experimentalmente para la presentación del refuerzo.

2.1 Programas de reforzamiento fijo

Los programas de reforzamiento fijo son aquellos en los que aunque el sujeto no obtiene reforzador cada vez que hace la conducta, existe un patrón respecto a cuándo va a obtenerse: la llegada del reforzador se da siempre cuando se cumple X requisito.

2.2 Programas de reforzamiento variable

Los programas de reforzamiento variable son aquellos en los que el sujeto no obtiene reforzador cada vez que hace la conducta sino que ello ocurre en algunas ocasiones, y no existe un patrón preestablecido para que se presente el reforzador: aunque está sujeto a la ocurrencia de la conducta, puede aparecer de maneras muy diferentes y de manera aleatoria.

Tipos de programa de reforzamiento según su complejidad

Conjuntamente con el grado de contingencia con el que se presenta el reforzador en relación a la conducta, también podemos encontrar diferentes tipos de programas de reforzamiento en función de su complejidad o, más bien dicho, del número de condiciones que deben cumplirse para que se pueda obtener el reforzador o incluso el tipo de condición que debe cumplirse. En este sentido podemos encontrar tres grandes grupos.

1. Programas de reforzamiento simple

Los programas de reforzamiento simple son todos aquellos en que de cara a obtener un reforzador únicamente debe cumlirse una condición, de la cual dependerá que el sujeto logre o no logre la recompensa y vea reforzada su conducta.

Dentro de este tipo de programas de reforzamiento, los cuales son por lo general los más básicos y más conocidos, podemos encontrar los siguientes subtipos.

1.1. Programas de razón

Entendemos por programas de razón todos aquellos programas de reforzamiento en los que la condición que debe cumplirse para obtener el reforzador sea la de realizar la conducta o respuesta un número determinado de veces.

En este sentido y en relación a la contingencia que hemos visto anteriormente, podemos encontrar programas de razón fija (cada vez que el sujeto haga la conducta X veces conseguirá reforzador) o variable (el número de veces que el sujeto debe hacer la conducta irá cambiando aleatoriamente).

1.2. Programas de intervalo

Los programas de intervalo son todos aquellos en los que la condición para que el sujeto pueda obtener el reforzador no es el número de veces que haga la conducta, sino que la lleve a cabo tras haber pasado un tiempo determinado desde el último reforzador.

Al igual que en el caso anterior, podemos encontrar programas de intervalo fijo (el sujeto recibirá reforzador si realiza la conducta una vez haya pasado un tiempo concreto desde el último) o de intervalo variable (el tiempo que debe pasar para que pueda conseguir un reforzador irá variando aleatoriamente).

2. Programas de reforzamiento complejos

Los programas de reforzamiento complejos son aquellos en que se da una combinación de varios programas básicos o simples, de tal manera que lograr el reforzador o no hacerlo dependerá de que se cumplan varias condiciones las cuales pueden ir variando a aparecer a un mismo tiempo.

Dentro de los programas de reforzamiento complejos podemos encontrar los siguientes.

2.1. Programas compuestos

Se entienden como programas compuestos aquellos tipos de programa de reforzamiento en los que se presentan diversos programas a la vez y en relación a una única conducta. Ello implica que las diferentes condiciones se aplicarán en función de un solo tipo de acción y no de varios.

Dentro de estos programas hay también varios subtipos, a saber:

2.1.1. Programas alternantes

Dentro de este tipo de programa compuesto el sujeto obtiene reforzador cuando cumple con uno de los criterios de cualquiera de los dos o más programas de reforzamiento que se están aplicando a la vez. Es decir, si se aplica un programa de reforzamiento de intervalo variable y uno de razón fija, la condición que se cumpla antes será la que le haga llegar el reforzador.

2.1.2. Programas conjuntivos

Este tipo de programa es algo más exigente: se precisa de que el sujeto cumpla con las dos o más condiciones procedentes de los diversos programas para obtener el refuerzo. Así, aunque cumpla con la condición de uno de ellos (por ejemplo que haya pasado un tiempo determinado) no recibirá reforzador hasta que además no haya cumplido el de los demás programas (por ejemplo que realice la conducta 5 veces).

2.1.3. Programas entrelazados

En este caso las condiciones necesarias para obtener el reforzador van cambiando: la condición de un programa va ir variando en función del avance que se haga en los otros.

2.1.4. Programas de ajuste

En este caso al igual que en el anterior el sujeto obtiene el reforzador dependiendo con condiciones que van variando, pero en vez de depender de cómo avanza la condición de uno para cambiar la del otro en este caso solo se depende de la actuación precedente. Es decir, se ajustan las condiciones en función del comportamiento anterior.

2.2. Programas secuenciales

Los programas secuenciales son tipos de programa de reforzamiento que se caracterizan porque en ellos las condiciones necesarias para obtener el reforzador van variando pero no porque dos programas se apliquen a la vez sino porque primero se sigue uno de los programas y después otro, en una secuencia. Dentro de este tipo de programa de reforzamiento se pueden encontrar:

2.2.1. Programas mixtos

Dos o más programas se van alternando al azar independientemente de lo que haga el sujeto, si bien bajo una misma situación y estímulo discriminativo. Es decir, si el sujeto obtiene comida cada vez que aprieta una palanca, primero puede obtenerla cuando la pulsa un número fijo de veces y luego solo cuando haya pasado cierto tiempo.

2.2.2. Programas múltiples

En este caso dos o más programas se van alternando, sin necesidad de que el sujeto haya hecho o no hecho la conducta para cambiar de programa. Sin embargo en esta ocasión pero cada uno de ellos tiene un tipo de estímulo discriminativo diferente entre sí.

2.2.3. Programas tándem

Se trata de dos o más programas que se van alternando siempre con un mismo patrón y en el que para pasar de uno a otro el sujeto primero tiene que haber cumplido con la condición propuesta en el anterior.

2.2.4. Programas encadenados

Se alternan dos programas con un patrón fijo y en base a que el sujeto haya cumplido la condición anterior para poder cambiar de programa, pero en esta ocasión con un estímulo discriminativo distinto para cada uno de los programas.

2.3. Programas secuenciales

Los programas secuenciales son tipos de programa de reforzamiento que se caracterizan porque en ellos las condiciones necesarias para obtener el reforzador van variando pero no porque dos programas se apliquen a la vez sino porque primero se sigue uno de los programas y después otro, en una secuencia.

Dentro de este tipo de programa de reforzamiento se pueden encontrar los siguientes.

2.3.1. Programas mixtos

Dos o más programas se van alternando al azar independientemente de lo que haga el sujeto, si bien bajo una misma situación y estímulo discriminativo. Es decir, si el sujeto obtiene comida cada vez que aprieta una palanca, primero puede obtenerla cuando la pulsa un número fijo de veces y luego solo cuando haya pasado cierto tiempo.

2.3.2. Programas múltiples

En este caso dos o más programas se van alternando, sin necesidad de que el sujeto haya hecho o no hecho la conducta para cambiar de programa. Sin embargo, en esta ocasión pero cada uno de ellos tiene un tipo de estímulo discriminativo diferente entre sí.

2.3.3. Programas tándem

Se trata de dos o más programas que se van alternando siempre con un mismo patrón y en el que para pasar de uno a otro el sujeto primero tiene que haber cumplido con la condición propuesta en el anterior.

2.3.4. Programas encadenados

Se alternan dos programas con un patrón fijo y en base a que el sujeto haya cumplido la condición anterior para poder cambiar de programa, pero en esta ocasión con un estímulo discriminativo distinto para cada uno de los programas.

2.4. Programas concurrentes

Este tipo de programa de reforzamiento se caracteriza por el hecho de que el sujeto está sometido a varios programas al mismo tiempo, de manera que puede obtener reforzadores en función de que realice diferentes conductas. Estos reforzadores podrían ser de distinta índole entre programas, si bien ello podría suponer la realización preferente de una conducta para lograr un reforzador que el sujeto considere más apetecible.

3. Programas de reforzamiento diferencial

Otro de los principales tipos de programa de reforzamiento es el diferencial, en el que la presencia o ausencia de reforzamiento depende no tanto de una condición o dos referida a que realice la acción o la haga en x tiempo, sino que lo que se valora es que el sujeto no la realice o que el momento de realizarla sea antes o después de un período determinado.

El objetivo de este tipo de reforzamiento, en realidad, es reforzar e incrementar la conducta de no realizar la conducta o hacer otra en lugar de la estudiada. En este sentido podemos encontrar tres subtipos.

3.1. Programas de reforzamiento diferencial de omisión

En este tipo de programas de reforzamiento el sujeto va a recibir un reforzador si (y solo si) no ha realizado la conducta dentro del periodo analizado.

3.2. Programas de reforzamiento diferencial de tasas bajas

Los programas de reforzamiento diferencial de tasas bajas son aquellos en los que el sujeto recibe reforzador siempre y cuando la realización de la conducta se lleve a cabo solo después de que haya pasado un cierto intérvalo de tiempo. Lo que se suele buscar es reducir la frecuencia de emisión de una conducta reforzando que tarde en hacerse.

3.3. Programas de reforzamiento diferencial de tasas altas

En este caso el sujeto obtiene reforzador únicamente si lleva a cabo la conducta objetivo antes de que haya transcurrido cierto tiempo. Lo que se busca en este caso es incrementar la frecuencia de emisión de la conducta objetivo.

3.4. Programas de reforzamiento de respuestas incompatibles

Un tipo de programa de gran utilidad, en este caso el sujeto obtiene un reforzador siempre y cuando dentro del intervalo de tiempo no lleve a cabo la conducta objetivo sino otras que resulten incompatibles con esta. Lo que se busca es reducir la emisión de la conducta premiando la realización de otras que impiden que esta aparezca.

Referencias bibliográficas:

  • Bayes, R. & Pinillos, J.L. (1989). Aprendizaje y condicionamiento. Alhambra. Madrid.
  • Domjan, M. & Burkhard, B. (1990). Principios de aprendizaje y conducta. Debate. Madrid.
  • Higueras, B. y Muñoz, J.J, (2012). Psicología básica. Manual CEDE de Preparación PIR, 08. CEDE: Madrid.
  • Pérez Fernández, V., Gutiérrez Domínguez, M.T., García García, A. y Gómez Bujedo, J. (2010). Procesos Psicológicos Básicos. Un análisis funcional. Universidad Nacional de Educación a Distancia (UNED).