Download control de estímulo y condicionamiento con estimulación

Document related concepts

Castigo (psicología) wikipedia , lookup

Condicionamiento operante wikipedia , lookup

Teoría del aprendizaje social wikipedia , lookup

Condicionamiento clásico wikipedia , lookup

Ingeniería del comportamiento wikipedia , lookup

Transcript
Tema 5
Condicionamiento instrumental:
Control de estímulos y
condicionamiento con estimulación aversiva
Bloque 2: Aprendizaje asociativo mediante condicionamiento
Tema 3: APRENDIZAJE ASOCIATIVO MEDIANTE CONDICIONAMIENTO CLÁSICO
Tema 4: APRENDIZAJE ASOCIATIVO MEDIANTE CONDICIONAMIENTO INSTRUMENTAL DE RECOMPENSA
Tema 5: CONDICIONAMIENTO INSTRUMENTAL: CONTROL DE ESTÍMULO Y CONDICIONAMIENTO CON ESTIMULACIÓN AVERSIVA
Indice del Capítulo
1. ADQUISICIÓN DEL CONTROL Y PREDICCION DE LA ACCION MEDIANTE CLAVES CONTEXTUALES ANTECEDENTES237
1.1. Introducción ...................................................................................................................................................................... 237
1.1.1. El aprendizaje de señal en el condicionamiento instrumental .................................................................................. 237
1.1.2. El aprendizaje de señal como control de estímulos .................................................................................................. 238
1.1.3. Variaciones en las condiciones antecedentes y resultados de generalización y discriminación .............................. 238
1.1.4. Implicaciones prácticas del aprendizaje instrumental señalizado............................................................................. 238
1.2. Técnicas experimentales .................................................................................................................................................. 240
1.2.1. Técnicas simples: el refuerzo diferencial .................................................................................................................. 240
1.2.2. El gradiente de generalización / discriminación ........................................................................................................ 240
2. GENERALIZACIÓN: ADQUISICIÓN DEL CONTROL DE ESTÍMULOS GENERALIZADOS ................................................ 241
2.1. Procedimientos de estudio de la generalización .............................................................................................................. 241
2.2. Tipos de generalización .................................................................................................................................................... 242
2.2.1. Generalización de estímulo....................................................................................................................................... 242
2.2.2. Generalización de respuesta: Moldeamiento o aproximaciones sucesivas .............................................................. 242
2.3. Por qué la generalización (teorías explicativas) ............................................................................................................... 243
3. DISCRIMINACIÓN: ADQUISICIÓN DE LA DISCRIMINACIÓN DE ESTÍMULOS .................................................................. 244
3.1. Técnicas simples: Refuerzo diferencial discriminativo ..................................................................................................... 244
3.2. Técnicas complejas de adquisición de discriminación ..................................................................................................... 245
3.2.1. Atenuación o desvanecimiento del estímulo ............................................................................................................. 245
3.2.2. Comparación con la muestra .................................................................................................................................... 246
3.2.3. Combinación de ED y refuerzo secundario: el encadenamiento .............................................................................. 246
3.3. Por qué ocurre la discriminación (teorías explicativas) .................................................................................................... 247
4. CONDICIONES PARA LA ADQUISICION DEL CONTROL DE ESTIMULOS ....................................................................... 248
4.1. Condiciones durante la adquisición .................................................................................................................................. 248
4.2. Condiciones de entrenamiento previo en discriminación ................................................................................................. 249
5. PROCEDIMIENTOS APLICADOS PARA EL ESTABLECIMIENTO DEL CONTROL DE ESTIMULO .................................. 251
5.1. Aplicación de instigadores y desvanecimiento ................................................................................................................. 251
5.1.1. Dificultades con el refuerzo diferencial ..................................................................................................................... 251
5.1.2. Los instigadores como facilitadores de la discriminación ......................................................................................... 252
5.1.3. Desvanecimiento de los instigadores ....................................................................................................................... 253
5.1.4. Métodos aplicados a la reeducación de las dificultades de aprendizaje .................................................................. 253
5.2. Cambio de un control de estímulo por otro: El cambio físico de ambiente ...................................................................... 254
6. CONDICIONAMIENTO INSTRUMENTAL AVERSIVO ........................................................................................................... 254
6.1. Introducción: Tipos de condicionamiento en función de la estimulación aversiva ........................................................... 254
6.1.1. Tipos de aversividad ................................................................................................................................................. 254
6.1.2. Tipos de condicionamiento con estimulación aversiva ............................................................................................. 255
6.2. Condicionamiento de escape ........................................................................................................................................... 256
6.2.1. Definición .................................................................................................................................................................. 256
6.2.2. Condiciones o factores en la adquisición de la conducta de escape ........................................................................ 257
6.3. Aprendizaje de evitación................................................................................................................................................... 258
6.3.1. Definición, fases en la adquisición, tipos y procedimientos ...................................................................................... 258
6.3.2. Condiciones para la adquisición de la respuesta de evitación ................................................................................. 261
6.3.3. Por qué ocurre la evitación (teorías explicativas) ..................................................................................................... 262
6.3.4. Extinción de la respuesta de evitación ...................................................................................................................... 264
6.4. Castigo ............................................................................................................................................................................. 267
6.4.1. Definición, características y líneas de investigación ................................................................................................. 267
6.4.2. Tipos de castigo: Castigo por aplicación y por supresión ......................................................................................... 268
6.4.3. Condiciones para la efectividad del castigo .............................................................................................................. 269
6.5. La pérdida del control de la acción: Indefensión aprendida ............................................................................................. 273
6.5.1. Concepto y técnicas experimentales ........................................................................................................................ 273
6.5.2. Efectos o resultados de la indefensión aprendida .................................................................................................... 274
6.5.3. Condiciones para la adquisición de la indefensión aprendida .................................................................................. 275
- 235 Asignatura: Aprendizaje (6 créditos). Obl. de 2º curso Grado Psicología, Curso 2010/2011
Profesores: Dr. Agustín Romero Medina ([email protected]) y Ldo. Pedro Jara Vera ([email protected]). Deptº Ps. Básica y Metodología. Univ. de Murcia. Fac.
Psicología; En Aula Virtual Fac. Psicología en http://avpsi.inf.um.es/moodle/ (usuario: dni sin letra; contraseña: dni sin letra); y en SUMA campus virtual
236
Universidad de Murcia. Grado Psicología. Asignatura: Aprendizaje, 6 cr. 2º curso, 1º. cuatr., curso 2010/11
6.5.4. Por qué ocurre la indefensión aprendida (teorías explicativas) ................................................................................ 276
6.5.5. Repercusiones aplicadas de la indefensión aprendida ............................................................................................ 278
7. PRÁCTICAS DE AUTOEVALUACIÓN DEL TEMA 5 ............................................................................................................. 279
Resumen del tema
En cuanto al control de estímulo en el condicionamiento instrumental, en mayor o menor medida, hay variedades de aprendizaje mediante condicionamiento que combinan aspectos del condicionamiento clásico y del instrumental. Así, en este capítulo se analizan las posibilidades de los EC que se asocian no a EIs sino a respuestas reforzadas, o sea, los estímulos antecedentes de la respuesta instrumental.
En lo referente al condicionamiento instrumental aversivo, trataremos en este capítulo aquellas tareas y procedimientos de aprendizaje en donde se utilice estimulación aversiva, sobre todo condicionamiento instrumental. En capítulos anteriores estudiamos procesos y tareas de aprendizaje en los cuales los eventos significativos eran positivos (gratificantes o reforzantes). Sin embargo, una gran parte de la
conducta que se aprende va dirigida no ya a obtener consecuencias positivas sino a eliminar, reducir o evitar situaciones desagradables.
Analizaremos el condicionamiento instrumental con refuerzo negativo (escape y evitación), tanto en sus aspectos de adquisición como de
extinción. También estudiaremos procedimientos aversivos inhibitorios o que reducen la tasa de respuesta (castigo) y por último, el efecto
de la estimulación aversiva no contingente en lo que se denomina indefensión aprendida.
Lecturas complementarias
Referente al control de estímulo, véanse los manuales de Hilgard y Bower (1966; trad. 1976, pp. 562-585), Hulse et al. (1980; trad.
1982, cap. 7), Kimble (1961; trad. 1969; 377-452), Marx (1969; trad. 1976; pp. 297-424), Rachlin (1976; trad. 1979, pp. 456-483), Tarpy
(1981; trad. 1986, cap. 9), Wittig (1982, pp 119-136), y el capítulo de Arias Holgado, Benjumea y Fernández Serra (1997). Sobre control
de estímulos desde un punto aplicado es útil Sulzer-Azaroff y Mayer (1977; trad. 1983) y también el capítulo de Navarro Guzmán (1994).
Para cuestiones de escape, evitación y castigo hay buenos capítulos en Hulse et al. (1980; trad. 1982, pp. 167-207), Mackintosh
(1983; trad. 1988, caps. 5 y 6), Pelechano (1980), Rachlin (1976; trad. 1979, caps. 5 y 9), Tarpy (1975; trad. 1977), pp. 125-186), Fernández Castro (1989), de Vicente (1997) y Maldonado (1998, pp. 257-298) sobre indefensión es imprescindible la lectura del libro de Seligman (1975; trad. 1980) y las revisiones de Vazquez-Valverde y Polaino (1982), de Ferrándiz (1989), de Vicente (1997) y Maldonado
(1998, pp. 257-298) . También es muy ilustrativo el texto de Gray (1988; trad. cast. 1993) y el manual de Klein (1991; trad. cast. 1994, pp.
201-250)
Tema 5: Condicionamiento instrumental. Control de estímulo y condicionamiento con estimulación aversiva
237
1. ADQUISICIÓN DEL CONTROL Y PREDICCION DE LA ACCION MEDIANTE
CLAVES CONTEXTUALES ANTECEDENTES
1.1. Introducción
1.1.1. El aprendizaje de señal en el condicionamiento instrumental
En los temas precedentes de aprendizaje mediante condicionamiento hemos analizado situaciones
en las que los resultados externos del aprendizaje (cambios conductuales) se hacían depender de las
consecuencias estimulares (condicionamiento clásico) o de la acción (condicionamiento instrumental)
pero en fenómenos separados y diferentes de aprendizaje. Sin embargo, es un hecho que la conducta
no se da "en el vacío" (Mackintosh, 1977; p. 643, trad. esp., 1983) sino en un determinado contexto
que está presente en el momento de emitir la respuesta y que puede influir en ella. Estos componentes
del contexto que influyen en la respuesta se denomina, en la terminología conductista, condiciones antecedentes. Estas condiciones pueden ser de dos tipos: motivacionales y estimulares:
- Las primeras tienen, como sabemos (ver Tema 1), un valor activador (por ejemplo, es necesaria una
cierta privación de comida para que la rata inicie el condicionamiento) y no se van a tratar aquí.
- Las condiciones antecedentes estimulares forman parte del contexto, ambiente o estimulación previa
o concomitante a la respuesta. Así, la correlación acción-consecuencia, necesaria para el aprendizaje
de respuestas (condicionamiento instrumental) se convierte en un aprendizaje más completo si consideramos la correlación ANTECEDENTES - ACCION - CONSECUENCIA o, lo que es lo mismo, E-R-C (estímulo
- respuesta - consecuencia). Es más completo pues combina condicionamiento clásico y condicionamiento instrumental, o sea,
(ESTÍMULO – CONSECUENCIA) + (RESPUESTA – CONSECUENCIA) = ESTÍMULO – RESPUESTA – CONSECUENCIA
En el condicionamiento clásico se producía un aprendizaje de señal, es decir, el EC activaba expectativas de consecuencia estimular favorable o desfavorable y con ello desencadenaba más o menos automáticamente la respuesta. También en el condicionamiento instrumental con estímulos discriminativos -es decir, en el aprendizaje de respuestas señalizadas o también aprendizaje instrumental señalizado-, se hace un aprendizaje de señal (donde el EC se denomina ahora estímulo discriminativo o ED),
pero la señal activa en la memoria no la representación aislada de la consecuencia sino la representación conjunta de acción - consecuencia (R-C). El esquema de esta comparación es el siguiente:
Tipo de condicionamiento
Señal observable
Representación activada
Condicionamiento clásico:
EC
ED
EI
Condicionamiento instrumental:
(R-C)
El aprendizaje instrumental señalizado tiene pues dos niveles de complejidad:
- Que la respuesta se desencadene tras la aparición del estímulo antecedente, es decir, que un estímulo
ambiental cualquiera se convierta en señal predictiva para R-C. Esto es lo que podríamos llamar adquisición inicial del control de estímulo.
- Que, una vez señalizada la conducta, ésta se pueda realizar ante otras señales más o menos parecidas.
Se trata de adquirir la señalización específica (discriminación) o la señalización amplia (generalización). En cualquier caso, se adquiere “control de estímulos”: en un caso control de estímulos discriminativos y en otro, control de estímulos generalizados o extensión del control a otros estímulos similares.
238
Universidad de Murcia. Grado Psicología. Asignatura: Aprendizaje, 6 cr. 2º curso, 1º. cuatr., curso 2010/11
1.1.2. El aprendizaje de señal como control de estímulos
En los manuales de psicología del aprendizaje, este aprendizaje instrumental señalizado aparece en
temas con epígrafes del tipo "generalización y discriminación" y también "control de estímulos". Esta
última denominación, si bien procede del enfoque operante skinneriano -Terrace (1966) fue el primero
en utilizarla- , aquí, siguiendo entre otros a Rilling (1977) y Mackintosh (1977), va a tener un sentido
más amplio, neutro e integrador de los anteriores. Procederemos en este apartado a una delimitación
conceptual de estos términos.
Desde un punto de vista estrictamente skinneriano, se dice que una respuesta está bajo el control de
un estímulo (generalmente denominado estímulo discriminativo, ED) cuando la probabilidad de que
ocurra dicha respuesta es mayor en presencia de dicho estímulo que en su ausencia. Naturalmente, esta
mayor probabilidad de respuesta ante el estímulo ocurre siempre que se establezca una experiencia
previa de correlación entre estímulo antecedente - acción - consecuencia positiva. Por tanto "control"
aquí se entiende como mayor posibilidad de predicción de que se emitirá la respuesta en presencia de
ese estímulo (y no como obligatoriedad o necesidad de emitir la respuesta ante ese estímulo). La forma
de comprobar que se ha producido la adquisición de control de estímulo es si existe diferente tasa o
probabilidad de respuesta en presencia de distintos estímulos (mayor ante ED que ante otros estímulos).
1.1.3. Variaciones en las condiciones antecedentes y resultados de generalización y discriminación
Una vez establecida la correlación estímulo-acción-consecuencia (si estamos en el condicionamiento instrumental) o la correlación estímulo-consecuencia (si se trata del condicionamiento
clásico), el control de estímulo puede darse ante más o menos estímulos en función del tipo, cualidad o
magnitud de los estímulos antecedentes y de las consecuencias que tenga la conducta ante cada uno de
ellos. Así es como se puede lograr la especificidad (discriminación) o la extensión de la capacidad señalizadora a otros estímulos (generalización). Estas dos posibilidades deben entenderse como resultados conductuales de dichas manipulaciones.
Ambos conceptos se configuran como dos extremos de un continuo. En un extremo, el incremento
de respuesta ante diversos estímulos parecidos (generalización) y, en otro, ante estímulos muy específicos (discriminación). En cualquier punto del continuo siempre se tenemos estímulos antecedentes
que “controlan” (predicen) respuestas, es decir, que son capaces de predecir una alta probabilidad de
ocurrencia de las mismas en su presencia. En cierto sentido, la adquisición del control de estímulo suele requerir una discriminación de estímulos. Ahora bien, lo que se trata de aprender es el grado en que
varios (generalización) o un solo estímulo (discriminación) son capaces de señalizar la respuesta (y
por tanto responsables del control de estímulo). Obviamente, entendemos que a medida que aumenta la
generalización, disminuye la discriminación, y viceversa. Discriminación y generalización son fenómenos opuestos porque mantienen una relación inversa.
El control de estímulos, y sus aspectos de discriminación y generalización, es un proceso con un
gran valor adaptativo para el hombre (y otras especies). Se trata de aprender a responder selectivamente ante determinados estímulos (por sus consecuencias gratificantes) y a no responder ante otros (por
sus repercusiones aversivas o simplemente por su falta de repercusiones).
1.1.4. Implicaciones prácticas del aprendizaje instrumental señalizado
La palabra "antecedentes" aquí tiene una dimensión temporal amplia en cuanto al momento del establecimiento de la correlación con la acción y/o con la consecuencia. En cualquier caso, una vez re-
Tema 5: Condicionamiento instrumental. Control de estímulo y condicionamiento con estimulación aversiva
239
presentada en la memoria esta expectativa de relación triple (estímulo antecedente, acción, consecuencia), la mera aparición del antecedente servirá para desencadenar la acción, convirtiéndose así en señal
o indicio de que la acción tendrá una consecuencia positiva y permitiendo una proximidad temporal
entre el antecedente y la acción.
Como dicen Domjan y Burkhard (1986), es tan habitual el control de estímulos que no pensamos
en la cantidad de veces que lo aplicamos y lo raro que resultaría -por no decir anormal o patológico- el
mostrar conductas que no estén bajo el control de estímulos. Citan cuatro ejemplos y contraejemplos
interesantes:
- La conducta de desnudarse para cambiarse de ropa se hace en la intimidad del dormitorio y no en
medio de la calle,
- se mira la TV si está encendido el aparato y no si está apagado,
- se tiene una interacción cariñosa (caricias, besos) con familiares próximos y no con desconocidos,
- se grita en un partido de fútbol y no en clase o en la biblioteca.
En todos estos casos, la conducta se hace cuando se está en el contexto adecuado y no en otros
momentos. Eso es control de estímulos o aprendizaje instrumental señalizado.
Pero hay más ejemplos: Al circular en coche por la carretera, una señal de STOP es ED, antecedente
o indicio inmediato de que si se realiza la respuesta (parar) se obtendrá una consecuencia (no peligro);
en este caso (que aunque es más bien de evitación sirve igualmente en este momento), la conexión entre ese estímulo, la respuesta y la consecuencia pudo aprenderse hace tiempo (al estudiar para la obtención del carnet de conducir, por ejemplo) pero es obvio que la aparición del estímulo genera inmediatamente una mayor probabilidad de respuesta.
El tema es pues de gran importancia teórica y sobre todo práctica. La conducta adaptativa se caracteriza, entre otras cosas, por producirse "en el momento oportuno" (Hulse, Egeth y Deese, 1982; p.
206) y el momento oportuno para responder sólo lo puede anticipar el sujeto si aparecen las correspondientes señales de ello. Será más probable que una acción tenga consecuencias adaptativas cuando
se sabe cuándo y en qué lugar y en presencia de qué eventos se debe realizar. Por citar más ejemplos,
en clase el alumno no habla (respuesta de "estar atento y en silencio") cuando-el-profesor-expone-eltema (ED), cruzamos la calle (respuesta) cuando el-semáforo-está-en-verde (ED), escribimos (respuesta) cuando observamos salir la tinta (ED) del bolígrafo al rozar su punta sobre el papel. Ahora bien, cogemos el teléfono (respuesta) cuando oímos el timbre (ED) pero no si oímos el timbre de la puerta (discriminación) y decimos "mesa" (respuesta) cuando dicho conjunto de letras lo vemos escrito con
mayúsculas o con minúsculas o en cursiva (generalización).
El situar la acción bajo el control del o de los estímulos es un aprendizaje básico. En la mayoría de
situaciones cotidianas es una conducta o hábito sobreaprendido (o aprendido hace mucho tiempo), pero en otras tenemos que activar continuamente estrategias que logren un control del estímulo. Por
ejemplo, ante un aparato no muy conocido (video, ordenador, equipo de música, etc. ), su manejo inicial (respuesta) es dificultoso y debe ponerse bajo el control de estímulo para aprenderlo, y para ello
ponemos en marcha distintas estrategias (leer las instrucciones, buscar a un experto y que nos explique
el manejo, método de ensayo y error, etc.). Pero hay conductas muy complejas para cuya realización
se requiere un sofisticado y laborioso control de estímulo que tarda tiempo en establecerse. Así, la
conducta lectora exige situarse ante un texto escrito, fijar los ojos en los símbolos gráficos adecuados
y emitir los sonidos correspondientes. El lector maduro tiene un adecuado control de estímulo pero el
niño que aprende a leer necesita ayuda (profesores, métodos especiales de presentación de estímulos
en “cartillas”, dosificación de dificultad, etc. ). Hay una serie de métodos generales desarrollados para
“instigar” inicialmente el hecho de que la conducta se sitúe bajo el control del estímulo.
Así pues dedicaremos este capítulo al aprendizaje instrumental señalizado o control de estímulos,
para lo cual estudiaremos los procedimientos de adquisición, las condiciones, teorías y procesos y
técnicas aplicadas.
240
Universidad de Murcia. Grado Psicología. Asignatura: Aprendizaje, 6 cr. 2º curso, 1º. cuatr., curso 2010/11
1.2. Técnicas experimentales
1.2.1. Técnicas simples: el refuerzo diferencial
Así como el caso de un estímulo reforzante su efectividad es casi automática para aumentar la probabilidad de emisión de la respuesta, no ocurre así con los ED. Estos inicialmente no señalizan nada y
por tanto se necesita un período de adquisición de dicha función. Para conseguir que un estímulo adquiera la función de ED, el procedimiento más usado es el refuerzo diferencial discriminativo. Se lleva
a cabo mediante dos operaciones básicas:
- reforzar una respuesta emitida en presencia del estímulo o estímulos particulares, que queremos que
se conviertan en ED .
- no reforzar dicha respuesta si ocurre en ausencia de dichos estímulos o ante otros diferentes (E ).
Un ejemplo es el experimento original de Guttman y Kalish (1956) en palomas. El procedimiento
incluía dos fases:
I) Fase de entrenamiento: Al picotear un disco iluminado las palomas recibían refuerzo continuo. Se
varió la intensidad de luz del disco y así se hicieron cuatro grupos de palomas, uno para cada intensidad -530, 550, 580 y 600 nanómetros (nm, medida de longitud de onda)-.
II) Fase de prueba: Para cada grupo, el disco se iluminaba con 11 diferentes longitudes de onda (de
470 a 640 nm.), con una duración en cada caso de 30 segs. La respuesta era reforzada sólo tras uno
de los 11 estímulos presentados (convirtiéndose así en ED). Hubo 12 ensayos para cada estímulo. El
resultado fue una mayor probabilidad de respuesta ante el ED que ante los otros estímulos y una
fuerza de respuesta en forma de U invertida (el pico de respuesta máxima ante ED), formando así lo
que denominaron un gradiente de generalización.
1.2.2. El gradiente de generalización / discriminación
La mejor técnica para evaluar el grado de generalización o discriminación que se produce en la adquisición del aprendizaje instrumental señalizado es la del gradiente de generalización / discriminación. Es un procedimiento iniciado por Guttman y Kalish (1956) que presenta los resultados en términos de representación gráfica de la fuerza (intensidad o frecuencia) de la respuesta dada al estímulo
original y a otros estímulos semejantes. El grado de generalización de estímulo se aprecia en la magnitud o frecuencia de respuesta. Cuanto menos similar sea el nuevo estímulo al estímulo original menor
será la fuerza de la respuesta, y esto ocurre de forma graduada siguiendo un patrón determinado que se
presenta gráficamente en forma de U invertida.
Además, como ya dijimos que generalización y discriminación son extremos opuestos de un continuo, ambos fenómenos pueden evaluarse en un mismo gradiente. En la Figura 1 tenemos un ejemplo
de gradiente de generalización en dos de sus manifestaciones extremas: cuando se da mucha generalización (a) y cuando es escasa, y por tanto hay una gran discriminación (b).
Tema 5: Condicionamiento instrumental. Control de estímulo y condicionamiento con estimulación aversiva
241
Fuerza de la
respuesta
E original
(a)
E original
(b)
Intensidad o
frecuencia
(c)
E1
E2
E3
E4
Figura 1: Representación gráfica de dos tipos de gradientes de generalización.
En el gráfico (a) de la figura anterior, se produce una amplia dispersión de la generalización de
estímulo como forma de responder a diversos estímulos. En el caso del gráfico (b) se produce una respuesta diferenciada y por tanto una escasa generalización de estímulo. La representación gráfica (c) es
otra forma de exponer gráficamente el gradiente de generalización.
Además de estos gradientes excitatorios, también es posible lograr gradientes inhibitorios o gradiente de extinción. Un ejemplo es el experimento de Honig (1961) con palomas. Tenía tres fases:
I) Fase preliminar, en la que se establecía una línea base de adquisición mediante refuerzo de una respuesta de picoteo de un disco iluminado con 13 longitudes de onda diferentes (de 490 a 630 nm). El
animal respondía pues ante los 13 estímulos.
II) Fase de extinción: ante uno (E ) de los 13 estímulos (570 nm) la respuesta nunca era reforzada.
III) Prueba de generalización: Se volvían a presentar los 13 estímulos. Los resultados, presentados
gráficamente en el correspondiente gradiente muestran una función en U, siendo el pico inferior la
respuesta ante E .
2. GENERALIZACIÓN: ADQUISICIÓN DEL CONTROL DE ESTÍMULOS
GENERALIZADOS
2.1. Procedimientos de estudio de la generalización
El procedimiento básico es también de refuerzo diferencial, midiendo las tasas de respuesta que se
dan tras cada estímulo, antes y después de ser reforzada la respuesta. Se trata pues de comparar tasas
de respuesta en presencia de diferentes estímulos.
Hay dos grupos de técnicas diferentes: las que suponen presentar estímulos diferentes a los mismos
sujetos y las que hacen presentar el mismo estímulo a distintos grupos de sujetos:
- El primer tipo de técnica es la del estímulo repetido, según la cual se presentan estímulos distintos
(pero similares al condicionado) en orden aleatorio. Tiene el inconveniente de que la respuesta ante
uno de los estímulos puede verse muy influida por las consecuencias de las respuestas ante los otros.
- El segundo tipo de técnica se llama técnica del estímulo único: se divide al grupo experimental en
subgrupos y cada uno de ellos recibe sólo un estímulo (diferente para cada grupo); se comparan las
tasas de respuestas de los distintos grupos entre sí.
242
Universidad de Murcia. Grado Psicología. Asignatura: Aprendizaje, 6 cr. 2º curso, 1º. cuatr., curso 2010/11
2.2. Tipos de generalización
La generalización puede ser, en general, de dos tipos: generalización de estímulo y de respuesta. En
la primera es la misma respuesta la que surge ante otros estímulos distintos del inicialmente condicionado; en la segunda es una primera respuesta reforzada la que provoca que aparezcan respuestas parecidas.
2.2.1. Generalización de estímulo
Mediante procedimientos de la generalización de estímulo, una misma respuesta podrá realizarse
ante situaciones o contextos no idénticos pero similares a aquellos en que tuvo lugar el entrenamiento.
Es decir, el reforzamiento de una respuesta ocurrida siempre en presencia de un mismo estímulo, provoca que dicha respuesta se pueda producir ante parecidos estímulos. Por ejemplo, un niño puede mostrar temor como respuesta a un médico, debido a una asociación del médico con el dolor producido por
una inyección y luego tendrá miedo ante cualquiera que lleve bata blanca.
El grado de generalización del estímulo principalmente depende del grado de similaridad del nuevo
estímulo bajo el cual también se emitió la respuesta.
Algún autor (Wittig, 1982, p. 119) distingue dos tipos de generalización del estímulo:
- Generalización primaria, en la que el organismo responde no sólo al estímulo original sino a otros
con propiedades físicas similares. Por ejemplo, una rata entrenada a responder al tic-tac del metrónomo puede responder también al golpeteo de una varilla en un bloque de madera.
- Generalización secundaria, según la cual un organismo responde a un estímulo debido a alguna
equivalencia aprendida entre los dos. Por ejemplo, un sujeto entrenado a responder a la palabra "alto"
puede también responder a la palabra "pare". Es algo similar al condicionamiento de segundo orden
en el condicionamiento clásico.
La generalización de estímulos es un fenómeno conductual omnipresente. Gracias a él no tenemos
que aprender constantemente una respuesta ante cada estímulo nuevo sino que ante estímulos similares
damos una respuesta semejante. De este modo, un maestro puede pretender que el alumno aprenda a
leer, por ejemplo la letra A, no sólo con la grafía propia de la cartilla escolar sino en cualquier otra
grafía.
La generalización tiene pues ventajas para el aprendizaje pero también algún inconveniente. En
términos positivos, proporciona estabilidad al comportamiento y tiene por tanto gran valor adaptativo.
En términos negativos y según las condiciones específicas, puede entenderse como una mala discriminación o una discriminación todavía mal lograda.
2.2.2. Generalización de respuesta: Moldeamiento o aproximaciones sucesivas
La generalización de respuesta consiste en un aumento de probabilidad de ocurrencia de otras respuestas parecidas a la reforzada. El reforzamiento de una respuesta aumenta la probabilidad de otras
respuestas similares. En esto se basa el método de moldeamiento (shaping), muy utilizado en modificación de conducta -y también como procedimiento experimental para la adquisición rápida del condicionamiento de recompensa; véase aptdo. 1.4.2.a del Tema 4)-.
Tema 5: Condicionamiento instrumental. Control de estímulo y condicionamiento con estimulación aversiva
243
Se basa en el refuerzo de cada respuesta que se parezca o aproxime a una "respuesta terminal" o
“conducta objetivo” seleccionada de antemano. Se emplea el moldeamiento o método de aproximaciones sucesivas cuando la respuesta terminal no se da habitualmente en el repertorio comportamental del
sujeto. Así, si uno es reforzado por sonreír, aumenta la frecuencia de la risa y quizás de otras respuestas tales como la conversación. O sea, la alteración en la frecuencia de una respuesta puede influir
de forma inadvertida en otras. En resumen el esquema que corresponde a ambos tipos de generalización sería el que se muestra en la Figura 2.
GENERALIZACION DE
ESTIMULO
GENERALIZACION DE
RESPUESTA
E1
E1
E1
E2
E3
R1
Eref
R1
R1
E1
Eref
R1
R2
R3
Figura 2: Esquema sobre los tipos de generalización.
2.3. Por qué la generalización (teorías explicativas)
Las tres teorías explicativas más clásicas son las siguientes:
a) Teoría de Hull: Según Hull (1943), la generalización es un proceso primario inherente al condicionamiento. Las respuestas durante la adquisición son condicionadas no a un simple estímulo sino a
lo que él llama una "zona" de estímulos. Todos los estímulos en la zona son similares, esto es, se
relacionan a través de un continuum sensorial particular de diversas intensidades pero dentro de una
misma modalidad sensorial y todos se vinculan a la respuesta. El hecho de que más de un estímulo
sea capaz de elicitar una respuesta se hace evidente en una prueba de generalización donde se presente una variedad de estímulos a través de un continuum sensorial.
b) Teoría de Lashley y Wade: Para Lashley y Wade (1946), la generalización ocurre porque el sujeto
no consigue discriminar entre estímulos; la generalización resulta pues de una discriminación imperfecta. Las respuestas se daban meramente porque los sujetos no discriminaban adecuadamente
entre el estímulo original y los estímulos generalizados. Si el sujeto puede distinguir entre estímulos, no los confunde y consecuentemente no puede generalizar.
c) Teoría de la generalización mediada de Osgood: Según Osgood (1953), pueden hacerse equivalentes ciertos estímulos diferentes (es decir, evocar la misma respuesta) si suscitan la misma respuesta mediadora. Esta respuesta es un eslabón intermedio e interno de la cadena general de eventos que comienza con el estímulo y acaba con la respuesta. El aprendizaje perceptivo temprano
produce estas respuestas mediadoras implícitas. Es claro que los estímulos físicamente similares
suscitan la misma respuesta mediadora en mayor medida que los estímulos diferentes. La hipótesis
de la mediación viene representada en la Figura 3.
Ambos estímulos evocan la misma respuesta mediadora (rm), acompañada a su vez de un estímulo mediador interno (em). Durante la adquisición, em es el último eslabón antes de R, al igual que
ante el estímulo generalizado.
244
Universidad de Murcia. Grado Psicología. Asignatura: Aprendizaje, 6 cr. 2º curso, 1º. cuatr., curso 2010/11
1. Desarrollo de la
respuesta mediadora
EC1
EC2
rm
rm
em
em
2. Adquisición
EC1
rm
em
3. Prueba de generalización
EC2
rm
em
R1
Figura 3: Hipótesis de la generalización mediada de Osgood.
3. DISCRIMINACIÓN: ADQUISICIÓN DE LA DISCRIMINACIÓN DE ESTÍMULOS
3.1. Técnicas simples: Refuerzo diferencial discriminativo
Según Millenson y Leslie (1979, pp. 247-248), el paradigma básico de discriminación consta de
una respuesta (R) y dos condiciones de estímulo (ED y E ). La R es reforzada en presencia de uno de
los estímulos, el ED, y no es reforzada en presencia de la otra condición estimular, el E (con lo cual se
extinguirá dicha R). El resultado es que la probabilidad de responder ante E D se hace mayor que ante
E . Dichas condiciones podrían representarse del siguiente modo:
ED - R
E -R
Eref
/
no Eref
donde
= "es seguida por";
/
= "no hay consecuencias programadas". E se usa también para denotar condiciones no sólo de ausencia de refuerzo (extinción) sino de menor refuerzo que
para ED.
El refuerzo diferencial tiene en el contexto experimental dos variantes: La técnica de discriminación simultánea y la de discriminación sucesiva:
TÉCNICA DE DISCRIMINACIÓN SIMULTÁNEA
Se presentan los dos estímulos (ED y E ) al mismo tiempo y se refuerza la elección correcta. Es la
técnica usada por Lashley (1930) en su trampolín de saltos con ratas: La rata salta a una u otra de las
puertas, si la elección es correcta se abre la puerta y el animal llega a la comida, si no lo es, al saltar no
se abrirá la puerta. En la Figura 4 podemos apreciar dicho dispositivo.
DISCRIMINACIÓN SUCESIVA
Se presentan sucesiva y alternativamente ambos estímulos y se refuerza la respuesta sólo ante E D y
no ante E . Tanto en el caso de la discriminación simultánea como de la sucesiva, se consigue un aumento de la tasa de respuesta en presencia de ED y un cese progresivo y desaparición de la respuesta
ante E . Así es como el sujeto ha aprendido a dar respuesta selectiva ante un estímulo, o lo que es lo
mismo, ha aprendido a "discriminar" dicho estímulo, lo distingue de otros, da ante él una respuesta
distinta que ante otros estímulos.
Tema 5: Condicionamiento instrumental. Control de estímulo y condicionamiento con estimulación aversiva
245
Figura 4: Dibujo esquemático del dispositivo de discriminación de Lashley.
3.2. Técnicas complejas de adquisición de discriminación
En el estudio de la discriminación se han utilizado otros procedimientos más complejos, algunos de
los cuales tienen aplicaciones prácticas importantes. Citaremos sólo tres de ellos:
3.2.1. Atenuación o desvanecimiento del estímulo
El desvanecimiento (fading) implica que se deben hacer desaparecer progresivamente a lo largo del
entrenamiento determinadas características de un ED (forma, color, situación, tamaño) que el sujeto
discriminaba desde el principio con facilidad. Éstas van desapareciendo, "atenuándose" poco a poco, a
la vez que se produce un aumento de intensidad de otras características del mismo estímulo, las cuales
hacen de nuevo ED. Este procedimiento permite obtener aprendizajes discriminativos muy complicados. Se parte de características estimulares que un sujeto ya conoce y se llega a otras que antes no discriminaba. Así, por ejemplo, cuando el niño empieza a escribir traza las letras por encima de los punteados y dentro de los renglones marcados en su libreta de aprendizaje. Poco a poco, se irán eliminando los punteados de las letras y también los renglones que delimitan el tamaño y ordenamiento de la
escritura, hasta que la simple instrucción del profesor para escribir una letra o palabra sobre un folio en
blanco sea un ED suficiente.
Una variante compleja de desvanecimiento es la técnica de discriminación sin error.
Se trata de un fenómeno descubierto por Terrace (1964). Para lograr esa discriminación sin error, a
los sujetos se les presenta ED y E , generalmente el ED con la mayor fuerza posible y el E con una intensidad muy débil. Las respuestas al ED se refuerzan y se incrementan pero se logra que el sujeto no
dé ninguna respuesta no reforzada al otro estímulo, puesto que, al principio, E no tiene igual fuerza
que ED sino mucho menor, de modo que el E empieza por ser irrelevante en el medio ambiente del sujeto, y aunque después vaya aumentando en intensidad, ya será muy difícil responder ante E si a la
vez se ha reforzado la respuesta ante ED.
Es pues un procedimiento gradual mediante el cual se vigoriza la fuerza de la respuesta a un ED, a
la vez que no se permiten respuestas no reforzadas al E . Terrace lo consiguió en palomas "desvaneciendo" el E al principio y haciéndolo cada vez más fuerte a lo largo del entrenamiento. Hay pues una
presentación progresiva del E : al principio muy distinto del ED y conforme avanza el proceso de
aprendizaje se parece más al ED (por ejemplo, de presentarse durante décimas de segundo pasa a durar
lo mismo que ED). Siendo todas las respuestas correctas y reforzadas ante ED se consigue que no apa-
246
Universidad de Murcia. Grado Psicología. Asignatura: Aprendizaje, 6 cr. 2º curso, 1º. cuatr., curso 2010/11
rezca ninguna respuesta ante E (no hay frustración al no haber errores, al no darse respuestas que no
vayan seguidas de recompensa) y se puede llegar a un grado de discriminación muy elevado.
En el ámbito aplicado la utilización de desvanecimiento es fundamental cuando se aplican instigadores (véase apartado 5).
3.2.2. Comparación con la muestra
Es una técnica de discriminación que tiene dos variantes: igualación y diferenciación de la muestra.
- Igualación a la muestra: Consiste en utilizar, en primer lugar, el estímulo objetivo que se tiene que
discriminar (denominado estímulo de muestra) y después presentarlo junto a otros estímulos parecidos. La recompensa se dará cuando el sujeto elija precisamente el idéntico al de muestra.
- Diferenciación de la muestra: Se presenta un estímulo muestra y una serie de alternativas que son todas iguales a la muestra excepto una que es la que se refuerza cuando es elegida.
Son procedimientos que suele emplearse en la reeducación de "déficits perceptivos" y trastornos
asociados con la percepción. La Figura 5 nos muestra un ejemplo de aplicación de estas técnicas en
el aprendizaje de la lectura.
1º se presenta:
b
Igualación con
la muestra
Estímulo de
muestra
Si señala este E,
se da refuerzo
muestra
2º se presentan:
1º se presenta:
2º se presentan:
d p q b h
b
Estímulo de
muestra
Si señala este E,
se da refuerzo
muestra
Diferenciación
de la muestra
b d b b b
Figura 5: Ejemplos de aplicación de técnicas de igualación y diferenciación a la muestra
3.2.3. Combinación de ED y refuerzo secundario: el encadenamiento
Otro caso en el que interviene la discriminación es en el procedimiento de encadenamiento. Esta es
una técnica experimental y también aplicada (en modificación de conducta), utilizada en la adquisición
Tema 5: Condicionamiento instrumental. Control de estímulo y condicionamiento con estimulación aversiva
247
de conductas nuevas. Es un procedimiento basado en el concepto de refuerzo condicionado o secundario, ya explicado en el Tema 4.
El encadenamiento es un procedimiento que consiste en ordenar secuencias o cadenas continuas de
estímulos y respuestas mantenidos en unión por estímulos que tienen una doble función: como refuerzo secundario y como ED.
Una cadena de este tipo está compuesta de eslabones, cada uno de los cuales consta de una secuencia de ED - RESPUESTA - REFUERZO CONDICIONADO. Se exige también que el primer elemento de la cadena sea un ED, que el resto de estímulos discriminativos sean a su vez refuerzos condicionados y que
el último refuerzo de la cadena sea primario.
Un ejemplo sería el siguiente: Un chimpancé opera una máquina mediante la cual recibe una ficha
que cambia a continuación por alimento. La cadena sería la que encontramos en la Figura 6.
E1D
(máquina)
R1
(operar
máquina)
ED
Ref. cond. 1
(ficha)
R2
(cambiar
ficha por uva)
Eref
(uva)
Figura 6: Ejemplo de encadenamiento
Otro ejemplo sería la secuencia de respuestas para ir a un restaurante:
1) ED (llamada telefónica de un amigo, hora del día, hambre).
2) Varias respuestas secuenciadas (levantarnos, abrir la puerta, salir de casa, entrar al coche, conducir,
aparcarlo, entrar al restaurante, sentarnos, leer el menú, pedir la comida, comerla). El estímulo ambiental que sigue a cada respuesta da ocasión a la siguiente respuesta de la cadena.
3) La cadena total está mantenida por la comida que finalmente comemos.
Así pues en resumen, el encadenamiento sigue los siguientes pasos:
1) Presentación de un ED
2) Respuesta en presencia de ED
3) Aparición consiguiente de otro E que es refuerzo condicionado respecto al paso anterior y ED para...
4) ... una nueva respuesta
5) Estímulo nuevo que es refuerzo condicionado y ED ... etc.
...
n) El último estímulo que forma la cadena es un reforzador primario o innato.
Para un uso aplicado de este procedimiento véase el libro de Sulzer-Azaroff y Mayer (1977).
3.3. Por qué ocurre la discriminación (teorías explicativas)
Hay dos teorías clásicas fundamentales:
a) Teoría de la continuidad de Hull-Spence. Elaborada por Hull (1943) y Spence (1936), puede considerarse la más antigua y tradicional teoría en torno a la discriminación. Tiene tres principios básicos:
1º, el refuerzo conduce a un incremento de la fuerza excitatoria del ED;
2º, el refuerzo aumenta la fuerza inhibitoria del ED;
3º, ambas tendencias (excitatorias e inhibitorias) se generalizan a otros estímulos similares y los
gradientes se suman para producir la respuesta diferencial.
Esta teoría ha sido criticada recientemente dando paso a otra más actual: la teoría atencional.
248
Universidad de Murcia. Grado Psicología. Asignatura: Aprendizaje, 6 cr. 2º curso, 1º. cuatr., curso 2010/11
b) Teoría atencional. Es original de Sutherland y Mackintosh (1971). Según dicha teoría, el aprendizaje discriminativo implica dos procesos discretos: el refuerzo de la atención a una o más dimensiones relevantes del estímulo y la concesión de una respuesta particular al estímulo relevante.
El sujeto aprende dos cosas durante los experimentos de discriminación:
1º, aprende a atender a las dimensiones particulares del ambiente sobre la base de que las consecuencias de dicha atención predicen correctamente importantes eventos (posible refuerzo ulterior a la respuesta); y
2º, aprende a responder en función del refuerzo.
4. CONDICIONES PARA LA ADQUISICION DEL CONTROL DE ESTIMULOS
Varios autores (Tarpy y Mayer, 1978; Wittig, 1982) señalan diversas condiciones importantes para
la adquisición del control de estímulos. Dado que generalización y discriminación son extremos de un
continuo, lo normal es que la condición que favorece a una dificulte a la otra. Por eso, aunque los manuales separan las condiciones para un tipo u otro de control de estímulos, creemos preferible unirlas
agrupándolas en: condiciones durante la adquisición y condiciones de entrenamiento previo en discriminación.
4.1. Condiciones durante la adquisición
a) Grado de adquisición o número de ensayos de aprendizaje
Cuanto menor sea el grado de adquisición, es decir, el número de presentaciones del estímulo, más
fácil es la generalización. Si prosiguen los ensayos el gradiente se hace más puntiagudo y por tanto
hay mayor discriminación.
b) Intervalo entrenamiento-prueba
Cuanto mayor es el período de tiempo entre la adquisición de la respuesta ante un estímulo y la
prueba ante otros estímulos, mayor es la generalización, es decir, los estímulos generalizados se elicitan relativamente más siempre que se responda inmediatamente después de un descanso tras el entrenamiento. De alguna manera, la recencia del entrenamiento aumenta el aprendizaje discriminativo, favorece el recuerdo específico de los estímulos discriminativos.
c) Topografía de los estímulos
Cuanto mayor semejanza exista entre el estímulo original y los estímulos con los que queremos que
haya generalización mayor intensidad y frecuencia de la respuesta ante éstos, lo cual resulta bastante
lógico si tenemos en cuenta que la generalización consiste precisamente en esa extensión de la respuesta ante estímulos semejantes al ED original.
d) Dificultad del problema
El aprendizaje discriminativo ocurre rápidamente cuando se usan estímulos que se distinguen
fácilmente, pero es más lento cuando son muy parecidos. Así, un niño encontrará más fácil distinguir
entre "O" e "I" que entre "F" y "E" o entre “b” y “d” (véase Figura 7).
Tema 5: Condicionamiento instrumental. Control de estímulo y condicionamiento con estimulación aversiva
249
La habilidad para responder diferencialmente a dos estímulos está limitada por las capacidades perceptivas del sujeto para distinguir entre ambos. De este modo, si los estímulos son demasiado parecidos como para que los pueda distinguir un determinado organismo, puede llegarse a lo que desde Pavlov se viene llamando "neurosis experimental" (al exigir discriminaciones entre estímulos con propiedades cada vez más similares) con síntomas en perros debidos a la incapacidad de discriminación, tales
como angustia, confusión, etc. El experimento típico de la escuela de Pavlov -Shenger-Krestovnika
(1921; cit. por Gray, 1988; 1993, trad. cast., p. 152)- consistía en mostrarle al perro un círculo (EC) y
luego darle comida, obteniendo así una RC de salivación; se le muestra también una elipse pero no se
le da comida y no se obtiene RC; cuando el cociente de los ejes de la elipse se redujo a 9:8, el perro no
diferenciaba entre el círculo y la elipse; durante tres semanas su ejecución fue correcta en otros casos
pero luego cambió, cometiendo errores en discriminaciones más simples e incluso mostrando signos
de angustia (ladridos, agitación, etc.).
e) Información estimular
Nos referimos con ello a las propiedades informativas del estímulo, es decir, si el estímulo produce
información sobre la recompensa o la no recompensa. Cuanto mayor valor informativo tenga el estímulo mejor se producirá la discriminación.
f) Aprendizaje observacional
O sea, la oportunidad para el aprendiz de observar a otro sujeto (el modelo) cómo ejecuta la respuesta ante el estímulo. Si se da esta oportunidad, mejor se producirá el aprendizaje discriminativo.
4.2. Condiciones de entrenamiento previo en discriminación
a) Experiencia sensorial temprana
Diversos estudios (como señalan Tarpy y Mayer, 1978; p. 149) han demostrado que los estímulos
generalizados elicitan respuestas incluso en sujetos que tuvieron experiencia previa del estímulo muy
limitada, desde un año después de su nacimiento. Este hallazgo es importante pues sugiere que la exposición previa a los estímulos generalizados no es condición necesaria para la respuesta a aquellos
estímulos. No obstante, si la experiencia previa de dichos estímulos es muy reciente la generalización
es menor.
b) Dificultad de la generalización por entrenamiento previo en discriminación
El efecto del entrenamiento previo en discriminación sobre la generalización ha sido estudiado extensamente. Una razón para el interés en dicha área fue el hallazgo de que los gradientes de generalización pueden predecirse a partir de las capacidades discriminativas del sujeto; un mayor gradiente de
discriminación representa mayor habilidad para distinguir entre estímulos, y a la inversa, lo cual sugiere que el entrenamiento explícito en discriminación, previo a la prueba de generalización, debe agudizar el gradiente, esto es, produce menor generalización de respuesta.
250
Universidad de Murcia. Grado Psicología. Asignatura: Aprendizaje, 6 cr. 2º curso, 1º. cuatr., curso 2010/11
c) Transferencia del entrenamiento en discriminación
Se trata de situaciones en las cuales el aprendizaje de una tarea influye en la adquisición posterior
de alguna otra. Se ha demostrado que si se aprende una discriminación relativamente fácil antes de
aprender otra relacionada más difícil, la discriminación facilitará la adquisición de la segunda tarea.
d) Entrenamiento previo ED - E : El fenómeno de desviación del vértice
También denominado "cambio de pico" (peak shift), fue descubierto inicialmente por Hanson
(1959) y se refiere al hecho de que tras un entrenamiento en discriminación seguido por un entrenamiento inhibitorio con E , la fuerza de una respuesta puede desplazarse lejos de la dirección de un E
y más allá de un ED original, aun cuando el ED continúe manteniendo sus propiedades. En la Figura 8
podemos apreciar que las respuestas reforzadas ante el ED y de extinción al E generan un gradiente de
generalización del estímulo que no es simétrico, teniendo la mayor parte de la fuerza de respuesta desplazada a lo largo de la dimensión del estímulo en el sentido de ED y alejándose de E . O sea, al ir
hacia la izquierda de la dimensión de estímulo, en la Figura 8 se observa que se eleva la curva para la
fuerza neta de respuesta, alcanzando un pico no en el ED original sino en un punto situado a la izquierda de él. Dicho desplazamiento se obtiene después del adiestramiento de discriminación que incluye un reforzador diferencial a los estímulos ED y E . Implica:
1º entrenamiento con ED (ED- R- Ref),
2º entrenamiento con E (E - R- no Ref) y
3º vuelta a ED
mayor R ante ED+n
Citemos un ejemplo (Wittig, 1982, p. 125) sacado de la política: supongamos que un hombre apoya
a una candidata que es ligeramente más conservadora que el candidato que normalmente ha apoyado
en otras ocasiones. Al salir elegida dicha candidata, los proyectos de ley por los cuales trabaja y vota a
favor, son en extremo conservadores -hecho que sirve como una fuerte condición para el votante-. En
las siguientes elecciones, el hombre puede cambiar y no volver a su posición original sino ir mucho
más allá apoyando a un candidato a quien inicialmente hubiera juzgado muy liberal.
Otro ejemplo de tipo deportivo: Un habitual seguidor del Real Madrid traslada sus simpatías al
Atlético de Madrid. Tras el “fracaso” futbolístico de éste último vuelve a simpatizar más que nunca
con el equipo blanco.
Gradiente en la prueba posterior al establecimiento de las
propiedades del estímulo
Gradiente
original
ED
E
Dimensión del estímulo
Figura 8: Representación gráfica del fenómeno de desviación del vértice.
Debe notarse que el fenómeno de la desviación del vértice no se refiere a una intensificación en la
magnitud de la respuesta debido a la experiencia previa, lo cual nos remitiría al fenómeno de contraste
ya estudiado en el capítulo anterior. En este caso, lo que se produce es una traslación de la respuesta
Tema 5: Condicionamiento instrumental. Control de estímulo y condicionamiento con estimulación aversiva
251
en el espectro de los potenciales estímulos discriminativos, una radicalización de la respuesta original
del sujeto en una dirección debido a una experiencia frustrante (no reforzada) cuando coyunturalmente
el sujeto da respuesta ante otros estímulos situados en la dirección contraria del espectro.
e) Discriminación de relaciones: La transposición
La transposición es la capacidad que tienen los organismos para llevar a cabo discriminación de relaciones. El E de una prueba pasa a ser ED de la segunda. El experimento clásico consiste en presentar
dos círculos, el mayor hace de ED y el menor de E . Köhler (1925) utilizó pollos para que discriminaran entre dos superficies grises circulares (una más grande que la otra), de tal modo que se aprenda a
discriminar entre ellos (reforzando cuando se respondía ante el círculo mayor). A continuación, se presentaba el círculo menor junto con otro más pequeño, haciendo reforzar al sujeto ante el mayor de ambos (que en la primera prueba era el E ), como vemos en la Figura 9.
2ª Prueba
1ª Prueba
ED
E
ED
E
Figura 9: Ejemplo de transposición.
De este modo se aprende a responder a la relación (en este caso "ser menor que") entre estímulos,
prescindiendo de los valores absolutos de los mismos.
En situaciones de la vida real, el fenómeno de transposición se produce, por ejemplo, cuando el entrenador de un equipo de baloncesto coloca como pivot titular al jugador "más alto" de la plantilla. El
criterio de selección es por tanto comparativo y el jugador más alto en un momento dado puede no serlo en la temporada siguiente.
5. PROCEDIMIENTOS APLICADOS PARA EL ESTABLECIMIENTO DEL CONTROL DE ESTIMULO
5.1. Aplicación de instigadores y desvanecimiento
5.1.1. Dificultades con el refuerzo diferencial
Sabemos pues que existe control de estímulo cuando en presencia de un estímulo antecedente particular hay mayor probabilidad de que ocurra una respuesta particular. Está claro que lo que se aprende
en este caso no es una respuesta nueva sino a producirla en las condiciones apropiadas, en cuyo caso
estas condiciones (estos estímulos antecedentes) provocan esa respuesta. Es decir, el estímulo antecedente es significativo para el sujeto y, a la manera del EC, activa en el aprendiz la expectativa de que
determinada respuesta será reforzada en su presencia. No son pues los estímulos los que “controlan” al
sujeto (a los estímulos no se le pueden atribuir funciones humanas) sino el sujeto quien “controla”
pues la situación en función del significado atribuido al estímulo antecedente.
El control de estímulo generalmente se adquiere con procedimientos de refuerzo diferencial. Para
que éste sea eficaz en el control de estímulos, deben darse una serie de condiciones óptimas:
252
Universidad de Murcia. Grado Psicología. Asignatura: Aprendizaje, 6 cr. 2º curso, 1º. cuatr., curso 2010/11
- debe ocurrir la respuesta deseada,
- los estímulos esenciales deben controlar alguna conducta de atención del sujeto,
- los dos sucesos (estímulo y atención focalizada) deben ocurrir simultáneamente para que se suministre el refuerzo.
No obstante, hay veces en que no resulta efectivo. No es fácil que el estímulo “controle” (adquiera
el significado pertinente para provocar...) la respuesta y ello puede ser debido, según Sulzer-Azaroff y
Mayer (1977), a varios factores:
- porque la respuesta no se hallaba en el repertorio de respuestas del sujeto (por ejemplo, en el niño
que no sabe leer, al ver la letra p (ED) no sabrá pronunciarla),
- porque la respuesta esté bajo el control de otros estímulos o el estímulo controle otras respuestas (en
niños pequeños se dan muchos ejemplos: responde papá al ver personas con gafas, al ver un periódico a mano le induce la respuesta de despedazarlo, al ver a su madre coger el bolso de paseo le motiva
a levantarse e irse a la puerta para salir, etc.),
- porque el estímulo sea difícil de percibir por problemas sensoriales o motores,
- porque la respuesta haya tenido en el pasado un control de estímulo diferente (por ejemplo, con un
nuevo procesador de textos, centrar un título se hace combinando las teclas Ctrl y T, pero con el anterior procesador se hacía con Alt + C).
Por todo ello, es preciso utilizar métodos adicionales, sobre todo instigadores y desvanecimiento
posterior.
5.1.2. Los instigadores como facilitadores de la discriminación
Cuando el refuerzo diferencial es insuficiente para conseguir el control de estímulo se utilizan instigadores o incitadores. Los instigadores son estímulos adicionales que se presentan conjuntamente
con los estímulos que queremos que sean discriminativos. Se trata de estímulos inicialmente más significativos (ya poseen un significado, una funcionalidad conductual) y que es útil usarlos temporalmente para facilitar la emisión de respuesta cuando el control de estímulo no es completo.
Las funciones del instigador en relación con el estímulo que queremos que se convierta en discriminativo, se entienden bien al comparar esta situación con lo que ocurría en el condicionamiento
clásico: El instigador tendría una función similar al EI y el EC es el estímulo que queremos que adquiera fuerza señalizadora (que sea ED). Por eso, el procedimiento consiste en emparejar el estímulo
nuevo con el instigador (igual que EC-EI). Obviamente, un instigador no necesariamente elicita respuestas reflejas; basta con que sea un EC excitatorio previamente condicionado a un EI o un estímulo
discriminativo ya consolidado (por anterior entrenamiento ED-R-Eref).
Se distinguen varios tipos de instigadores:
a) Instigadores verbales. Se trata de las típicas instrucciones verbales, o sea, decirle al sujeto lo que
debe hacer. Por ejemplo, el maestro que quiere enseñar a sus alumnos a escribir la letra "a" les dice
„niños, escribid la letra “a”‟
b) Demostración. Es el conocido aprendizaje observacional utilizando modelos (modelado): Alguien
realiza ante el sujeto la conducta que éste debe aprender. Se trata por tanto de un procedimiento de
imitación. En el ejemplo anterior, el maestro escribe la letra “a”. Si combinase instrucciones verbales y demostración, el maestro diría „escribir la letra „a‟, tal y como lo hago yo”. Cuando fallan las
instrucciones verbales se utiliza este método.
Tema 5: Condicionamiento instrumental. Control de estímulo y condicionamiento con estimulación aversiva
253
c) Guía física. Consiste en guiar el movimiento correcto de la respuesta y se utiliza cuando fallan los
anteriores. En el ejemplo citado, el maestro cogería la mano del niño y se la movería para escribir
la letra "a".
Estos tres instigadores se pueden ordenar en una escala de mayor a menor intrusividad, es decir, en
cuanto al menor o mayor grado de importancia del instigador o probabilidad de que sea seguido por el
aprendiz. El más intrusivo es la guía física, le sigue la demostración y por último las instrucciones verbales.
d) Otros tipos de instigadores. Otros instigadores muy usados en la práctica son los perceptivos, por
ejemplo, para lectura o escritura, magnificación de los rasgos críticos de estímulo, el punteado de
las letras en los cuadernos de caligrafía, etc.
En la enseñanza o en procedimientos de adiestramiento, se suele comenzar por los instigadores menos intrusivos. Por ejemplo, en una tabla de gimnasia, el monitor da las explicaciones pertinentes sobre los movimientos que han de hacer los alumnos. Si estos instigadores no son válidos para que se logre el control de estímulos, entonces habrá que recurrir al siguiente: la demostración (el monitor realiza el movimiento o el ejercicio tal y como lo deben hacer sus alumnos). Si tampoco funciona entonces
habrá que recurrir a la guía física (el monitor coge el brazo o la pierna del sujeto y se la mueve en la
dirección correcta).
Normalmente se suelen combinar los instigadores (instrucción verbal con demostración, etc.). En
cualquier caso, es importante que los instigadores se vayan retirando mediante desvanecimiento, tal y
como se explica en el siguiente apartado.
5.1.3. Desvanecimiento de los instigadores
Si no se retirasen los instigadores nunca se establecería un adecuado control de estímulo, es decir,
difícilmente el sujeto sabría emitir la respuesta en presencia sólo del ED y siempre requerirá el instigador. Por ejemplo, si siempre que el niño escriba le vamos a guiar la mano ¿cómo aprenderá a realizar
los movimientos precisos que corresponden a la escritura?. De igual manera, no sería correcto que el
sujeto sólo hiciera las cosas cuando se le dan las instrucciones verbales para ello (escribir cuando se le
diga que escriba, etc.); si así fuera, tendríamos sujetos pasivos, con muy escasa autonomía e iniciativa
propia.
Así pues, hay que desvanecer progresivamente los instigadores de modo que si se utiliza un instigador muy intrusivo, éste debe ir sustituyéndose por otro menos intrusivo y así sucesivamente hasta
que desaparezcan totalmente los instigadores. Además, hay que usarlos el mínimo tiempo posible.
5.1.4. Métodos aplicados a la reeducación de las dificultades de aprendizaje
La aportación del enfoque de condicionamiento para la adquisición del control de estímulos puede
ser útil para el enseñante o reeducador. Un sector al que se aplican con gran éxito es al de los niños
discapacitados en algún área concreta del aprendizaje: retrasos o deficiencia intelectual, lenguaje, lecto-escritura y aritmética (Hallahan y Kauffman, 1976; Worell y Nelson, 1982, Vallés, 1986). Los
métodos más usuales son los basados en el control de estímulo mediante el uso de instigadores y desvanecimiento, aunque por supuesto también se utilizan procedimientos de refuerzo. La estrategia principal es la de las intervenciones multimodales, donde los procedimientos operantes sean una parte o
componente más de los mismos.
254
Universidad de Murcia. Grado Psicología. Asignatura: Aprendizaje, 6 cr. 2º curso, 1º. cuatr., curso 2010/11
5.2. Cambio de un control de estímulo por otro: El cambio físico de ambiente
En ocasiones un aprendizaje instrumental señalizado puede ser problemático, es decir, la exposición a determinados estímulos discriminativos puede provocar respuestas no deseadas. La televisión
provoca la respuesta de entretenerse con ella e impedir que hagamos otras cosas más necesarias (por
ejemplo, estudiar un examen); el contexto habitual en el que comemos mucho puede ser perjudicial si
queremos adelgazar puesto que esos estímulos "controlan" esa conducta.
Una técnica aplicada en modificación de conducta para lograr cambiar un control de estímulo no
deseado es el cambio estimular: si queremos cambiar algún tipo de conducta o hacer que una conducta deseable (pero difícil de conseguir) sea más frecuente, conviene rodearse de otro contexto estimular
y disponer otros estímulos discriminativos para la nueva conducta objetivo. Así, para la deseable conducta de estudiar, Domjan y Burkhard (1986; p. 319 trad. cast.) proponen los siguientes nuevos estímulos discriminativos:
"1. Seleccionar un lugar adecuado para estudiar, con iluminación adecuada y libre de distracciones.
2. Estudiar en ese lugar y sólo en ese lugar (no estudiar en la cama pues esto lleva probablemente a dormir antes que a
estudiar).
3. Permanecer en el área de estudio sólo durante el tiempo que estamos estudiando. Si nos empezamos a distraer, nos tenemos que disponer a abandonar el área de estudio.
4. Antes de abandonar de hecho el área, completar una pequeña unidad de trabajo. Terminar de leer la página o completar un problema".
Se trata pues de convertir el área de estudio en el nuevo estímulo discriminativo de la conducta de
estudiar.
En esta misma línea, puede interesar que la respuesta no esté controlada por muchos estímulos sino
por uno en particular. El obeso que come mientras ve la televisión o escucha la radio, o habla con
otros, etc. debería comer exclusivamente en la mesa del comedor, a ciertas horas, sin televisión ni radio, etc.
En definitiva, estos planteamientos permitirían al sujeto un mayor autocontrol y no tanta dependencia de los estímulos y de personas o servicios que proporcionen instigadores.
6. CONDICIONAMIENTO INSTRUMENTAL AVERSIVO
6.1. Introducción: Tipos de condicionamiento en función de la estimulación
aversiva
6.1.1. Tipos de aversividad
El condicionamiento, sea clásico o instrumental, se realiza muchas veces con estímulos aversivos.
Un estímulo aversivo es lo que en lenguaje cotidiano llamamos estímulo "molesto", "incómodo", "doloroso", "desagradable", "nocivo", etc., es decir, su aplicación al sujeto tiene para él consecuencias negativas. La aversividad es pues cualquier evento que produzca una percepción de malestar o desagrado.
Proponemos cinco criterios para clasificar o caracterizar los eventos aversivos:
1) Criterio estimulación aversiva primaria – secundaria: Una cosa es la estimulación que produce dolor o malestar físicos directos y otra las señales o EC o ED previamente asociados a estimulación
aversiva primaria (enchufes, fuego en la cocina, dedos puestos en el quicio de la puerta, nube oscura que amenaza lluvia, etc.).
Tema 5: Condicionamiento instrumental. Control de estímulo y condicionamiento con estimulación aversiva
255
2) Criterio estimulación aversiva directa – indirecta: Una cosa es la aplicación directa de estimulación
aversiva primaria que produzca dolor o malestar físico (descarga eléctrica en el animal, agresión,
tortura, malos tratos físicos, hambre, sed, enfermedad, problema irresoluble, etc.) y otra es la ausencia del refuerzo esperado.
3) Criterio contingencia o dependencia estimulación aversiva – respuesta: Se trata de la contigüidad o
proximidad espacio temporal de una con respecto a la otra, en contraposición a una relación contingente o no necesaria, es decir, sin aparente relación entre un evento y otro. En este caso de la no
dependencia, tenemos la situación de indefensión aprendida
4) Criterio orden temporal de ocurrencia entre estimulación aversiva – respuesta. Esto ocurre sobre
todo cuando dependencia entre estimulación aversiva y respuesta, y tenemos dos claras opciones:
- Eav – R (primero estimulación aversiva y después la respuesta): Si primero se aplica estimulación aversiva y su cese es contingente con (dependiente de) la aparición de una respuesta, entonces aumentará la probabilidad de ocurrencia de dicha respuesta. Según ésto, y siguiendo la tradición skinneriana, esta situación conlleva refuerzo negativo (refuerza el cese -contingente a la
respuesta- de la estimulación aversiva, lo cual fortalece y mantiene la respuesta) y es típico paradigma de escape. Estas condiciones de refuerzo negativo las podríamos simbolizar del siguiente
modo:
Eav - R
No Eav (Ref. neg.)
- R – Eav (primero respuesta y después estimulación aversiva): Si primeramente aparece la respuesta y tras ella se aplica contingentemente estimulación aversiva, entonces disminuirá la probabilidad de ocurrencia o incluso se eliminará la respuesta. Esta acepción sigue la tradición de
Thorndike y más tarde se denominó, para distinguirlo del anterior, estimulación punitiva y se inserta en el paradigma de castigo. Se simbolizaría:
R
Eav
5) Criterio efectos en la respuesta: En psicología del aprendizaje, un estímulo aversivo se define en
función del efecto que produce en la conducta. En general, hay tres efectos en la conducta relacionada con dicha estimulación:
- Incremento de la tasa de respuesta por refuerzo negativo. Suele ocurrir en situaciones Eav - R y
por tanto en casos de escape y evitación
- Disminución de la tasa de respuesta por estimulación punitiva contingente. Se trata de situaciones
R - Eav y es el caso del castigo.
- Aparición de alteraciones conductuales, emocionales o conductuales, ligadas a la aplicación de estimulación punitiva contingente y sobre todo no contingente. El efecto de esta modalidad se conoce desde Seligman (a mediados de los 60) como indefensión o impotencia aprendida (difícil
traducción del inglés learned helplessness), en la cual el sujeto recibe estimulación aversiva inescapable. Sería una situación del tipo:
R - Eav no conting.
6.1.2. Tipos de condicionamiento con estimulación aversiva
Como ya se dijo en el Tema 4, los paradigmas o tareas experimentales en los que se ha usado estimulación aversiva, al menos en el condicionamiento instrumental, son esencialmente cuatro: escape,
evitación, castigo e indefensión aprendida. En los dos primeros se ha utilizado estimulación aversiva
en su acepción de refuerzo negativo; en el tercero se trata más bien de estimulación punitiva; en el
256
Universidad de Murcia. Grado Psicología. Asignatura: Aprendizaje, 6 cr. 2º curso, 1º. cuatr., curso 2010/11
cuarto la estimulación punitiva no es contingente a la respuesta. Los tres primeros pueden incluir diversas variantes, sobre todo si se utilizan estímulos discriminativos. En cuanto a la indefensión aprendida, algunos manuales de aprendizaje lo citaban como una variedad del castigo (Pelechano, 1980),
aunque desde hace tiempo (Wittig, 1982; Hulse et al., 1982) lo consideran como otro paradigma más
de aprendizaje con estimulación aversiva. Algunos han tratado también la aversividad resultante de
suprimir o disminuir un reforzador. En estos casos se habla del castigo por supresión, extinción simple y entrenamiento de omisión. Aunque estos dos últimos tipos no los trataremos aquí, los esquemas
de las Tablas 1 (adaptada de la expuesta en el Tema 4) y 2 nos resumen todo esto.
Tabla 1: Tipos de condicionamiento con estimulación aversiva en función de los tipos de consecuencias
sobre la conducta y del tipo de relación R-C.
SI
Relación de
contingencia R - C
NO
CONSECUENCIAS / resultados
POSITIVAS
N E G A T I V A S (aversivas)
adquIsIcIón
extIncIón
Por cese de
Por aplicación
Por omisión del
estimulación aversiva
Reforzador
(ref. negativo)
- Escape
- Castigo por
- Castigo por
- Evitación
aplicación
supresión
(cast. positivo)
(cast. negativo)
- Indefensión
aprendida
Tabla 2: Presencia de los criterios de clasificación de los eventos aversivos en los tipos de condicionamiento con estimulación aversiva (Eav).
Escape
Evitación
Castigo por
Castigo por
Extinción
Indefensión
Criterios
aplicación
supresión
aprendida
Eav. Primaria
Si
Si
Si
Eav. Secundaria
Si
Si
Eav. directa
Si
Si
Si
Si
Eav. indirecta
Si
Si
Eav. contingente
Si
Si
Si
Si
Si
Eav. no contingente
Si
Orden temp. Eav.-R
Si
Si
Orden temp. R-Eav.
Si
Si
Incremento de R
Si
Si
Disminución de R
Si
Si
Si
Si
Alteraciones de R
Si
Si
6.2. Condicionamiento de escape
6.2.1. Definición
En el procedimiento de escape, ante la aparición de estimulación aversiva, el organismo emite una
respuesta que logra el cese de dicha estimulación. O sea, la respuesta del organismo hace que cese el
estímulo aversivo. Por tanto, dicho cese es contingente o dependiente de la realización de la respuesta
y con ello, tras repetidas presentaciones de estimulación aversiva, se logra usualmente un aumento de
frecuencia de la respuesta. El cese del estímulo aversivo (gracias a la respuesta) es el evento crucial
que se convierte en un reforzador negativo. La representación simbólica del procedimiento de escape
es la siguiente:
Eav - R
No Eav
Más en detalle, supondría una secuencia con dos fases seguidas:
1) Una R1 provoca la Eav y la consecuencia 1 de daño o dolor
2) Una R2 de escape provoca una consecuencia 2 de cese de Eav y alivio
Tema 5: Condicionamiento instrumental. Control de estímulo y condicionamiento con estimulación aversiva
257
En el futuro, el sujeto aprende a no hacer R1. Es un tipo de aprendizaje que se logra con rapidez y
es muy adaptativo. Todos escapamos de circunstancias aversivas y procuramos que esa experiencia
desagradable no nos vuelva a ocurrir: un niño aprende a no tocar una estufa encendida si alguna vez se
quemó con ella, o sea R1 (tocar estufa encendida)  Eav (calor fuerte)  Consecuencia 1 (de daño o
dolor)  R2 escape (retirar mano)  Consecuencia 2 de cese Eav (alivio). Más ejemplos: una persona que se encuentra en un ambiente donde hay excesivos ruidos presenta comportamiento de escape
simplemente alejándose del lugar donde se emite el ruido; si empieza a llover y te mojas rápidamente
abres el paraguas (y si no lo tienes te resguardas en un portal), con lo cual cesa la estimulación aversiva, la respuesta tiene una consecuencia positiva y se refuerza para el futuro.
Los procedimientos y técnicas experimentales más utilizados en la investigación de la conducta de
escape aparecen resumidos en el Cuadro 1.
6.2.2. Condiciones o factores en la adquisición de la conducta de escape
Citaremos sólo dos de los más importantes:
1) Intensidad del estímulo aversivo: Cuanto más fuerte sea la estimulación aversiva mejor se aprende
la conducta de escape. Esto se relaciona directamente con la magnitud del reforzador: como aquí es
un refuerzo negativo, lo importante es la disminución relativa de intensidad del estímulo aversivo
tras la respuesta.
2) Retraso en la eliminación del estímulo aversivo: Cuando se elimina el estímulo aversivo poco después de que el sujeto emita la respuesta, esta demora en la aparición del refuerzo negativo produce
una disminución en el rendimiento de los sujetos en la conducta de escape.
Cuadro 1: Procedimientos experimentales de adquisición de la conducta de escape.
En animales
Aparatos
Un primer procedimiento con animales fue el utilizado por Muenzinger y Fletcher en 1936. Se trata de un laberinto en
forma de T con el suelo electrificable. Se coloca al animal (normalmente ratas) en la base de la T y se le dan shocks hasta
que gire por el brazo deseado (izquierdo o derecho). En cada ensayo se mide o bien el tiempo que tarda o el número de
elecciones incorrectas de brazo. Después de 100 ensayos se consigue un óptimo entrenamiento de escape con este procedimiento.
Posteriores estudios llevaron a otros procedimientos usando aparatos en los que pueden presentarse series largas de
ensayos (presentaciones de Eav) en intervalos apropiados sin que se tenga que sustituir al sujeto. Dos han sido los más
usuales:
- La caja de Skinner con suelo electrificado, de forma que la presión de la barra (R) haga que cesen los shocks eléctricos.
- El aparato más usado para el estudio del condicionamiento de escape es la caja de saltos o lanzadera (shuttle box), que
ya se encuentra en los experimentos clásicos de Mowrer (1938, 1939). Dicha caja (como se puede apreciar en la Figura
10a, o en una versión actual en la Figura 10b) es una cámara con dos compartimentos donde la respuesta operante que
se mide es el movimiento desde un compartimiento a otro (usualmente el movimiento en cualquiera de las dos direcciones cuenta como una respuesta). Una variante más actual es una sola cámara con la rejilla basculante: cuando el animal
está en un lado, la rejilla toca el suelo y cierra el circuito eléctrico para administrar la descarga, que cesará cuando salte
al otro lado. Este aparato también se utiliza en el aprendizaje de evitación.
Estímulos
El estímulo aversivo es usualmente shock eléctrico aplicado a través de la parrilla de alambre del suelo. La conducta de
escape se adquiere rápidamente en dicho aparato, posiblemente porque la respuesta operante requerida (saltar) está relacionada directamente con la conducta incondicionada elicitada por el shock.
Tipos de medida
La medida del escape suele ser, según Fernández Castro (1989), o bien latencia (tiempo desde el inicio del estímulo
aversivo al inicio de la respuesta) o magnitud de respuesta (velocidad de carrera o presión de palanca en caja de Skinner).
En humanos
258
Universidad de Murcia. Grado Psicología. Asignatura: Aprendizaje, 6 cr. 2º curso, 1º. cuatr., curso 2010/11
Con humanos la respuesta elegida suele ser de tipo manipulativo (a menudo enmascarada la tarea con problemas de
discriminación) y como estimulación aversiva, además de la descarga eléctrica de baja intensidad, se utilizan ruidos fuertes
y molestos o incluso alguna técnica similar a las del castigo por supresión de reforzador (véase el apartado correspondiente de este capítulo).
Figura 10: Lanzadera o caja de saltos, en versión antigua (a) o actual (b)
6.3. Aprendizaje de evitación
6.3.1. Definición, fases en la adquisición, tipos y procedimientos
La evitación es uno de los fenómenos más estudiados en el condicionamiento con estimulación
aversiva. Una conducta se llama de evitación cuando impide la confrontación del sujeto con un acontecimiento que tiene características aversivas. Es decir, el efectuar una respuesta pospone o elimina la
estimulación aversiva. De otro modo podemos decir que ocurrirá un Eav a no ser que aparezca la respuesta. Se producirá el aprendizaje de evitación si dicha contingencia lleva a un aumento de la frecuencia de respuesta, con lo cual el cese del estímulo tiene propiedades de reforzador negativo para la
respuesta.
Los primeros estudios sobre evitación provienen, según Domjan y Burkhard (1986), de Bechterev
(1913) dentro del condicionamiento pavloviano. Su experimento se realizó con humanos y consistía en
pedirles que introdujeran un dedo (R instrumental) en un recipiente de metal. Al hacerlo se hacía sonar
Tema 5: Condicionamiento instrumental. Control de estímulo y condicionamiento con estimulación aversiva
259
un zumbido de aviso (EC) y al estar el agua electrificada sufrían una descarga eléctrica (EI). Lógicamente la retirada del dedo (R de evitación) era inmediata y en sucesivos ensayos el inicio del EC permitía no sufrir EI. Parece condicionamiento clásico pero no lo es puesto que en aquél el EI ocurre independientemente de la respuesta mientras que aquí la respuesta instrumental impide su aparición.
La diferencia entre escape y evitación estaría en que en ésta última la respuesta pospone o elimina
una estimulación aversiva que todavía no ha ocurrido. En la conducta de escape siempre se aplica estimulación aversiva al sujeto mientras que en la evitación basta con la presentación de un E D (EC en
términos de condicionamiento clásico) que de alguna manera evoque (por asociación previa EC-EI
aversivo) la estimulación aversiva. Además, en la situación de escape, la supresión de estimulación
aversiva ocurre tan pronto como se emite la respuesta, mientras que en la evitación se previene la aplicación de estimulación aversiva mediante la respuesta.
Así, por ejemplo:
- un bañista se aplicará bronceador (R) para evitar quemaduras en la piel (Eav) por el sol al llegar a la
playa (ED);
- los conductores obedecen las señales de tráfico para evitar accidentes o multas;
- ED (día nuboso): R (llevar sombrilla)
No Eav (evitación de la lluvia). O sea, no es necesario que nos mojemos por la lluvia al salir de casa (Eav) para que cojamos la sombrilla (R); basta con que veamos el
día muy nuboso (ED).
Así pues, en la evitación tenemos señales del entorno que por aprendizaje previo son aversivas; se
podría decir, por tanto, que la evitación es una conducta motivada por el miedo (Gray, 1988; trad. cast.
1993, p. 132). El sujeto aprende a darle un significado atemorizante a determinadas señales del entorno. Podemos decir que en el paradigma de evitación, el sujeto "escapa" o reacciona no ante la presencia de la estimulación aversiva en sí, sino ante los estímulos discriminativos (EC) que señalizan la posterior presencia de estimulación aversiva (EI), y por tanto el miedo (RC) provocado por esos estímulos
señalizadores es la emoción que motiva la conducta de evitación. Al emitir esa conducta, el miedo se
reducirá, lo cual supone un refuerzo negativo para esa conducta de evitación. Hay que notar que el
miedo tiene un doble valor aquí: es una respuesta del sujeto condicionada a una determinada situación
estimular, pero también es en sí un estímulo aversivo del que el sujeto hace por escapar (con lo cual
evita el estímulo posterior que el miedo anticipa).
Aunque se explica más adelante en la teoría bifactorial de Mowrer, parece evidente que el establecimiento de la conducta de evitación necesita dos fases:
- Una fase previa, en la que un determinado estímulo adquiere un significado aversivo de algo que antes no tenía. Puede ser un escape señalizado, esto es, tener la experiencia del par ED- Eav, o, si se
quiere en la terminología del condicionamiento clásico, la experiencia EC-EIav; o puede ser una respuesta castigada (R- Eav). Si es el primer caso, tendremos la evitación activa (hago algo tras la señal
para evitar Eav) y si es el segundo, la evitación pasiva (no vuelvo a hacer R para evitar Eav), como
analizaremos enseguida. En cualquier caso, es característico de la evitación que se adquiere con muy
pocos ensayos de este tipo, incluso basta con un aprendizaje vicario u observacional.
- La fase propiamente de evitación, en la que el evento (estímulo o respuesta) con significado aversivo, por sí solo y sin necesidad de que aparezca la estimulación aversiva, produce la respuesta de evitación.
Se han descrito (Gray, 1988; Klein, 1991) dos tipos de aprendizaje de evitación: la evitación activa
y la pasiva.
a) Evitación activa
260
Universidad de Murcia. Grado Psicología. Asignatura: Aprendizaje, 6 cr. 2º curso, 1º. cuatr., curso 2010/11
Se trata de realizar una conducta que, ante la correspondiente señal atemorizante, impida o prevenga la estimulación aversiva. Abrir el paraguas ante señales de lluvia, el niño que hace los deberes para
no suspender el examen, pagar el alquiler para evitar que nos echen del piso, caminar por la acera para
que no me atropellen los coches, etc. El sujeto aprende pues un comportamiento nuevo: realizar una
determinada acción para no tener una experiencia desagradable.
Una descripción muy interesante es la de Gray (1988; trad. cast 1993, p. 134) poniendo ejemplos
de animales: “El animal quiere que se le deje en paz (...) pero alguien (el domador de circo, el psicólogo experimental) desea que adquiera alguna nueva forma de conducta. El domador somete al animal al
estímulo temido y retira ese estímulo sólo si el animal realiza la conducta deseada”. En otras palabras,
es castigado por hacer cualquier otra cosa que no sea la respuesta deseada. Es como si le advirtiera al
animal: “Haz esto, o si no...”. En términos coloquiales, la evitación activa sería saber lo que hay que
hacer para no sufrir algo malo.
b) Evitación pasiva
Aquí la conducta impide exponerse a un acontecimiento aversivo. Un ejemplo de Klein (1991; trad.
cast. 1994, p. 211) es muy ilustrativo: “Imagínate que recibes una carta del dentista recordándote que
debes realizar un chequeo semestral (...); no respondiendo a la carta, evitas al dentista”. Es decir, se
abandona un tipo determinado de actividad porque tenemos experiencia de que va seguida de una consecuencia desagradable.
Siguiendo con ejemplos de animales, Gray (op. cit.) dice que, en la evitación pasiva, “el animal
quiere hacer algo y esta acción le conduce a ponerse en contacto con el estímulo atemorizante. La única forma de evitar el estímulo temido es abandonar la conducta deseada”. Por ejemplo, un animal
hambriento busca comida, pero si toca la comida puede que se le aplique una descarga eléctrica. Hay
pues dos fases:
- Fase previa: Tras ED se produce la respuesta y entonces recibe estimulación aversiva (es pues una
experiencia previa de castigo)
- Fase actual: Al aparecer ED entonces el sujeto no produce la respuesta
Como dice Gray, es como si se advirtiera al animal: “No hagas eso, o si no...”. También en términos coloquiales, la evitación pasiva consistiría en saber lo que hay que dejar de hacer para no sufrir
algo malo (aunque me guste).
La evitación pasiva es pues la consecuencia posterior de una conducta previamente castigada. Una
respuesta que es castigada, en el futuro será evitada aprovechando las señales externas (ED ) o internas
(recuerdo de la experiencia) que conducen a ella. Sería una secuencia que esquemáticamente se podría
expresar:
(ED )
Expectativa de R-Eav
No realización de R
El mismo autor sugiere que la evitación pasiva en realidad es un conflicto de aproximación - evitación. En efecto, el sujeto está solicitado, mediante señales procedentes del medio, por dos formas de
conducta incompatibles entre sí:
- aproximarse a un objeto o estímulo deseado, interesante o apetecible
- mantenerse alejado de él (pues hay experiencia previa de que produce algo aversivo)
Volviendo al ejemplo del dentista: Quiero ir al dentista para solucionar los problemas que tengo
con mi dentadura (aproximación) pero no voy a ir pues me da miedo, hace daño, etc. (evitación).
Dos tipos de procedimientos experimentales muy utilizados, al menos en la evitación activa han
sido: la evitación discriminativa de ensayos discretos y la técnica de evitación de Sidman o de operante libre. El Cuadro 2 describe detalladamente estas técnicas
Tema 5: Condicionamiento instrumental. Control de estímulo y condicionamiento con estimulación aversiva
261
6.3.2. Condiciones para la adquisición de la respuesta de evitación
1) Intensidad de estimulación aversiva: Generalmente a mayor intensidad corresponde un mayor rendimiento en la respuesta de evitación.
2) Intensidad y duración de ED: Cuanto más intensa sea la señal que precede a la estimulación aversiva
mayor rendimiento se dará en la respuesta de evitación.
3) Intervalo ED-Eav (en términos pavlovianos, EC-EI, intervalo entre estímulos, IEES): Períodos de
tiempo más largos, por lo general producen mejores niveles de ejecución, y si además se varía el intervalo ED-Eav alrededor de algún valor promedio (en vez de mantenerlo fijo a lo largo de los ensayos), entonces produce aún mejor rendimiento (tal vez porque las variaciones en la ejecución producen mayor atención por parte del sujeto).
4) Intervalo entre ensayos (IEEN): La ejecución varía según una curva en forma de U invertida con
mejores respuestas a medida que se incrementa el intervalo hasta cierto punto, disminuyendo después al incrementarse más aún el valor del IEEN.
Cuadro 2: Procedimientos experimentales para la adquisición de la conducta de evitación
1) Evitación discriminativa de ensayos discretos
En este tipo hay un ED por el cual la ejecución de la respuesta pospone o evita la estimulación aversiva. En el laboratorio
se usó por primera vez en un experimento de Brogden, Lipman y Culler en 1938, en el cual una señal discriminativa (ED)
precede a cada shock. Después, la respuesta durante el aviso ED impide la aplicación de la descarga. Las respuestas durante el intervalo entre ensayos no tienen efecto. Cada shock será evitado si una respuesta ocurre durante cada E D (el
cual desaparece también al emitirse la respuesta). La Figura 11 nos muestra un diagrama de dicho procedimiento.
R
ED
ED
ED
ED
ED
ED
Shock
Figura 11: Diagrama del procedimiento de evitación discriminativa.
En general, con la evitación discriminativa se ha seguido el procedimiento experimental de ensayos discretos o separados: un ensayo comienza siempre con la aparición de ED y termina con la emisión de la respuesta. Normalmente con
animales (perros, ratas) se usa la caja de saltos. El experimentador puede exigir al animal que salte alternativamente de un
compartimiento a otro para evitar el shock (procedimiento llamado "evitación de doble dirección" o de vaivén) o bien puede
exigir simplemente un salto en una dirección y, una vez ejecutado el salto, sacar al animal del segundo compartimiento para volver a colocarlo en el primero al comienzo del ensayo siguiente ("evitación en una dirección").
2) Evitación tipo Sidman o de "operante libre".
Este tipo de evitación la inició experimentalmente Sidman en 1953 con el procedimiento que lleva su nombre. En este
caso, la estimulación aversiva se aplica a intervalos regulares (según un programa IF) a no ser que ocurra la respuesta,
con lo cual se pospone dicha estimulación aversiva durante cierto intervalo de tiempo (también fijo). Si la siguiente respuesta ocurre antes de que finalice dicho intervalo R-Eav, se vuelve a posponer el Eav, y así sucesivamente es como evitará la estimulación aversiva. En este procedimiento, la señal discriminativa es el intervalo fijo, la pauta regular de aparición
de la estimulación aversiva.
262
Universidad de Murcia. Grado Psicología. Asignatura: Aprendizaje, 6 cr. 2º curso, 1º. cuatr., curso 2010/11
5) Respuestas de defensa específicas de especie: Se hicieron experimentos donde se variaba el tipo de
respuestas que debía dar el animal para evitar la estimulación nociva, y se encontró que las respuestas de evitación exigidas debían ser compatibles con el tipo de estimulación y acordes con las respuestas naturales en la especie animal que aprende, pues de otra manera no eran aprendidas.
Bolles y otros (Bolles, 1969; D'Amato y Schiff, 1964; Meyer, Cho y Weseman, 1960) fueron
los autores de este tipo de experimentos y llegaron a esta misma conclusión: no todas las respuestas
son igualmente condicionables. Las ratas, en una situación aversiva aprendían bien una respuesta
de salto o de carrera, pero no una conducta estática (por ejemplo, permanecer sentadas sobre las patas traseras).
Para explicar este fenómeno contrario a las leyes tradicionales del aprendizaje (véase la ley de
equipotencialidad, en el Capítulo 1), Bolles acuñó el término de reacción de defensa específica de
especie (RDEE), según la cual, un animal aprende una respuesta de evitación sólo si dicha respuesta es parte de las reacciones defensivas naturales innatas de dicho animal.
El concepto de preparación (preparedness), acuñado por Seligman (1970), viene a incidir en el
mismo tema. Con ello se quiere indicar que un animal puede estar preparado, no preparado o contrapreparado para aprender determinadas respuestas. La contrapreparación se manifiesta cuando el
organismo muestra una resistencia extrema a aprender algo (la conducta estática de las ratas, antes
mencionada). Se trata de un concepto operativo que se puede medir a través del número de ensayos
que se necesitan para lograr que esa respuesta sea aprendida.
6) Adquisición de respuestas de evitación mediante acoplamiento con otras y/o con refuerzos: Sobre
todo en el ámbito de la interacción social humana, es muy frecuente encontrar situaciones en las
cuales determinadas conductas de evitación de unos sujetos se potencian por las conductas de evitación de otros. Por ejemplo pensemos en una interacción entre dos sujetos, A y B, que sigue el siguiente esquema:
Sujeto A:
Sujeto B:
E av.
R
E ref. neg.
Eav.
R ev.
Con la práctica, R será R ev.
Un ejemplo típico se da en la interacción entre niños y padres: Lo que para un sujeto A (bebé) no es
más que emitir una conducta de llanto por un estímulo aversivo interno suyo (tiene molestias digestivas, etc.), para un sujeto B (padre o madre) esa respuesta a su vez es un estímulo aversivo que provoca
en él: (1) una actividad mental encubierta de formación de hipótesis, atribuciones, etc. (“¿por qué llora?: porque no ha dormido, porque tiene hambre, etc.”), y (2) una conducta manifiesta de evitación
(alejarse del niño, llamar a la madre, mecer la cuna, etc.) que hace de refuerzo negativo para el sujeto
B si cesa de llorar y así consolidarse su recuerdo procedimental y/o declarativo (“para que no llore ya
sé que tengo que mecerlo”). A su vez, para el niño, su conducta de llanto por estimulación aversiva interna cesa cuando otros le solucionan el problema, con lo cual se refuerza el llanto como futura conducta de evitación ante esa molestia. Más ejemplos se pueden encontrar en Steiner (1988).
6.3.3. Por qué ocurre la evitación (teorías explicativas)
Hay varios problemas difíciles de resolver a la hora de explicar la evitación: ¿Cómo es posible que
la no ocurrencia de un estímulo pueda ejercer un efecto fortalecedor para la conducta? ¿qué acontecimiento en la situación de evitación podría responsabilizarse de la adquisición de la conducta?.
Son varias las teorías que se han propuesto para explicar la evitación (Fernández Castro, 1979). Pelechano (1980) cita hasta cuatro de ellas y en general se caracterizan porque:
- postulan o hacen referencia a procesos mediacionales (tales como el miedo),
- admiten la intervención de dos procesos de aprendizaje: condicionamiento clásico e instrumental. De
ahí que muchas de ellas se llamen teorías bifactoriales o biproceso.
Tema 5: Condicionamiento instrumental. Control de estímulo y condicionamiento con estimulación aversiva
263
Tudela (1981), coincidiendo en cierto modo con Tarpy (1975) y a Tarpy y Mayer (1978), agrupa
estas teorías en dos tendencias:
- la de los teóricos del reforzamiento (que acentuaron la importancia de la motivación interna del organismo),
- la de los skinnerianos (que se fijaron más en el papel de la estimulación externa).
La primera se referirá a la teoría bifactorial clásica de Mowrer, reformulada después por Miller,
Kamin, Solomon, Wynne, etc. La segunda se centra en la revisión de Schoenfeld, con su modelo de refuerzo sin motivación. La misma teoría bifactorial ha experimentado reformulaciones recientes de tipo
cognitivo. Veamos pues, estos dos tipos de teorías en tres apartados: la teoría bifactorial en su formulación clásica, la teoría del refuerzo sin motivación y la actual reformulación cognitiva de la teoría bifactorial.
a) Teoría bifactorial de Mowrer
Según Mowrer (1947) -con reelaboraciones posteriores de Miller (1951, 1959) y del propio Mowrer (1960)- el hecho cuya ocurrencia activa la respuesta de evitación es el miedo, el cual actúa como
un impulso (drive) que proporciona energía a la respuesta de evitación y refuerzo negativo al cesar con
ella mediante su reducción. Pero el miedo al ED en este caso no es un impulso primario sino adquirido
por condicionamiento clásico. El miedo es por tanto una RC al ED (que actúa como EC) que se adquiere por el apareamiento previo de ED con el EI aversivo. Hay pues dos fases:
I)
ED (= EC)
II)
ED
Eav (=EI)
RC (miedo)
RI (miedo)
R instr.
cese ED (ref. neg.)
Durante los primeros ensayos en que la respuesta de evitación todavía no ha sido aprendida, el apareamiento ED-Eav produce el condicionamiento de miedo al ED. De este modo el condicionamiento
clásico del ED proporciona un significado de motivación y emotividad aversiva a estímulos inicialmente neutros (Gray, 1988; trad. cast. 1993, p. 196). Después, en la segunda fase, la sola presencia del ED
provoca el miedo, lo cual activa la respuesta instrumental. La ejecución de la respuesta hace cesar el
ED (éste cese contingente sería un factor crítico), con lo cual desaparece o disminuye el miedo y se refuerza la respuesta. La respuesta instrumental se aprende no por evitar la estimulación aversiva sino
por escapar al miedo al cesar el ED con dicha respuesta
Ha sido una teoría muy estudiada y con gran soporte y evidencia experimental. Incluso ha sido mejorada con los años. Por ejemplo, hoy día se considera (Gray, 1988; trad. cast. 1993, p. 208) que el
comportamiento de evitación es reforzado no sólo por la reducción del miedo al cesar E D, sino también
por la aparición, tras la respuesta, de señales de seguridad, que son estímulos presentes tras la respuesta de evitación, por ejemplo en animales en la caja de saltos, el feedback cinestésico o propioceptivo
tras el salto, la llegada al otro lado, etc. Son reforzadores secundarios pues aparecen siempre conjuntamente con el refuerzo negativo (cese de la señal condicionada aversiva).
Esta teoría ha sido aplicada en el contexto clínico a la explicación de ciertas neurosis, particularmente fobias. Así, no hay más que entender la respuesta instrumental de evitación como la conducta
neurótica, la cual es mantenida porque con ella cesa el miedo o la ansiedad que se ha condicionado
fuertemente al ED.
b) Teoría de refuerzo sin motivación de Schoenfeld
264
Universidad de Murcia. Grado Psicología. Asignatura: Aprendizaje, 6 cr. 2º curso, 1º. cuatr., curso 2010/11
Según Schoenfeld (1950), el miedo es un proceso mediacional inobservable (y por tanto inestudiable desde una óptica conductista). El cese del estímulo aversivo con la respuesta actúa como refuerzo
negativo aumentando la probabilidad de la respuesta que lo suprime. En virtud de su frecuente asociación con el estímulo aversivo, el ED se convierte en estímulo aversivo condicionado, adquiriendo así
las características aversivas del shock. El sujeto escapa del ED (sin embargo, en la teoría de Mowrer el
sujeto escapa del miedo suscitado por el ED).
También se trata de una teoría bifactorial pues el ED es refuerzo condicionado por condicionamiento clásico y la respuesta de evitación es instrumentalmente reforzada por la terminación del ED.
En realidad, ambas teorías reducen la situación de evitación a un problema de escape. Según Mowrer, el sujeto escapa del miedo, o del ED según Schoenfeld. En ambos casos, el acontecimiento reforzador observable es el cese del ED.
c) Reformulación cognitivo-social de la teoría bifactorial
Desde la teoría de las expectativas de auto-eficacia de Bandura (1977, 1986), se ha replanteado recientemente la teoría bifactorial, al menos en su aplicación a humanos (Villamarín, 1990). Según esta
teoría, tanto la activación de RC autonómica de miedo como la emisión de respuestas de evitación dependen no sólo de la activación de expectativas adversas (el EC señala un próximo acontecimiento
aversivo) sino sobre todo de la "competencia percibida" de tener capacidad para hacer frente a esa posible adversidad. Si el individuo percibe que dispone de conductas de afrontamiento y genera así expectativas de auto-eficacia, entonces habrá menor miedo o ansiedad. Por tanto, lo que produce el miedo y la ansiedad no es el proceso de condicionamiento clásico previo sino las cogniciones o expectativas de resultados y las expectativas acerca de la propia eficacia para afrontarlos.
6.3.4. Extinción de la respuesta de evitación
En este apartado analizaremos sólo la extinción de conductas adquiridas por procedimientos de refuerzo negativo (estimulación aversiva, previa a la conducta, que cesa al producirse ésta), o sea, la extinción de conductas de escape y de evitación. El castigo también podría considerarse una técnica de
extinción pues permite la disminución o eliminación de conductas, pero por conveniencia metodológica sólo se incluye como técnica de extinción a cualquiera que no utilice estimulación aversiva directa
para lograrlo.
Respecto a la conducta de escape, al necesitar la aplicación de estimulación aversiva previa a la
respuesta, su extinción no reviste problemas si se elimina la posibilidad de que aparezca estimulación
aversiva o si la respuesta no permite que cese la estimulación aversiva. Sin embargo, la extinción de la
conducta de evitación es más compleja y por eso la trataremos más ampliamente a continuación.
a) Evidencia y teorías sobre la persistencia de la conducta de evitación
Diversos autores coinciden al afirmar que la conducta de evitación, como conducta defensiva
(Bandura, 1969) ante situaciones ambientales aversivas, debe explicarse no sólo mediante un análisis
conductual sino también mediacional cognitivo. Según un mero análisis conductual, para lograr la extinción bastaría con eliminar la contingencia entre el ED y el Eav, es decir, presentar el ED sin Eav posterior. Sin embargo, esto no es eficaz para la extinción. En realidad, lo que se observa es una extraordinaria persistencia de la conducta de evitación o, si se quiere, una gran resistencia a la extinción. Los
primeros en demostrarlo experimentalmente fueron Solomon, Kamin y Wynne (1953). Estos autores
entrenaron a unos perros en la conducta de evitación en una caja de saltos bidireccional. En esta situación, tras sólo 10 ensayos de adquisición EC-EI (EC= reducción en la intensidad de la luz; EI= descarga eléctrica; intervalo EC-EI= 10 segundos; se daba una descarga eléctrica si no saltaban antes de
Tema 5: Condicionamiento instrumental. Control de estímulo y condicionamiento con estimulación aversiva
265
10 segundos en cada ensayo) no se produjo extinción durante 20 días a razón de 200 ensayos de extinción diarios.
La extinción de la conducta de evitación es pues sumamente difícil y si pensamos en las fobias como conductas de este tipo ante ECs anormalmente aversivos y la dificultad para eliminarlas, podremos
comprender la importancia de este tema. Hay más ejemplos cotidianos que tendrían su explicación dentro de estas cuestiones de la conducta de evitación. Así, Gray (1988; trad. cast. 1993, p. 211) sostiene
que el aprendizaje de evitación está implicado en el establecimiento de formas de comportamiento
(tanto grupales como individuales) muy persistentes en el hombre. Ejemplos sociales o grupales tenemos: la disciplina militar, formas de comportamiento ritual propias de algunas religiones o sectas; un
ejemplo de comportamiento ritual individual es el comportamiento obsesivo-compulsivo. En estos casos tenemos dos elementos:
- Una serie de acciones o conductas que deben realizarse (sean razonables o absurdas, necesarias o inútiles, sencillas o dificilísimas).
- La omisión de estas conductas se castiga desde el primer momento (desde la infancia en el caso del
obsesivo-compulsivo), conduciendo a una gran ansiedad posterior, de modo que aunque ya sea improbable el castigo (el grupo opresor, la institución en la que se aplicaba el castigo, etc.), cualquier
señal del entorno condicionada a ello seguirá activando al menos el miedo o la ansiedad, y con ello la
necesidad de llevar a cabo las conductas de evitación correspondientes (rituales, etc.).
La evitación incluye pues otros componentes mediacionales decisivos para explicar su anormal
persistencia o resistencia a la extinción, entre ellos la aparición en su formación de un estado emocional de temor, miedo y ansiedad que desde la teoría bifactorial de Mowrer se sabe que surge como RC
interna al EC aversivo y de manifestación previa a la respuesta de evitación.
Para explicar esta resistencia a la extinción de la respuesta de evitación, Solomon y Wynne (1954),
en consonancia con la teoría bifactorial de Mowrer, formularon el Principio de conservación de la
ansiedad. Este principio nos dice que el EC aversivo suele durar muy poco por la rápida aparición de
la respuesta de evitación, con lo cual casi nunca se emite plenamente la RC de temor o ansiedad, y así
es como ésta se preserva y no se logra extinguir; parece pues que si se lograse extinguir la RC de miedo o ansiedad, también se extinguiría la respuesta de evitación.
b) Procedimientos para acelerar la extinción de la conducta de evitación
Se han ensayado experimentalmente diversos procedimientos, algunos de los cuales pasaron a la
aplicación clínica. Describiremos aquí los más importantes.
SATURACIÓN DE EC Y BLOQUEO DE RESPUESTA: LA TÉCNICA DE INUNDACIÓN
Esta técnica, ya empleada por Solomon et al. (1953), es denominada también "exposición forzada
mediante prevención de respuesta" según Bandura (1969), y su derivación clínica se conoce con el
nombre de inundación (flooding). Consiste en impedir la respuesta de evitación al presentar repetidas
veces el EC temido en ausencia del EI. De esta forma, la RC de temor se emite varias veces con toda
su fuerza y se extingue. Según Shipley (1974), lo importante es el tiempo total de exposición al EC y
también el aprendizaje de una nueva respuesta (la de inmovilidad) que interfiere con la respuesta de
evitación. Aunque ninguna de estas teorías ha sido del todo convincente, lo cierto es que este procedimiento produce una rápida extinción, aunque no está exento de efectos secundarios (alteraciones
somáticas por la intensidad de la emoción vivida, etc.).
Se han investigado las distintas condiciones que afectan a la extinción mediante inundación, y
según Tarpy (1981; trad. 1986, p. 363) serían las siguientes:
266
Universidad de Murcia. Grado Psicología. Asignatura: Aprendizaje, 6 cr. 2º curso, 1º. cuatr., curso 2010/11
- Grado de control ejercido por el sujeto durante la inundación: Si el sujeto puede controlar la terminación del EC mediante la respuesta de evitación, la extinción será más lenta que si no existe tal control (Katzev y Berman, 1974).
- Tiempo de exposición al EC: Cuanto mayor sea la duración total de exposición al EC o el número de
ensayos de EC, mejor será la extinción (Shipley, 1974; Bersh y Keltz, 1971).
- Intensidad del EI: Cuanto mayor sea la intensidad peor extinción (Baum, 1969).
TERMINACIÓN DEL EC DESPUÉS DE LA RESPUESTA DE EVITACIÓN
Según Adams (1980; trad. 1983, p. 120), si el EC durante la fase de extinción se retrasa más allá de
la terminación de la respuesta de evitación, entonces el sujeto podrá distinguir (discriminar) esta fase
de la de adquisición (en que el EC terminaba al comenzar la respuesta de evitación). Katzev (1967)
realizó un experimento para comprobar la eficacia de este método utilizando ratas en una caja de saltos
(donde EC = zumbador + luz, y EI = descarga eléctrica). En los 200 ensayos de adquisición los animales evitaban la descarga saltando (respuesta de evitación) en los 5 segundos iniciales del EC (tras el
salto cesaba el EC). Durante la fase de extinción hizo dos grupos: en el grupo I el EC terminaba con el
inicio de respuesta de evitación o a los 5 segundos si no ocurría la respuesta de evitación. En el grupo
II el EC continuaba 20 segundos después de la respuesta de evitación. Los resultados mostraron una
menor resistencia a la extinción en el grupo II. De todas formas el experimento no está exento de críticas pues el grupo II tuvo una mayor exposición al EC y, como vimos en la técnica de inundación, eso
es un factor decisivo.
CASTIGO DE LA RESPUESTA DE EVITACIÓN: CONDUCTA AUTOPUNITIVA
También Solomon et al. (1953) aplicaron este método consistente en aplicar estimulación aversiva
al emitir la respuesta de evitación durante la extinción. Pero paradójicamente el efecto de esta técnica
fue justo el contrario: aumenta la emisión de respuesta de evitación, a pesar de que cuanto más responda el sujeto más castigo recibirá. Este fenómeno se ha denominado conducta de "círculo vicioso",
"autopunitiva" o "masoquista", y se ha estudiado ampliamente en aprendizaje animal.
Varias teorías han intentado explicar este fenómeno:
- La explicación basada en la teoría bifactorial dice que el castigo durante la extinción mantiene y aumenta el nivel de temor o miedo, lo cual hace que persista la conducta de evitación y al castigar ésta
aumenta el miedo y la conducta de evitación, y así sucesivamente.
- Otra explicación, llamada "teoría de la confusión", según Tarpy (1981; trad. 1986, p. 371), se basa
en una falta de discriminación entre adquisición y extinción. Normalmente durante la extinción no
debe aparecer el EI -como ocurría durante la adquisición-, pero al hacerlo se confunde esta fase con
la de adquisición y por tanto no se puede discriminar ambas fases.
Ambas hipótesis son compatibles, según Dreyer y Renner (1971) y desde luego permiten concluir
que no estamos ante un buen método de extinción de la respuesta de evitación.
EXPOSICIÓN GRADUADA AL EC
Se trata de introducir el EC progresivamente (en presentaciones de menor a mayor aversividad) de
forma que no provoquen respuesta de evitación. Es un procedimiento citado por Bandura (1969) y que
combinado con procedimientos de contracondicionamiento es la base de técnicas tales como la desensibilización sistemática.
Tema 5: Condicionamiento instrumental. Control de estímulo y condicionamiento con estimulación aversiva
267
6.4. Castigo
6.4.1. Definición, características y líneas de investigación
a) Definición y características
El castigo es un procedimiento en el cual una conducta establecida (previamente adquirida por
condicionamiento de recompensa) es seguida por la presentación de un estímulo o suceso aversivo (o
la supresión de un suceso positivo), de forma que se logra reducir su frecuencia o se suprime. Aquí la
estimulación aversiva no funciona como reforzador negativo sino como estímulo punitivo. No ocurre
antes de la respuesta sino que le sobreviene al sujeto tras ella.
Su representación simbólica, siguiendo a Millenson y Leslie (1979) es bien sencilla:
R
Eav
Conviene, sin embargo, distinguir la definición técnica del castigo de su uso cotidiano. En el primer caso, se incluyen las condiciones adecuadas para el resultado de disminución o supresión de la tasa de respuesta. En el segundo caso, a veces se dan las condiciones necesarias de efectividad y otras
veces no e incluso de efectividad pero cuya aplicabilidad es ética y jurídicamente inviable (maltrato
físico, etc.). Así, debe puntualizarse que el castigo no implica necesariamente dolor o coacción físicos,
no es sólo una pena impuesta por la ejecución de un acto determinado. Por otra parte, muchas veces se
aplica el castigo sin una relación contingente con la respuesta; sirvan como ilustración los siguientes
ejemplo:
- A los niños a veces se les "da una lección" por su mala conducta sometiéndoles a algún sacrificio o
“escarmiento”, aunque sea bastante después de realizada;
- los criminales reciben penas que no necesariamente disminuyen la frecuencia de sus actos criminales;
- muchas veces el castigo físico que un padre inflige a su hijo no es porque el niño haya hecho nada
especialmente malo, sino por disgustos personales o matrimoniales que encuentran su desahogo en la
violencia ejercida sobre el más débil (véase sobre este asunto el magnífico monográfico que sobre
maltrato infantil ha publicado la revista Infancia y Aprendizaje, 1995, nº 71).
En estos ejemplos, usualmente denominados de "castigo", efectivamente lo son pues hay estimulación punitiva ulterior a la conducta, pero puede faltar lo decisivo en una definición técnica de castigo
que es su efecto sobre la conducta (reduciendo su frecuencia o suprimiéndola) y una contingencia respuesta - castigo.
b) Líneas de investigación
Respecto a las líneas de investigación que se han seguido sobre el castigo, Pelechano (1980, p.
232) señala dos fundamentales: la que proviene del conductismo y el aprendizaje animal y la llevada a
cabo en psicología evolutiva:
APRENDIZAJE ANIMAL
La historia habría que iniciarla en Thorndike, quien en 1911 formuló la ley del Efecto no sólo en su
aspecto positivo sino también negativo (la estimulación aversiva debilita o elimina las asociaciones
E-R establecidas), aunque en reformulaciones posteriores renunció a este principio pues obtuvo evidencia en humanos de que el castigo sobre respuestas erróneas no mejoraba el rendimiento en las respuestas alternativas.
268
Universidad de Murcia. Grado Psicología. Asignatura: Aprendizaje, 6 cr. 2º curso, 1º. cuatr., curso 2010/11
Posteriormente, Skinner (1938) y Estes (1944) comprobaron que el castigo no debilita la relación
entre estímulo y respuesta ni elimina la conducta sino que sólo la suprime temporalmente.
Estos resultados llevaron a la conclusión práctica de procurar la no utilización del castigo como
medida disciplinaria y al abandono de la investigación sobre este campo, hasta su relanzamiento en la
década de los 60 con autores tales como Mowrer, Azrin, Church, Solomon, etc.
PSICOLOGÍA EVOLUTIVA
Nos referimos en este apartado a teorías influyentes sobre el desarrollo infantil, en las cuales se introducen explicaciones sobre el castigo. Inicialmente habría que citar las teorías de Freud y Watson.
Freud, al hablar del proceso de "internalización" (por el cual el niño incorpora o asimila fundamentalmente las normas sociales) indica que se trata de pasar de un sistema de castigos y premios externos a
otro interno (mediante sentimientos de culpa y/o ansiedad). El castigo aparecería pues como un procedimiento con efectos altamente desagradables y muy peligroso en los niños. Watson, por otra parte defendió en un principio, al menos tácitamente, sistemas de castigo para la crianza de los niños, aunque
más tarde corrigió dicha postura.
Estas teorías llevaron a que de algún modo se paralizase la investigación sobre el tema hasta recientemente en que más bien (y puesto que en términos sociales es un fenómeno y una práctica que no
disminuye) se trata de analizar los aspectos positivos que pueda tener la aplicación del castigo (efectividad y control de efectos nocivos secundarios).
6.4.2. Tipos de castigo: Castigo por aplicación y por supresión
Craighead, Kazdin y Mahoney (1976; trad. cast. de 1981) distinguen dos tipos de castigo: Castigo
por aplicación y castigo por supresión.
CASTIGO POR APLICACIÓN
El castigo por aplicación (de estímulos punitivos), también llamado castigo positivo, consiste en
aplicar un estímulo aversivo después de una respuesta. Por ejemplo, ser reprendido o "zurrado" después de realizar cierta conducta, etc. Su esquema sería: R - Eav.
Podrían incluirse aquí procedimientos en los que la estimulación punitiva es condicionada. Por
ejemplo, las reprimendas verbales: Cuando se pretende que sean eficaces para suprimir conductas
problemáticas, se sabe que las suaves serán más eficaces que las fuertes (éstas últimas conducen frecuentemente a un aumento posterior paralelo de las conductas perturbadoras). Drabman (1977) considera que las reprimendas verbales son un tipo de castigo por supresión, lo cual es bastante discutible
pues no se pierde ningún reforzador; más bien lo que aparece tras la respuesta es estimulación punitiva
condicionada, esto es, adquiere valor aversivo por asociación previa con otros estímulos directamente
aversivos.
Otro ejemplo de castigo por aplicación muy interesante en humanos (y un buen exponente de un
castigo generalmente eficaz) es la restitución o reestablecimiento del daño causado. En este caso, el
castigo por algún tipo de conducta lesiva o dañina (por ejemplo, romper deliberadamente un juguete al
hermano) consiste en algún tipo de reestablecimiento o reposición, incluso con creces, del daño causado (ahorrar hasta comprar al hermano otro juguete igual). Otro ejemplo se da cuando al niño que es
sorprendido tirando un papel al suelo en el aula, se le hace recoger todos los papeles que haya en el
suelo.
Tema 5: Condicionamiento instrumental. Control de estímulo y condicionamiento con estimulación aversiva
269
CASTIGO POR SUPRESIÓN
El castigo por supresión (de reforzadores), también llamado "castigo negativo" consiste en suprimir
un reforzador positivo después de una respuesta, por tanto no se aplica estimulación punitiva directa. Su esquema es R - No Eref. Por ejemplo:
- Perder privilegios por volver tarde a casa,
- perder dinero por mal comportamiento,
- retirada del carnet de conducir tras cometer una infracción grave, etc.
CRÍTICAS A ESTA CLASIFICACIÓN
En realidad, es una clasificación criticable desde un punto de vista técnico de definición del castigo. En particular, el castigo por supresión es perfectamente equiparable a la extinción del condicionamiento de recompensa. En aquel momento (véase Capítulo 6), se insistía en el aspecto operante de
disminución de tasa de respuesta, pero no se mencionaba el factor emocional de dolor o frustración por
la pérdida del refuerzo.
Esta confusión conceptual ha llevado a una “división de opiniones” entre los autores: los mismos
procedimientos prácticos de reducción o eliminación de conductas se incluyen dentro de temas o capítulos de castigo (por ejemplo, Drabman, 1977) o de técnicas de extinción de condicionamiento de recompensa (por ejemplo, Milby, 1982). En cualquier caso, una descripción de estos procedimientos se
puede encontrar en el apartado 4.1.1. del Tema 4.
6.4.3. Condiciones para la efectividad del castigo
Cuando se mencionan las condiciones de efectividad del castigo, surge una clara confrontación entre las condiciones de laboratorio y las de la vida real. Empezamos describiendo las primeras para después comprobar en las segundas lo problemático que puede resultar la utilización del castigo.
a) Condiciones experimentales para la disminución de la respuesta mediante castigo
1) Intensidad: A mayor intensidad, mayor supresión (más completa y duradera) de la respuesta. Si la
intensidad es baja se observa una recuperación de la respuesta castigada. Una intensidad mediana
produce una supresión parcial de la respuesta. Es más eficaz variar la intensidad del castigo a lo
largo del entrenamiento que mantenerlo constante.
2) Proporcionar respuestas alternativas: Una vez lograda la supresión de la respuesta, si no se ha llevado a cabo un entrenamiento en respuestas alternativas, el sujeto vuelve a recuperar la conducta
castigada. La respuesta alternativa debe satisfacer el impulso (hambre, sed, etc.) en que se basa la
tendencia de “aproximación” o atracción que ejerce la respuesta inicial. Además, si se proporciona
respuesta alternativa, el castigo puede ser de baja intensidad. Gray (1988; trad. cast. 1993, p. 143)
menciona un impresionante experimento de Solomon al respecto: Unos cachorros de perro preferían comer carne normal en vez de carne granulada; para lograr que comieran carne granulada, los
castigaba con un golpe en el hocico (dado con un periódico enrollado) al comer carne normal; sin
embargo, les dejaba comer carne granulada. Fue un método de adiestramiento eficaz pues cuando
les daba sólo carne normal algunos perros llegaron a morir de hambre (a los que seguía dándoles
carne granulada se la comían sin problemas). La eficacia fue mayor porque se castigó una conducta
consumatoria (comer) en vez de una conducta instrumental.
270
Universidad de Murcia. Grado Psicología. Asignatura: Aprendizaje, 6 cr. 2º curso, 1º. cuatr., curso 2010/11
3) Duración del estímulo punitivo: A mayor duración mejor es la supresión de la conducta, aunque es
muy probable que con una perturbación emocional mucho mayor.
4) Presentación repentina o gradual: El estímulo punitivo es más eficaz si se presenta de modo repentino que si se hace de forma gradual, dado que en este último caso se va produciendo una habituación al estímulo aversivo.
5) Programas de castigo: Se trata de aplicar los mismos programas que se utilizaron con el refuerzo
(véase Tema 4). El programa de castigo más eficaz es el continuo (respuesta-castigo) tanto en animales como en humanos. En los de razón fija la eficacia es mayor cuanto mayor sea el volumen de
estimulación punitiva, y al aplicarlo se observa una disminución progresiva de la tasa de respuesta.
Con programas de intervalo se desarrolla una supresión anticipatoria, sobre todo con intervalos
fijos (disminuye la frecuencia de respuesta antes de que se emita estimulación punitiva).
6) Demora del castigo: Normalmente a menor contigüidad espacio-temporal entre castigo y conducta
menor eficacia del mismo. Sin embargo, en sujetos humanos este factor es menos importante.
7) Orden temporal en las secuencias premio - castigo: En una secuencia R instrumental - E reforzante
- R consumatoria, según el momento en que se aplique castigo (estimulación aversiva), el resultado
conductual será diferente. Citemos dos posibilidades:
- Secuencia castigo - premio: Con la secuencia R instr. - E av. - E ref., es decir, castigando la respuesta instrumental pero permitiendo la aparición posterior del premio, paradójicamente, no se
suprime la respuesta instrumental y además la estimulación aversiva hace de EC o señal de un
estímulo reforzante posterior. Con todo ello se logra, mediante este contracondicionamiento (1º
castigo, 2º recompensa), una mayor resistencia al castigo, es decir, una mayor resistencia a la extinción de la respuesta castigada. Es otra manifestación de la conducta masoquista antes mencionada -recuérdese que se producía conducta masoquista al castigar la respuesta de evitación, con lo
cual, teníamos una secuencia R instr. - E ref negativo (cese de EC) - E av.-. En humanos, esta
búsqueda de estímulos dolorosos, tan extraña en la mayor parte de congéneres, tendría explicación en función de esta secuencia premio - castigo, tal y como comenta Gray (1988; trad cast.
1993, p. 148): supuestos una serie de experiencias condicionantes en la infancia en las que el dolor se ha seguido de una buena recompensa (y es fácil de imaginar que esto sucede normalmente)”.
- Secuencia premio - castigo: Se trata de la secuencia
R instr.
E ref.
R consumatoria
E aversivo
En una secuencia como la del experimento de los cachorros de Solomon antes mencionado,
produce el efecto contrario: una rápida extinción de la R instrumental y de la R consumatoria, pero también la aparición de una intensa RC de miedo. En términos coloquiales, algunos autores
(por ejemplo Eysenck) sugieren que estos fenómenos están involucrados de algún modo con el
desarrollo de la conciencia moral. En efecto, al no emitir la respuesta, se produce una resistencia
anticipada a la tentación. Pero si alguna vez comete la respuesta prohibida, entonces el sujeto experimentará sentimientos de culpa.
b) Condiciones óptimas de efectividad del castigo en contexto aplicados
Craighead et al. (1976) señalan las siguientes:
Tema 5: Condicionamiento instrumental. Control de estímulo y condicionamiento con estimulación aversiva
271
1) Aplicación inmediata del estímulo aversivo punitivo o supresión del refuerzo después de la respuesta no deseada. De la misma forma que en el entrenamiento de recompensa, también en el caso del
castigo interesa que haya la menor demora posible entre la conducta y su consecuencia.
2) Castigo de todas y cada una de las incidencias de la respuesta, es decir, para que el castigo sea eficaz debe aplicarse según un programa continuo. Hay que notar que en caso de que el castigo no se
produzca según un programa continuo, ello implicará que todas las conductas no castigadas se
están dando porque tienen algún tipo de reforzamiento; por consiguiente, y de acuerdo con el efecto del refuerzo parcial ya estudiado, la conducta tenderá a mantenerse resistente a la extinción. En
el caso del castigo suele ser aún más importante que en el caso de la recompensa una aplicación
consistente desde el principio del entrenamiento para optimizar su efecto.
3) Introducción del estímulo contingente de castigo en su máxima intensidad (más que con aumento
gradual de severidad) pero, en el caso de humanos, con proporcionalidad entre la intensidad del
estímulo punitivo y la fuerza de la conducta que se quiere extinguir (Marcos, 1994b, p. 86). Si la
intensidad del castigo es desproporcionadamente elevada, se facilitará la inducción de efectos secundarios perjudiciales, según será comentado a continuación; por el contrario, si el castigo es demasiado leve y las consecuencias extrínseca o intrínsecamente reforzantes de la conducta son más
importantes para el sujeto, lógicamente tal conducta tenderá a persistir.
4) Supresión de la motivación para la respuesta no deseada.
5) Preparación de una respuesta alternativa aceptable (en especial cuando no puede eliminarse la motivación para la respuesta no deseada). Resulta crucial este factor de refuerzo de conductas alternativas, como una manera de reencauzar las motivaciones del sujeto en direcciones de respuesta diferentes. Si bien el castigo tiende a "dejar sin salida" las motivaciones de la persona, no tendrá porqué
haber demasiada persistencia en la conducta problemática cuando el individuo encuentra fácilmente
conductas diferentes y asequibles a sus capacidades que empiezan a resultar instrumentales para la
satisfacción de sus necesidades.
6) Refuerzo de las respuestas incompatibles con la respuesta castigada. En algunos casos particulares,
la respuesta alternativa reforzada puede ser de hecho incompatible e incluso opuesta a la conducta
que se desea extinguir. Así, por ejemplo, un chico que tiene el hábito de morderse las uñas, puede
ser reforzado (mediante alabanzas o refuerzos intercambiables, por ejemplo) cada vez que, al percatarse de que va a iniciar el mordisqueo, cierra el puño o mete durante un minuto su mano en el bolsillo.
7) En seres humanos, una descripción de la contingencia del castigo que permita que el sujeto sea
consciente de por qué se le castiga. La aplicación consistente del castigo sin explicaciones, tal como obviamente se hace con los animales en el laboratorio, da lugar a asociaciones representacionales sobre la contingencia del castigo, pero tales representaciones se ven facilitadas si la experiencia
directa de castigo va acompañada por una explicación verbal congruente.
8) Aún señalizaríamos nosotros un último factor o condición para la óptima efectividad del castigo en
humanos, y se refiere a que tal castigo esté lo más directamente posible relacionado con la conducta
problema y sus consecuencias naturales. Un buen ejemplo de ello es la restitución del daño que
comentamos en un apartado anterior.
Como vemos, se trata de un resumen o enumeración con fines evidentemente prácticos de algunos
de los factores señalados en el apartado anterior.
272
Universidad de Murcia. Grado Psicología. Asignatura: Aprendizaje, 6 cr. 2º curso, 1º. cuatr., curso 2010/11
c) Efectos secundarios (perjudiciales) del castigo
Aunque parece que siguiendo las normas antes citadas se podrían obtener resultados positivos con
el castigo, sin embargo no dejan de aparecer efectos perjudiciales, tanto por no lograr la supresión de
la conducta castigada, como por la aparición de efectos secundarios perjudiciales. Dichos efectos se
pueden concentrar en cinco apartados:
- Aparición de respuestas emocionales negativas y/o problemáticas.- La aplicación de técnicas de castigo sin alternativa de respuesta según Walter y Grusec (1977) y con estimulación punitiva intensa
provoca ciertas alteraciones comportamentales y un incremento de la ansiedad y de la inhibición
comportamental.
- Aparición de conductas de evitación del agente punitivo y del contexto de la situación de castigo.Se llega a una evitación del agente punitivo y del contexto ambiental o estimular con él asociado.
Los efectos son fáciles de imaginar en caso de aplicación del castigo en niño, por ejemplo, en el
ámbito familiar (falta de comunicación padres-hijos, etc.); o en el escolar (aversión al profesor, al colegio, al estudio, etc.).
- Efecto rebote o incremento de la respuesta castigada en ausencia de la situación (agente punitivo y
contexto) de castigo.- Si se castiga una conducta problemática que venía manteniéndose previamente
por condicionamiento de recompensa, se reducirá dicha conducta, pero cuando deje de aplicarse el
castigo no sólo no se reducirá la tasa de respuesta sino que se incrementará por encima del nivel que
tenía cuando ésta era reforzada antes del castigo. Marcos (1994b, p. 87) pone un ejemplo muy ilustrativo:
“Imaginemos que un niño comienza a fumar porque así obtiene cierto refuerzo social; sus padres le castigan cuando le
ven fumando. Cuando el muchacho sea mayor y sus padres no puedan castigarle, entonces fumará más que si no le
hubieran castigado nunca”.
Además, al administrar repetidamente el castigo, los estímulos asociados al agente o situación punitiva se condicionan, con lo cual, en ausencia de ese contexto la respuesta castigada se recupera con
facilidad. Todo ello surge, evidentemente, al no conseguirse una verdadera supresión de la motivación para la conducta.
- Imitación futura de la conducta “castigadora”.- El agente punitivo según Pelechano (1980, p. 351)
"se convierte en un modelo poderoso que castiga y promueve, en niños y adultos, conductas de castigo por modelado comportamental" (aprendizaje observacional). El sujeto castigado tiende a aprender
que ese es el patrón de conducta pertinente para dirigir el comportamiento de los demás.
- Persistencia de la motivación para realizar la conducta problema.- Si no se proporcionan conductas
alternativas a la castigada, el sujeto aprende a no hacer algo, es pues un aprendizaje asociativo de
carácter negativo que puede que suprima una conducta observable, pero no la motivación para hacerla, de modo que cuando pueda (esté ausente el agente punitivo, etc.) volverá a hacerla; se establece,
en todo caso un conflicto aproximación - evitación que no se resolverá hasta que se ofrezca la posibilidad de obtener el mismo refuerzo pero con otras conductas socialmente más correctas.
Dicho todo esto, es obvio que el uso aplicado del castigo debería restringirse a casos puntuales,
nunca el castigo físico, y siempre que no haya ningún procedimiento alternativo y aplicándolo con
arreglo a las normas antes mencionadas.
Tema 5: Condicionamiento instrumental. Control de estímulo y condicionamiento con estimulación aversiva
273
6.5. La pérdida del control de la acción: Indefensión aprendida
6.5.1. Concepto y técnicas experimentales
En el apartado anterior estudiamos la aplicación de estimulación punitiva contingente a la respuesta. Eran situaciones en las cuales el sujeto aprendía una relación o asociación entre su respuesta y una
consecuencia negativa; en cierto modo, adquiría un cierto control sobre su entorno pues aprende a no
hacer algo por sus malas consecuencias o, en el caso de la evitación, aprende a hacer algo para no sufrir malas consecuencias. En definitiva, con su conducta “controla” la situación.
Ahora bien, es posible que se aplique la estimulación punitiva de forma no contingente a la respuesta. En estos casos, el sujeto con su conducta no tiene control sobre los acontecimientos y ello será
bastante negativo. De hecho, en la vida cotidiana no es algo infrecuente. Por ejemplo, en una situación
de desempleo, la persona comienza intentando diversas estrategias para conseguir un trabajo (presentarse a oposiciones, buscar “enchufes”, consultar bolsas de trabajo, apuntarse en una oficina de empleo, etc.); si transcurrido un tiempo no lo consigue, esa estimulación aversiva (desempleo) persiste y
no es contingente a las respuestas de evitación (las estrategias de búsqueda antes mencionadas). Hay
otras situaciones problemáticas en las que hagamos lo que hagamos no las resolvemos pero su repercusión es más o menos negativa según su duración, intensidad o posibilidades de escape.
La investigación experimental lleva desde 1967 estudiando sistemáticamente dicho fenómeno. En
esa fecha, Seligman y colaboradores (Overmier y Seligman, 1967; Seligman y Maier, 1967) expusieron a unos perros (en cajas de saltos) a una serie de shocks inescapables y después observaron que estos animales eran incapaces de aprender una nueva conducta consistente en evitar o escapar de los
shocks, esta vez sí contingentes a dicha conducta. A dicho fenómeno se le llamó learned helplessness,
traducido por términos diversos tales como desamparo, impotencia, desesperanza o indefensión aprendida, y cuya formulación sería la siguiente: "Los organismos expuestos a una situación incontrolable,
con frecuencia muestran déficits posteriores en el aprendizaje de nuevas respuestas de éxito" (Maier y
Seligman, 1976).
Experimentalmente no sólo se ha demostrado en perros sino también en otros animales y también
en humanos (véase Garber y Seligman, 1980, para revisión), sea con ruidos desagradables (Hiroto,
1974) o con anagramas irresolubles (Romero, López y Diez, 1988).
Según Seligman (que es el principal investigador en este terreno), el concepto de indefensión describe al menos tres cosas diferentes:
- Un procedimiento experimental: exposición a consecuencias incontrolables, o sea, estimulación
aversiva que no se puede evitar, ni escapar ni es contingente a la respuesta.
- Un efecto conductual: inactividad como resultado de tal operación.
- Un proceso, un fenómeno de aprendizaje consistente en la adquisición de cogniciones específicas a
tal procedimiento y responsables del efecto conductual.
Las teorías elaboradas en torno a dicho fenómeno, además de romper con las teorías tradicionales
E-R al incluir variables mediacionales cognitivas (atribución, expectativas), están teniendo en la actualidad gran aplicación en clínica, sobre todo en el campo de la depresión.
Las técnicas o procedimientos experimentales por los cuales se ha evidenciado la indefensión
aprendida se describen en el Cuadro 3.
274
Universidad de Murcia. Grado Psicología. Asignatura: Aprendizaje, 6 cr. 2º curso, 1º. cuatr., curso 2010/11
Cuadro 3: Técnicas experimentales de adquisición de la indefensión aprendida.
El paradigma experimental clásico de indefensión aprendida, tal y como se llevó a cabo en los primeros experimentos de
Seligman, se denomina diseño triádico. Aunque ha experimentado numerosas variaciones y críticas, lo cierto es que ha sido la técnica más utilizada. Supone dos fases: una de pre-tratamiento o de inducción y otra de prueba.
- En la fase de pre-tratamiento se hacen tres grupos de sujetos:
1) Grupo escapable, que se somete a descargas escapables mediante procedimiento de escape o evitación: Eav - R
No Eav (Ref. neg.)
2) Grupo inescapable, idéntico en todo al anterior ("acoplado al anterior") excepto en que la respuesta no impide ni afecta
a la estimulación aversiva previa: Eav - R
Eav
3) Grupo control o inexperto pues no tiene experiencia de estimulación aversiva.
- En la fase de prueba todos los grupos son sometidos a un condicionamiento de escape o evitación de modo que se mide
y se compara la rapidez de adquisición. Los grupos 1 y 3 suelen mostrar una mayor rapidez en la adquisición que el grupo 2 que es más lento por la interferencia de la fase aversiva inescapable no contingente.
Así pues, todos los procedimientos experimentales, tanto en humanos como en animales tienen el objetivo de conseguir
que el sujeto perciba el no control sobre las consecuencias o sobre los acontecimientos.
Con este mismo diseño triádico se han empleado diversos procedimientos en ambas fases (Ferrándiz, 1989):
- En la fase de pre-tratamiento, en animales sobre todo se han utilizado descargas eléctricas (por ejemplo, 60 descargas
inescapables de 6 mA (miliamperios) y 5 segs. de duración espaciados durante 3 horas). Con humanos hay más variedad:
. estimulación aversiva o ruidos intensos molestos,
. feedback negativo o positivo incontrolable,
. fracaso inducido por el experimentador,
. problemas discriminativos irresolubles,
. puzzles irresolubles,
. anagramas irresolubles, etc.
- En la fase de prueba, con animales se emplea condicionamiento de escape y evitación o laberintos. Con humanos:
. resolución de anagramas,
. terminación de ruidos intensos y
. tareas de decisión léxica.
Las medidas más utilizadas han sido:
- para aspectos motivacionales: latencia de respuesta,
- para aspectos emocionales: cuestionarios y observación conductual, y
- para aspectos cognitivos: autoinformes, numero de ensayos para resolver problemas, número de errores, etc.
6.5.2. Efectos o resultados de la indefensión aprendida
a) Déficits
En cuanto a los efectos de la indefensión aprendida, Seligman (1975) señala tres tipos de déficits:
- Déficit motivacional: "Los acontecimientos incontrolables disminuyen la motivación para iniciar respuestas voluntarias que controlan otros acontecimientos" (p. 62).
- Déficit cognitivo: Una vez que se ha experimentado la incontrolabilidad resulta difícil aprender o
percibir la eficacia de la respuesta (la incontrolabilidad distorsiona la percepción del control).
- Déficit emocional: Dicho déficit se define operacionalmente por la mayor incidencia de úlceras y otra
serie de trastornos psicofisiológicos.
Tema 5: Condicionamiento instrumental. Control de estímulo y condicionamiento con estimulación aversiva
275
b) Generalización o transferencia
Una vez inducida indefensión, se podrá transferir a otras situaciones incluso dándose las siguientes
características (Ferrándiz, 1989):
- Siempre que en la fase de transferencia se empleen también estímulos punitivos.
- Puede haber transferencia de una situación traumática (descarga eléctrica) a otra no traumática (prueba de laberintos).
- Puede darse de tareas instrumentales (ruido inescapable) a tareas cognitivas (prueba irresoluble de
anagramas).
6.5.3. Condiciones para la adquisición de la indefensión aprendida
a) No contingencia R - C
Es fundamental la experiencia de no relación entre estimulación aversiva y respuesta, hasta el extremo que determina la variable clave de la indefensión aprendida que es la incontrolabilidad. En este
contexto, la controlabilidad es el estado psicológico según el cual el sujeto percibe hasta qué punto su
acción controla o predice los acontecimientos. Si determinados acontecimientos se perciben como independientes de la respuesta entonces son "incontrolables", es decir, que ocurrirán haga lo que haga el
sujeto. Si el acontecimiento afecta aversivamente al sujeto y lo percibe como no controlable entonces
se inducirá indefensión.
b) Locus de control
En líneas generales, sujetos con locus de control externo (o aquellos que creen que los refuerzos o
castigos ocurren por azar o por circunstancias “ajenas a su voluntad” y que no son controlables),
muestran mayor indefensión que los sujetos con locus de control interno (que creen que pueden "controlar" el refuerzo y que los premios o los castigos dependen de sus esfuerzos y/o capacidades). Estos
últimos tardan más en inducir indefensión por pérdida de autoestima.
c) Autocontrol
Determinadas conductas de autocontrol como el autorrefuerzo durante la fase de prueba dificultan
la inducción de indefensión.
d) Estimulación aversiva inescapable repetida y previa
En determinadas circunstancias el procedimiento de indefensión aprendida -y los déficits a él asociados- pueden evitarse si el entrenamiento previo en estimulación aversiva es más prolongado de lo
habitual entonces no se produce indefensión. A este fenómeno lo denominó N. E. Miller endurecimiento (toughening up). Es un fenómeno descubierto en el laboratorio de Miller y descrito por Gray
(1988; trad. cast. 1993, p. 150) en estos términos:
“Si el adiestramiento en la caja lanzadora era precedido, no de una única sesión de choque inescapable, sino de 15 sesiones, una diaria durante 15 días, el efecto disruptivo de la última sesión de choque en la respuesta de la caja lanzadora
quedaba completamente eliminado (...). Hay que hacer notar que durante las repetidas sesiones de choque inescapable
que permiten el “endurecimiento”, no hay recompensas con las que el choque pueda ser asociado. Así, el endurecimiento
parece ser un proceso no asociativo: el choque pierde su capacidad de desorganizar la conducta simplemente por el hecho
de ser administrado de manera repetida”.
276
Universidad de Murcia. Grado Psicología. Asignatura: Aprendizaje, 6 cr. 2º curso, 1º. cuatr., curso 2010/11
El mismo autor sugiere que el endurecimiento es una posible explicación a la “tolerancia al estrés”.
6.5.4. Por qué ocurre la indefensión aprendida (teorías explicativas)
a) Teorías iniciales
TEORÍA DE LA INDEFENSIÓN APRENDIDA DE SELIGMAN
Un organismo en una situación de incontrolabilidad forma unas expectativas específicas negativas
(haga lo que haga no conseguirá evitar la estimulación aversiva) y tiene unas consecuencias conductuales (triple déficit antes citado). Por tanto hay tres elementos fundamentales (Ferrándiz, 1989):
- información sobre la no contingencia,
- representación cognitiva de la situación (aprendizaje, expectativa, percepción o creencia), y
- déficits.
TEORÍA DE LA INACTIVIDAD APRENDIDA
Esta teoría, formulada por varios autores, surge como reacción a la anterior objetándole su recurso
a constructos inobservables (expectativas) y por tanto se trata en este caso de una interpretación más
acorde con las teorías tradicionales del aprendizaje. Según esta teoría, el sujeto ejecuta peor un aprendizaje posterior de escape (recordemos que en la situación experimental de la caja de saltos, tras la exposición a shocks no contingentes se permitía situaciones de escape) por haber aprendido a ser inactivo durante la fase anterior de shocks inescapables. Dicha inactividad aprendida es incompatible con
respuestas tales como "saltar", "apretar palancas", etc. y por tanto interfiere en el aprendizaje posterior.
TEORÍA DE LA INACTIVIDAD INDUCIDA POR ESTRÉS
Se refiere al hallazgo de Weiss (1968) de una reducción del nivel de norepinefrina (metabolito de la
noradrenalina que es una catecolamina y neurotransmisor que interviene en las sinapsis; es excitatorio
y pertenece al sistema simpático) al someter al sujeto a shocks inescapables. Por tanto explica el
fenómeno de la indefensión mediante un mecanismo neuroquímico, sobre todo con estimulación aversiva de alta intensidad (si es de baja intensidad intervendría la teoría anterior).
b) Reformulaciones recientes de la indefensión aprendida en humanos
Según Vazquez y Polaino (1982), puede decirse que desde 1978 se ha producido un giro diferente
en las teorías de la indefensión aprendida. En concreto, se ha reforzado el papel de variables cognitivas
tales como el locus o “lugar de control” y las atribuciones (véase Capítulo 2). Ya Seligman, en su obra
de 1975 proponía un mediador cognitivo que eran las expectativas de no control o de incontrolabilidad. Las reformulaciones aparecidas entre 1978 y 1980 (Abramson, Seligman y Teasdale, 1978;
Abramson, Garber y Seligman, 1980), ofrecen una explicación más detallada y plausible de los mecanismos de formación de dichas expectativas de incontrolabilidad. En concreto, se introduce la variable
"atribución" (una atribución es la causa percibida de un evento) entre la percepción de no contingencia
y la expectativa de no contingencia futura. Es decir, la situación actual de fracaso o problemas no escapables sirve de atribución causal para igual situación futura. Según Vazquez y Polaino, la adquisición de indefensión aprendida seguiría los siguientes pasos o etapas:
1º, situación de no contingencia objetiva entre respuesta y consecuencia aversiva (la respuesta no hace
cesar la estimulación aversiva)
Tema 5: Condicionamiento instrumental. Control de estímulo y condicionamiento con estimulación aversiva
277
2º, percepción de no contingencia presente y pasada (el sujeto podría pensar: “hasta ahora todo lo que
hago no me sirve para resolver el problema)
3º, atribución de no contingencia pasada y futura (“mis acciones no resuelven ni resolverán el problema”)
4º, expectativa de no contingencia futura (“haga lo que haga no resolveré el problema”)
5º, síntomas de indefensión.
En este nuevo esquema, el mecanismo por el cual se establece la expectativa de no contingencia
(consistente en el convencimiento de sujeto de que en el futuro la respuesta no causará el cese de la estimulación aversiva por tanto no se responde) es la atribución de no causalidad entre la respuesta y la
estimulación nociva (la respuesta no causa el cese de la estimulación aversiva).
El nuevo modelo no puede explicar la indefensión en especies infrahumanas pero sí es útil y aplicable a la indefensión en humanos, en donde las teorías anteriores no podían explicar dos fenómenos
específicos como son:
- la generalidad y la cronicidad de los déficits y
- la pérdida de autoestima.
Esta pérdida de autoestima resulta en principio algo paradójico pues si el sujeto percibía que ninguna respuesta era eficaz no tenía por qué sentirse dañado. Pero, como apuntan Vázquez y Polaino
(1982), es posible que el individuo indefenso piense no ya que toda respuesta posible tenga consecuencia alguna en el medio, "sino que puede que crea que sólo él mismo carece de ella" (p. 74) por
falta de inteligencia, capacidad, etc.
Habrían pues dos tipos de atribuciones:
- Atribuciones de no causalidad respuesta - consecuencia (la respuesta no produce consecuencias favorables de cese del problema o estimulación aversiva).
- Atribuciones de carencia de respuesta apropiada (no dispongo de respuestas para resolver el problema.
Según esto, la atribución de no causalidad sería más probable en individuos con locus de control
externo (atribuyen la causa del problema a algo externo a ellos) mientras que la atribución de carencia de respuesta apropiada sería más propio de sujetos con predominio de locus de control interno.
La reformulación de Seligman no sólo admite el papel de la atribución causal sino la existencia de
estilos atributivos en cada sujeto. Hay estilos atribucionales que infligen al sujeto una mayor vulnerabilidad a la indefensión que otros. Ya vimos en el Capítulo 2 la propuesta de Seligman y colaboradores
relativa a las tres dimensiones del estilo atribucional:
- Interna / externa
- Estable / inestable
- Global / específica
Tal y como se explicaba en aquel capítulo, un perfil atribucional interno - estable - global será el
de peor pronóstico para inducir una actitud de indefensión o incluso estados depresivos. El perfil externo- inestable - específico será el más favorable tras una situación de incontrolabilidad o de
fracaso -véase el Capítulo 11 de Steiner (1988; trad. cast. de 1990) o Klein (1991; trad. cast. de 1994,
pp. 322-331) para una ilustración con ejemplos al respecto y en el apartado 7.2.2.a, en el Anexo 2 del
Capítulo 1-.
Hay otros matices observados en cada estilo atribucional. Así:
- Si la atribución es estable los déficits serán más crónicos que si es inestable.
- Los externos no tienen pérdida de autoestima (no son los responsables de sus fracasos) y sí los internos.
278
Universidad de Murcia. Grado Psicología. Asignatura: Aprendizaje, 6 cr. 2º curso, 1º. cuatr., curso 2010/11
6.5.5. Repercusiones aplicadas de la indefensión aprendida
a) Teóricas
Habría que resaltar dos: Por un lado demuestra que la no contingencia produce un tipo de aprendizaje pasivo (se aprende a no hacer nada), hasta ahora no demostrado en condicionamiento clásico ni en
condicionamiento instrumental (Maldonado, 1982) y, por otra parte, se propone una teoría general del
condicionamiento instrumental desde una perspectiva cognitiva, abriendo nuevos cauces a la investigación.
b) Prácticas
La principal aplicación práctica se ha centrado en la explicación de la adquisición de la conducta
depresiva. El mismo Seligman (1975), propuso una explicación de la depresión basada en la indefensión aprendida dada la similitud entre los síntomas de la depresión y los efectos conductuales de la indefensión aprendida, tal y como se ve de forma patente en la siguiente Tabla 3 (Maldonado, 1982). Este autor viene a decirnos que la depresión en humanos se produce por la expectativa de una incapacidad para controlar los eventos, al igual que en la indefensión.
Pero no sólo tiene una aplicabilidad clínica. También se ha propuesto como etiología de algunos
fracasos escolares. En efecto, el niño que suspende asignaturas a pesar de su esfuerzo en estudiar puede adquirir un estado de indefensión aprendida que le provoque una dificultad añadida importante para
lograr superar esta problemática.
Las soluciones a esta problemática no son simples, aunque algunos autores se aventuran por esa
línea. Por un lado, habría que incidir en fortalecer la autoeficacia o competencia percibida que, según
Bandura (1986) permite a las personas continuar a pesar de un fracaso; por otro lado, Klein (1991)
menciona las ventajas de tener un enfoque optimista de los problemas y sus soluciones, en contraposición a un enfoque pesimista inductor de indefensión.
Tabla 3: Similitud de síntomas de la depresión y la indefensión aprendida (adaptado de Maldonado, 1982).
DEPRESION
INDEFENSION APRENDIDA
1. Pasividad ................................................................. 1. Pasividad
2. Conjunto de pensamientos negativos ..................... 2. Déficits cognitivos (dificultades en
(pesimismo)
aprendizajes de respuestas de éxito)
3. Curso de tiempo ...................................................... 3. Curso de tiempo
4. Hostilidad introyectada ............................................ 4. Pérdida de agresión
5. Pérdida de peso, apetito, déficits ............................ 5. Pérdida de peso, apetito, déficits
sociales y sexuales
sociales y sexuales
6. Decremento de norepinefrina .................................. 6. Decremento de norepinefrina
Tema 5: Condicionamiento instrumental. Control de estímulo y condicionamiento con estimulación aversiva
279
7. PRÁCTICAS DE AUTOEVALUACIÓN DEL TEMA 5
5-1: Cuando se responde a la relación entre dos o más estímulos, más que a sus propiedades absolutas, hablamos de:
a) Contraste.
b) Desviación del vértice.
c) Encadenamiento.
d) Transposición.
5-2: Un niño ha aprendido a llamar “papá” a todos los hombres, pero cuando hace esto ve que únicamente un hombre le responde y los
otros no. Este refuerzo diferencial le permitirá al niño establecer adecuadamente:
a) La discriminación.
b) El control de estímulos.
c) El desvanecimiento.
d) a y b son ciertas.
5-3: Generalización y discriminación son:
a) Procesos independientes entre sí.
b) Procesos directa y positivamente relacionados.
c) Extremos de un continuo.
d) Dos parámetros de medida de la fuerza de una respuesta.
5-4: Una mujer es maltratada por su marido cada vez que éste llega borracho a casa. Esta mujer está sometida a un modelo de:
a) Castigo por aplicación.
b) Condicionamiento de escape.
c) Entrenamiento de omisión.
d) Indefensión aprendida.
5-5: Cuando existe relación de causalidad entre una respuesta y la consecuencia de eliminar un estímulo agradable, hablamos de:
a) Condicionamiento de recompensa.
b) Escape o evitación.
c) Castigo por supresión.
d) Entrenamiento de omisión.
5-6: ¿Cuál de las siguientes NO es una condición adecuada para la aplicación del castigo en humanos?:
a) Hacer una descripción verbal de la contingencia del castigo.
b) Aplicarlo inmediatamente tras la conducta.
c) Introducirlo gradualmente para evitar un excesivo trauma emocional.
d) Castigar todas y cada una de las respuestas problema.
280
Universidad de Murcia. Grado Psicología. Asignatura: Aprendizaje, 6 cr. 2º curso, 1º. cuatr., curso 2010/11
Anotaciones y observaciones