Download so MICHAEL DOMJAN Y BARBARA BURKHARD

Document related concepts

Condicionamiento clásico wikipedia , lookup

Condicionamiento del parpadeo wikipedia , lookup

Iván Pávlov wikipedia , lookup

Estímulo (psicología) wikipedia , lookup

Enseñanza programada wikipedia , lookup

Transcript
1
MICHAEL DOMJAN Y BARBARA BURKHARD
PRINCIPIOS DE APRENDIZAJE Y
CONDUCTA
CAPITULO 3 : “EL CONDICIONAMIENTO CLÁSICO : FUNDAMENTOS”
PAVLOV Y LOS PRIMEROS AÑOS DEL CONDICIONAMIENTO
CLASICO
El condicionamiento clásico se sigue asociando todavía hoy, cincuenta años después de su
muerte, con el nombre y el trabajo de Ivan Pavlov. Pavlov comenzó sus investigaciones en
Rusia a finales del siglo XIX. El fenómeno del condicionamiento clásico fue también
descubierto independientemente por Edwín B. Twitmyer, en 1902, en la lectura de su tesis
doctoral que presentó en la Universidad de Pennsylvania (véase Twitmyer, 1974). Sin embargo,
Twitrnyer no llevó a cabo un programa extenso de investigación, y sus hallazgos fueron
ignorados durante muchos años. Aunque los escritos de Pavlov se difundieron ampliamente en
los Estados Unidos, la crítica académica más minuciosa y la comprobación de sus ideas las
realizaron por primera vez, en Polonia, Konorski y sus colaboradores (véase Konorski, 1948).
Las investigaciones de Pavlov sobre condicionamiento clásico eran una prolongación de sus
investigaciones sobre los procesos de la digestión. Gran parte de su trabajo sobre
condicionamiento tenía relación con las acciones de las glándulas salivares. La mayoría de las
personas asocian la digestión antes que nada con las actividades del estómago y de los intestinos.
Sin embargo, la digestión empieza en la boca, donde la comida se mastica y se mezcla con la
saliva. Así pues las glándulas salivares son las primeras glándulas que intervienen en la
descomposición de la comida. Son unas glándulas grandes y tienen unos conductos cerca de la
superficie, que se pueden observar fácilmente. Los conductos de las glándulas submaxilares, por
ejemplo, están situados a lo largo de cada lado del fondo de la boca, unos al lado de otros,
liberando saliva cerca de los dientes inferiores. (Se pueden ver con claridad esos conductos
mirando debajo de la lengua con un espejo.) Los submaxilares pueden separarse fácilmente del
tejido que le rodea. Se pueden extraer haciendo una incisión en el fondo de la boca y luego
coserlos con un punto a la superficie exterior de la piel. Con esta modificación quirúrgica, las
secreciones de las glándulas se pueden recoger, medir y analizar (véase la figura 3.1).
El interés inicial de Pavlov por las funciones digestivas estaba relacionado con temas puramente
fisiológicos. Estaba interesado en los sistemas neurológicos responsables de la salivación que
provocaba la comida en los perros. Sin embargo, encontró que los perros que había utilizado en
varios experimentos no esperaban para salivar a que se les colocara la comida en la boca:
empezaban a salivar en cuanto veían la comida. Esta salivación anticipatoria le dificultó el
estudio de la salivación como respuesta a la comida. Si el perro se ponía a salivar antes de que se
le presentara la comida, esta secreción no se podía atribuir fácilmente a la presentación de la
comida. Enfrentados a ese problema, científicos menos astutos que Pavlov podrían haber
restringido su investigación a animales menos habituados a la situación experimental y que no
producían una salivación anticipada. Pavlov, en cambio, redefinió los objetivos de su
investigación y comenzó una extensa investigación acerca de los mecanismos que controlan la
salivación anticipatoria . (Paylov, 1927).
2
3
¿Por qué los perros con una experiencia previa comienzan a salivar antes de recibir la Comida?
Uno de los primeros estudiantes de Pavlov que trabajó en el problema, Anton Snarsky, sugirió
que la visión de la comida hacía que los perros pensaran en ella y esto producía una salivación
anticipatoria- Pavlov rechazó esta interpretación por ser mentalista, y consideró, en cambio, la
salivación anticipatoria como la manifestación de una nueva respuesta refleja, provocado por el
estímulo de la comida.
Si se asume que la salivación anticipatoria de los perros con una experiencia previa es
una reacción a los estímulos que se presentaron emparejados con la comida, surgen
entonces numerosas cuestiones experimentales. ¿Qué clase de estímulos pueden llegar a
producir salivación? ¿De qué forma adquieren los estímulos la capacidad de provocar
salivación? Los estímulos que llegan a producir una salivación anticipatoria, ¿pierden
alguna vez esta función? ¿Pueden los animales aprender a inhibir, o suprimir, la salivación
en respuesta a un estímulo, de la misma forma que pueden aprender a producirla? Pavlov
dedicó la última parte de su carrera científica a responder a preguntas como éstas, y a lo
largo de dicho proceso realizó gran cantidad de descubrimientos sobre los mecanismos del
condicionamiento clásico.
EL PARADIGMA DEL CONDICIONAMIENTO CLASICO
La mayoría de las personas están familiarizadas con el procedimiento que Pavlov utilizó para
estudiar la salivación anticipatoria. En el procedimiento intervenían normalmente dos estímulos
importantes. Uno de ellos era un ruido o una luz que se encendía. En su primera presentación,
estos estímulos podían provocar una respuesta de orientación, pero no producían salivación. El
otro estímulo de la situación fue la comida o el sabor de una solución ácida colocada en la boca.
En contraste con el primer estímulo, el segundo provocaba no sólo movimientos de orientación,
sino también una fuerte salivación, incluso la primera vez que se presentaba. Pavlov se refirió
al tono o a la luz como estímulo condicional debido a que la capacidad de este estímulo para
provocar salivación dependía de (estaba condicionada a) que se presentara repetidamente
junto a la comida. Por el contrario, el estímulo de la comida o del sabor ácido fue
denominado estímulo incondicional porque su capacidad para provocar salivación no
dependía de que los sujetos tuvieran un entrenamiento previo. A la salivación producida
eventualmente por el tono o la luz se le llamó respuesta condicional, y a la salivación
producida siempre por la comida o el sabor ácido se le llamó respuesta incondicional. Así
pues, los estímulos y respuestas cuyas propiedades y aparición no dependían de un
entrenamiento previo fueron llamados incondicionales; a los estímulos y respuestas cuyas
propiedades y aparición dependían de un entrenamiento especial se les llamó
«condicionales.
EL CONDICIONAMIENTO DEL PARPADEO EN LOS CONEJOS
El paradigma del condicionamiento del parpadeo en los conejos fue desarrollado por Gormezano.
Se suelen utilizar conejos albinos. Gormezano los escogió para estudiar la respuesta de parpadeo
porque los conejos rara vez parpadean si no ha existido un entrenamiento especial. Por tanto, si
se observa que el animal parpadea después de la presentación de un estímulo, puede casi
asegurarse que la respuesta ocurrió a causa del estímulo, y que de otra manera no se hubiera
producido.
4
5
En los experimentos de condicionamiento del parpadeo se coloca al conejo en un soporte de
plástico, como muestra la figura 3.2. La cabeza del animal sobresale del soporte y se sujeta un
extremo de hilo fino al párpado superior del ojo. El otro extremo del hilo va unido a un pequeño
potenciómetro. Los movimientos del párpado producen movimientos en el potenciómetro y éstos
se transforman en señales eléctricas que permiten un registro preciso de las respuestas de
parpadeo. El estímulo incondicionado es un soplo de aire en la superficie del ojo, o una breve
descarga (de 1 seg, por ejemplo) en la piel de debajo del ojo. Los animales parpadean
rápidamente como respuesta al EI. Se han utilizado distintos estímulos como EC, entre los que
se incluyen luces, tonos o la vibración del abdomen del animal con un aparato manual para
masajes.
En el experimento típico de condicionamiento, el estímulo condicionado se presentaba durante
500 mseg y terminaba con la aparición del estímulo incondicionado. El estímulo incondicionado
da lugar a que los párpados se cierren fuerte y rápidamente. Cuando el EC se presenta
emparejado con EI de forma repetida, la respuesta de parpadeo también llega a darse con el EC.
En el procedimiento normal, los investigadores registran en cada prueba si el parpadeo tiene
lugar durante el EC, antes de que se presente el EI. Los datos se presentan en términos del
porcentaje de ensayos en los que se observa la RC, considerando bloques de pruebas.
El condicionamiento de parpadeo es, con frecuencia, un proceso relativamente lento, y aun en el
caso de sujetos sometidos a un entrenamiento intenso no aparecen respuestas condicionadas en
todos los ensayos.
CONDICIONAMIENTO DEL MIEDO
El condicionamiento del miedo se estudia habitualmente con ratas y, más raramente, perros. En
la mayoría de los experimentos, el estímulo aversivo incondicionado es una descarga eléctrica en
los pies, enviada a través de un suelo metálico enrejado. La intensidad de la descarga es
considerablemente mayor que la que se utiliza en el condicionamiento del parpadeo.
El estímulo condicionado suele ser un tono o una luz que se enciende, y el miedo
condicionado se mide indirectamente midiendo la forma en que el estímulo condicionado al
miedo altera la actividad que está llevando a cabo el animal.
Una técnica de medida indirecta del miedo condicionado se denomina procedimiento de la
respuesta emocional condicionada (o supresión condicionada), que se abrevia REC. Este
procedimiento, ideado por Estes y Skinner (1941), se ha utilizado desde entonces ampliamente en
los estudios de condicionamiento pavloviano (Kamin, 1965). El animal más utilizado en los
experimentos de supresión condicionada es la rata. A los animales, colocados en una cámara
experimental pequeña, se les entrena primero a presionar una palanca para obtener comida como
premio . Tras un entrenamiento suficiente de presión de la palanca, llegan a presionar la palanca
a un ritmo estable, obteniendo un premio de comida cada 2 o 3 min. La fase de
condicionamiento clásico del experimento se inicia una vez que las respuestas de presión de
la palanca han quedado bien establecidas. La duración del EC es, por lo general, más larga
que en el condicionamiento del párpado de los conejos (3 min, por ejemplo), y asimismo, el EI
de descarga es normalmente más largo (5 seg, por ejemplo). El procedimiento típico de
condicionamiento implica la presentación del EI de descarga al final del estímulo condicionado.
El intervalo entre pruebas suele ser de 15 a 30 min.
Se hace evidente el progreso del condicionamiento del miedo cuando el estímulo condicionado
desbarata la respuesta de presión de la palanca para obtener comida. Si el sujeto no se ha
encontrado antes con el estímulo condicionado, la primera vez que éste se presenta puede
aparecer una ligera desorganización de la respuesta de presión de la palanca. Si el EC no se
presenta junto con la descarga, esa ligera supresión de la respuesta inicial se habitúa. Antes de 3
ó 4 ensayos, el EC no tiene efecto alguno en la conducta de la rata. Sin embargo, si el EC se
empareja con la descarga en el pie, inmediatamente queda condicionado a la descarga, y el
animal suprime la respuesta de presión de la palanca en cuanto se presenta el EC. Si la
intensidad de la descarga es eficaz, en 3 o 5 ensayos de condicionamiento, la supresión
condicionada de las respuestas de presión de la palanca puede llegar a ser completa (Kamin y
Brimer, 1963). Los animales pueden no presionar la palanca en absoluto cuando se presenta el
EC. La supresión de la respuesta, sin embargo, es específica para el EC. En cuanto cesa el EC,
el animal reanuda la conducta premiada con comida.
6
El grado de supresión de la respuesta producida por el estímulo condicionado se calcula
normalmente dividiendo el número de respuestas de presión de la palanca que el sujeto da
durante el EC por la suma del número de respuestas que da durante el EC, y las que da durante
un período de tiempo igual de largo, antes de la presentación del EC. La fórmula es:
RAZÓN DE SUPRESIÓN =
RESPUESTAS AL EC.
RESPUESTAS AL EC. + RESPUESTAS ANTES DEL EC
7
Este índice tiene un valor de cero si el sujeto deja de presionar la palanca por completo
durante la presentación del EC, porque el numerador de la razón es cero. En el extremo opuesto,
si la rata no altera en absoluto su ritmo de presión de la palanca cuando se presenta el EC, el
índice adquiere un valor de 0,5. Se puede confirmar esto considerando algunos casos hipotéticos.
Por ejemplo, supongamos que el EC se presenta durante tres minutos y que en un período normal
de tres minutos la rata da 45 respuestas. Si el estímulo condicionado no altera la conducta de
presión de la palanca, el animal dará 45 respuestas durante el EC, de forma que el numerador de
la razón será 45. El denominador será 45 (las respuestas del EC) +45 (las respuestas anteriores al
EC), es decir, 90. Por tanto, la razón será 0,5. Los valores de razón entre 0 y 0,5 indican grados
decrecientes de supresión de la respuesta, o de miedo condicionado.
EL SEGUIMIENTO DEL SIGNO
Otro procedimiento para el estudio del condicionamiento clásico que ha ensanchado nuestra
perspectiva del condicionamiento clásico es el que se denomina Seguimiento Del Signo O
Automoldeamiento.
Los animales tienden a acercarse y contactar con aquellos estímulos que señalan la disponibilidad
de la comida. En el ambiente natural, la disponibilidad de comida viene indicada normalmente
por algún aspecto de la comida misma. Al aproximarse y contactar con las señales de la comida,
los animales se ponen, en realidad, en contacto con la comida. Para un depredador, por ejemplo,
la vista, los movimientos, el olor y quizá los ruidos de la presa son señales que indican la
posibilidad de alimento. Siguiendo esos estímulos, es probable que el depredador coja su presa.
El seguimiento de signo se puede investigar en el laboratorio presentando un estímulo discreto y
localizado, justo antes de cada entrega de una pequeña cantidad de comida. El primer
experimento de este tipo fue realizado por Brown y Jenkins (1968) con palomas. Los animales
fueron colocados en una cámara experimental con una pequeña tecla circular que se podía
iluminar y que las palomas podían picotear (véase figura 3.5).
8
A los animales se les daba periódicamente una pequeña cantidad de comida. Inmediatamente
antes de cada entrega de comida, la tecla se iluminaba durante ocho segundos. Las palomas no
tenían que hacer nada para que se presentara la comida. La comida se suministraba
automáticamente después de cada iluminación de la palanca, independientemente de lo que el
animal hiciera. En caso de que los animales tuvieran hambre, se podía predecir que, cuando
vieran la tecla iluminada, irían al plato de comida y esperarían la siguiente presentación de
comida.
Curiosamente, sin embargo, no fue esto lo que ocurrió. En vez de valerse de la luz para
averiguar el momento de ir al plato de comida, las palomas comenzaron a picotear la propia
tecla. Esta conducta era llamativa porque no se requería que picotearan la tecla para obtener
comida en esta fase del experimento.
Estos experimentos han mostrado que el seguimiento del signo es una técnica muy útil para
investigar la manera en que se aprenden las asociaciones entre un estímulo y otro. En los
experimentos de seguimiento del signo con palomas, el estímulo condicionado es la
iluminación de una tecla, y el estímulo incondicionado es la presentación de comida. Como
ocurre en otros procedimientos de condicionamiento, se da el aprendizaje más rápidamente
cuando se presenta el EC justo antes del El, y el aprendizaje no tiene lugar si el EC y el EI
se presentan de forma aleatoria, uno respecto del otro (Gamzu y Williams, 1971, 1973).
Cada extremo del corredor tenía un disco circular que se podía iluminar. La presentación de
comida venía siempre precedida por la iluminación del disco de un extremo del corredor. El
estímulo visual del extremo opuesto no estaba correlacionado con la comida. Es importante
señalar otro aspecto del experimento. Una vez que se presentaba, la comida estaba disponible
sólo 4 segundos. Por tanto, si el animal no iba al recipiente de la comida durante esos cuatro
segundos, no conseguía comida en ese ensayo.
Después de que se repetía varias veces la presentación de una luz encendida en un extremo del
corredor junto con el suministro de comida, las palomas comenzaban a hacer una cosa bastante
llamativa: en cuanto se encendía la luz corrían a ese extremo del corredor, picoteaban el disco
iluminado y luego corrían al centro del corredor a coger la comida. Como el corredor era muy
largo, las palomas no siempre regresaban al plato de comida del centro antes de que
desapareciera. Esta conducta de seguimiento del signo resultaba sorprendente porque era
totalmente innecesaria. Los animales no tenían que picotear el disco iluminado para conseguir el
premio de comida. Podían haberse sentado en medio del corredor y esperar simplemente su
ración de cada ensayo- El hecho de que no lo hicieran, prueba la atracción que ejercen las señales
condicionadas clásicamente cuando el premio es la comida. Por el contrario, los sujetos no se
acercaron de forma constante a la luz del otro extremo de la caja, la cual no estaba correlacionada
con las presentaciones de la comida (véase Boakes, 1979).
El seguimiento de signo o señal es también evidente en la conducta humana. Mucha gente
mientras sube en el ascensor mira los números de los botones cuando se encienden indicando el
piso por el que se está pasando. El hecho de mirar fijamente los números de los pisos no hace que
el ascensor llegue más rápido a su destino, exactamente igual que el picotear la señal de la
comida en el experimento de la caja alargada no adelanta la obtención de comida. Los números
del ascensor son signos de cuándo se van a abrir las puertas. Estimulan una conducta de
«seguimiento» debido a su significación informativa. Las personas siguen la de aquellos
estímulos que suministran información acerca de unos hechos importantes y prometedores, de la
misma que las palomas siguen la iluminación de una tecla que señala la presentación de comida.
EL APRENDIZAJE DE AVERSIÓN AL SABOR
La técnica del condicionamiento de aversión al sabor consistía en dar de beber a los animales una
solución con sabor, y se hizo que enfermaran inyectándoles una droga o exponiéndoles a una
radiación aversiva. Debido a que experimentan los efectos de la enfermedad tras la exposición al
sabor, los animales adquieren una aversión al sabor. La preferencia por una solución con sabor y
su ingestión voluntaria se suprimen con el tratamiento de condicionamiento.
El aprendizaje de aversión al sabor es el resultado de presentar unidos el EC (en. este caso un
sabor) y el EI (la inyección de la droga o la exposición a una radiación), exactamente igual que
en otros muchos ejemplos de condicionamiento clásico.
El aprendizaje de aversión al sabor difiere de otras situaciones o aspectos importantes.
En primer lugar, se puede aprender una fuerte aversión al sabor con el primer
emparejamiento de sabor y enfermedad. Aunque el aprendizaje con un solo ensayo se observa
también en el condicionamiento del miedo, el aprendizaje con un solo ensayo rara vez se
observa, si es que se llega a observar, en el condicionamiento del parpadeo, en el
condicionamiento salivar y en el seguimiento del signo. La segunda característica diferencial
9
del aprendizaje de aversión al sabor , es que el aprendizaje se produce aun en el caso de que
el animal se ponga enfermo hasta varias horas después de la exposición a un sabor.
El intervalo entre el EC y el EI en el condicionamiento de parpadeo por ejemplo, es
normalmente menor de un segundo porque se da muy poco condicionamiento, si es que se llega a
dar, cuando transcurre más tiempo entre los dos acontecimientos. En contraste con los cortos
intervalos entre EC-EI que son necesarios en las situaciones de condicionamiento salivar, de
miedo y de seguimiento del signo, los animales aprenden una aversión a una solución con sabor
aun en el caso de que el estímulo incondicionado no se presente en varias horas (García, Ervin y
Koelling, 1966; Revusky y García, 1970).
10
A MAYOR TIEMPO DE PRESENTACIÓN DEL E.I. CON RESPECTO AL E.C. ,
MENOR SERÁ EL APRENDIZAJE
EL CONDICIONAMIENTO PAVLOVIANO EXCITATORIO
Durante el condicionamiento excitatorio, los sujetos aprenden una nueva respuesta al estímulo
condicionado que es congruente con el estímulo incondicionado. Los perros aprenden a salivar
en respuesta a una campana que precede a la comida, los conejos aprenden a parpadear en
respuesta a un tono que precede a una breve irritación de la piel que rodea el ojo, las ratas
aprenden a paralizarse de miedo como respuesta a una luz o a un tono que precede a una
descarga eléctrica dolorosa; las palomas aprenden a acercarse y picotear una tecla encendida que
precede a la entrega de comida, y las ratas aprenden a evitar el beber la sacarina que precede a la
enfermedad. En todos estos casos, y como resultado del emparejamiento del EC y el EI, el
estímulo condicionado activa o «excita» una respuesta condicionada que era coherente con el EI.
PROCEDIMIENTOS DEL CONDICINAMIENTO EXCITATORIO
1. El condicionamiento simultáneo. La forma más obvia de exponer a los sujetos al EC
emparejado con el EI es presentar los dos estímulos a la vez. Este procedimiento, llamado
condicionamienro simultáneo , es el procedimiento representado en la figura 3.7. El caracter
esencial de este procedimiento es que los estímulos condicionado e incondicionado se
presentan al mismo tiempo.
2. El condicionamiento de demora corta. El EI puede presentarse poco después del EC. Este
procedimiento, llamado procedimiento «de demora corta», es la técnica que se usa con más
frecuencia. El carácter esencial de este procedimiento es que la aparición del EC precede a la
aparición del EI por un período de tiempo corto (menos de un minuto), y que el EI se presenta
durante el EC o inmediatamente después.
3. El condicionamiento de huella. El condicionamiento de huella es similar al procedimiento de
demora corta, excepto que el EI no se presenta hasta que el EC no termina. El intervalo entre
el final del EC y el principio del El se llama intervalo de huella.
11
4. El condicionamiento de demora larga. Este procedimiento también es similar al
procedimiento de condicionamiento de demora corta en el que el EC precede al El. Sin
embargo, en este caso el EC está presente mucho más tiempo (cinco-diez minutos) antes de
que se presente el EI.
5. El condicionamiento hacia atrás. El último procedimiento representado en la figura 3.7
difiere de los demás en que el EC se presenta poco después, en vez de antes, que el EI. A esta
técnica se le llama «condicionamiento hacia atrás»-
MEDICIÓN DE LA RESPUESTA CONDICIONADA
Una técnica consiste en medir la rapidez con que se produce la respuesta condicionada después
de la presentación del estímulo condicionado. Esta medida de la fuerza de la respuesta se llama
Latencia De La Respuesta Condicionada. La latencia es la cantidad de tiempo que transcurre
entre la presentación del estímulo condicionado y la aparición de la respuesta condicionada.
La medida de la latencia de la respuesta puede informarnos del desarrollo del condicionamiento
solamente si la respuesta condicionada tiene lugar antes del EI en ese procedimiento concreto de
condicionamiento. Este puede ser el caso de los procedimientos de demora corta, demora larga y
condicionamiento de huella porque en todos esos casos la respuesta condicionada puede empezar
antes de que se presente el estímulo incondicionado. Sin embargo, en los procedimientos de
condicionamiento simultáneo y hacia atrás, la latencia de la respuesta no puede usarse como un
índice de condicionamiento. En esos casos la conducta observada durante el EC no se debe
claramente sólo a la presencia del EC. Esto es así particularmente en el caso del
condicionamiento simultáneo. Usando tal procedimiento, cualquier conducta observada durante
el EC podría haber estado suscitada por el EI más que por el EC, ya que se presentan al mismo
tiempo. En el condicionamienco hacia atrás, la conducta observada durante el EC puede haber
sido provocada por el EI que ocurrió antes del EC. De la misma forma, las medidas de latencia
de la respuesta en los procedimientos de condicionamiento de demora corta, demora larga y de
huella pueden no indicar el grado de aprendizaje que se ha producido si resulta que la respuesta
condicionada no se materializa hasta después de la presentación del estímulo condicionado.
Una forma de evitar e1 problema descrito arriba es comprobar el grado de condicionamiento
presentando periódicamente el EC solo (sin el EI). En ese caso, las respuestas provocadas por el
EC pueden observarse sin la contaminación de las respuestas provocadas por el EI. Los ensayos
con el EC solo que se introducen periodicamente para medir el alcance del aprendizaje se llaman
Ensayos De Prueba.
Los ensayos de prueba permiten medir no sólo la latencia sino también otros aspectos de la
respuesta condicionada. Cuando Pavlov estudiaba la salivación, por ejemplo, con frecuencia
medía la cantidad de gotas de saliva que eran liberadas. Tales medidas de la intensidad de la
respuesta se dice que reflejan la Magnitud De La Respuesta. Se puede también calcular el
porcentaje de ensayos de prueba con el EC solo en los que se observa una respuesta
condicionada. Esto proprociona un indicador de la Probabilidad De La Respuesta
Condicionada.
LA CONTIGÜIDAD Y LAS RELACIONES DE SEÑAL
ENTRE LOS ESTIMULOS CONDICIONADO E INCONDICIONADO
La idea más simple es que el condicionamiento clásico excitatorio se debe a que el EC y, el EI se
experimentan al mismo tiempo. A esto se le llama Contigüidad Del Estímulo. Se dice que dos
12
acontecimientos son contiguos si ocurren a la vez. Sin embargo, la revisión de los
procedimientos de condicionamiento excitatorio que se describió antes muestra que la simple
noción de la contigüidad del estímulo no proporciona una explicación, adecuada del
condicionamiento clásico. La presentación del EC y el EI al mismo tiempo, como en el
procedimiento de condicionamiento simultáneo, no es particularmente eficaz para producir
condicionamiento excitatorio.
El procedimiento que obtiene más éxito en el
condicionamiento clásico excitatorio es el procedimiento de condicionamiento de Demora
Corta, en el que el EC se inicia ligeramente antes de la presentación del EI.
Los problemas con el principio de contigüidad simple han fomentado también el desarrollo de
ideas alternativas sobre los mecanismos de condicionamiento clásico. Uno de los mas
sobresalientes se basa en la noción de que el condicionamiento clásico implica el aprendizaje
de una relación de señal entre el estímulo condicionado y el incondicionado. De acuerdo con
esta idea, es más probable que los organismos aprendan a dar una respuesta condicionada al EC
si las presentaciones del EC sirven como señal de la inmediata aparición del EI. Los
procedimientos en que el EC no se puede tomar como base para predecir el EI, no suelen facilitar
una rápida adquisición de la respuesta condicionada.
EJEMPLOS DE RELACIONES DE SEÑAL
Cuando pensamos en situaciones de la vida real en que se utilizan señales, podemos valorar
fácilmente lo útil que resulta que un estímulo condicionado prediga el estímulo incondicionado.
Existen muchas situaciones así. Las sirenas, por ejemplo, señalan normalmente la aproximación
de un vehículo de emergencia, como una ambulancia o un coche de bomberos. La sirena es
análoga al estímulo condicionado, y la llegada del vehículo de emergencia es análoga al estímulo
incondicionado. Si oyéramos la sirena siempre justo antes de la llegada de la ambulancia,
aprenderíamos rápidamente a apartarnos de su camino. En ese caso la sirena sería un buen
predictor, o señal, de la llegada de la ambulancia. Este procedimiento es análogo al
procedimiento de condicionamiento de demora corta, en el que el EC es un buen predictor del EI.
Por el contrario, si no oyéramos nunca la sirena hasta que la ambulancia estuviera en escena, no
habría razón para reaccionar ante la sirena. La sirena no nos proporcionaría una información útil
sobre la llegada de la ambulancia. Simplemente nos apartaríamos de su camino cuando llegara.
Este caso es análogo al del procedimiento de condicionarnienro simultáneo, en que la relación de
señal entre el EC y el EI no es muy buena. Tendríamos menos motivos aún para apartarnos del
camino cuando la sirena sonara, si sólo la oyéramos una vez que la ambulancia ya se hubiese ido.
Este caso es comparable al procedimiento de condicionamiento hacia atrás. Si hay algo que se
aprende en estas circunstancias, es que la sirena indica que la ambulancia ha partido.
El análisis es un poco más complicado si la relación entre el sonido de la sirena y la presencia de
la ambulancia es comparable al procedimiento del condicionamiento de huella. En este caso la
sirena pararía antes de que llegara la ambulancia. Por tanto, la presencia de la sirena indicaría
que la ambulancia todavía va a tardar un rato en llegar. El mejor indicador de la llegada de la
13
ambulancia sería, pues, el cese de la sirena. Así, con el procedimiento de huella es más probable
que dejemos paso a la ambulancia cuando la sirena ya no suene.
Sí experimentáramos algo comparable al procedimiento de condicionamiento de demora larga,
oiríamos siempre la sirena mucho tiempo antes de la llegada de la ambulancia. En ese caso,
aprenderíamos a ignorar la sirena al principio de oírla, y, nos preocuparíamos de dejar paso sólo
después de que la sirena llevara sonando un rato. La experiencia de la mayoría de las personas
con las sirenas y los vehículos de emergencia es muy parecida al procedimiento de
condicionamiento de demora larga. Quizá por este motivo los conductores rara vez responden
inmediatamente cuando oyen una sirena mientras van al volante.
14
LA CONTINGENCIA EC-EI
Rescorla resaltó que la calidad de un estímulo como señal de otro depende no sólo del modo en
que los dos estímulos van emparejados, sino también de la cantidad de veces que cada elemento
se da por separado. De hecho, el número de veces que el EC y el EI aparecen solos puede ser
más importante para determinar la intensidad del condicionamiento que la forma en que se
emparejan cuando se presentan juntos. Una segunda idea importante en la que Rescorla puso
énfasis es que las relaciones de señal no necesitan ser siempre positivas: también pueden ser
negativas. Es decir, un estímulo puede señalar la ausencia de otro estímulo de la misma forma
que un estímulo puede señalar la presencia futura de otro hecho.
Las ideas de Rescorla sobre las relaciones de señal quedan resumidas formalmente en su
concepto de la contingencia entre los estímulos condicionado e incondicionado. La contingencia
entre el EC y el EI se determina a partir de la comparación de dos probabilidades, la probabilidad
de que el EI se dé junto al EC, simbolizada como p(EI/EC), y la probabilidad de que el EI se dé
en ausencia del EC, simbolizada como p(El/no EC). Si el EI se presenta sólo con el EC y el EC
nunca se presenta solo, como en el procedimiento de condicionamiento de demora corta, las
apariciones del EI se pueden predecir perfectamente a partir de las apariciones del EC.
Esto ilustra una contingencia positiva perfecta entre el EC y el EI. En términos de las dos
probabilidades que definen la contingencia, el EI ocurre con toda seguridad una vez que el EC ha
ocurrido. Así pues, p(EI/EC) = 1,0. Por el contrario, es absolutamente seguro que el EI no se
dará si el EC no se ha dado aún. Así pues, p(EI/no EC) = 0. Esas dos probabilidades definen
una contingencia positiva perfecta.
Si se puede predecir la aparición del EI a partir de la presencia del EC, es que existe una
contingencia positiva entre los dos estímulos. La contingencia positiva perfecta descrita arriba
ilustra un caso extremo. Podemos predecir el EI a partir del EC siempre y cuando el EI tenga
más probabilidad de aparecer con el EC que sin él. Así pues, se dice que existe una contingencia
positiva entre el EC y el EI siempre y cuando p(EI/EC) sea mayor que P(EI/no EC). Los
cazadores de ciervos, por ejemplo, hacen uso de una contingencia positiva imperfecta cuando
predicen la presencia del ciervo a partir de la visión de sus excrementos. No se ve
invariablemente un ciervo cuando se encuentran excrementos de ciervo. Sin embargo existe una
contingencia positiva entre los dos hechos porque es más probable localizar ciervos en áreas
donde haya excrementos que en otros lugares.
Mientras que la contingencia positiva permite la predicción de un hecho basándose en la
aparición de otro estímulo, no es posible en cambio una predicción de tal naturaleza cuando la
contingencia entre los dos estímulos es cero. Se dice que existe una contingencia cero entre el
EC y el EI si la probabilidad de que se dé el EI con el EC es la misma que sin el EC. Así pues,
en una contingencia cero, p(EI/EC) = p(El/no EC).
También existen contingencias en las que el EC predice la «ausencia» del EI. Tal es el caso
cuando el EI se presenta con más probabilidad en ausencia del EC que en su presencia. Estos
casos suponen una contingencia negativa entre el EC y el EI. En una contingencia negativa
p(EI/EC) es menor que p(EI / no EC).
De la experiencia común se pueden extraer también muchos ejemplos de contingencia negativa.
Por ejemplo, los. médicos utilizan los síntomas de peso, presión sanguínea y ritmo cardiaco
normales para predecir la ausencia de enfermedad, ya que es menos probable que estén enfermas
aquellas personas que presentan valores normales que aquellas cuyo peso, presión sanguínea y
ritmo cardíaco son anormales.
Al especificar que el aprendizaje depende de la contingencia entre el EC y el EI, el modelo de
contingencia destaca que el emparejamiento del EC y el EI no es suficiente para que se produzca
el condicionamiento clásico. No se puede predecir lo que los animales van a aprender, si es que
aprenden algo, a partir de la exposición a un EC emparejado con un EI cierto número de veces.
Por ejemplo, supongamos que a un perro se le presenta un tono cien veces, y alrededor de
cincuenta de esas presentaciones van seguidas inmediatamente por la entrega de comida. En
base a esta información no podernos predecir lo que el perro va a aprender, puesto que no
sabernos qué probabilidades tiene de obtener comida en la situación experimental cuando el tono
está ausente. Si al animal nunca se le da comida en ausencia del tono, existirá una contingencia
positiva débil entre el tono y la comida. En esas condiciones el perro aprenderá a salivar ante el
tono. Sin embargo, si al perro se le alimenta con la misma frecuencia en ausencia del tono que
inmediatamente después del tono, la contingencia entre el EC y el EI será cero. En este caso
puede que el perro aprenda a no hacer nada como respuesta al tono. Por último, si al perro se le
alimenta con más frecuencia en ausencia del tono que inmediatamente después de él, existirá una
contingencia negativa entre el EC y el EI, y el perro puede aprender a considerar el tono como
una señal débil para la ausencia de comida.
EL CONDICIONAMLENTO PAVLOVIANO INHIBITORIO
Aprender que un estímulo señala la ausencia de un EI se denomina condicionamiento inhibitorio.
La inhibición condicionada enseña a los animales a inhibir o retener una respuesta condicionada.
La inhibición de la respuesta condicionada es tan importante en la organización de la conducta
15
como la capacidad de dar respuestas condicionadas. Además, las señales que indican qué
estímulos no van a presentarse, suministran tanta información acerca del mundo como las señales
que le dicen al organismo las que sí van a hacerlo.
PROCEDIMIENTOS PARA EL CONDICIONAMIENTO INHIBITORIO
Un prerrequisito importante al condicionar un estímulo para que señale la ausencia de algún EI
es que este EI se presente periódicamente en la situación experimental. En nuestra vida diaria
existen muchas señales que indican la ausencia de hechos. Los carteles de «cerrado», «no
funciona», «prohibida la entrada», son todos de ese tipo. Sin embargo, esas señales suministran
una información significativa e influyen en nuestros actos solamente si indican la ausencia de
algo que esperábamos ver. Por ejemplo, si nos encontramos con el cartel de «no hay gasolina»
en una gasolinera, nos frustramos y desanimamos, y, por tanto, no entramos. El cartel de «no
hay gasolina» suministra una información importante porque normalmente esperamos que las
estaciones de servicio dispongan de gasolina. Sin embargo, ese mismo cartel carece de interés
para nosotros si se coloca a la puerta de una joyería, y en tal caso, lo más probable es que no nos
disuada de entrar en la tienda a mirar joyas. Este ejemplo ilustra la regla general de que el
condicionamiento inhibitorio y el control inhibitorio de la conducta se dan sólo si existe un
contexto excitatorio para el estímulo incondicionado en cuestión .
1. El procedimiento estándar para la inhibición condicionada.
Pavlov reconoció la importancia de un contexto excitatorio para el condicionamiento de las
tendencias inhibitorias de la respuesta y se preocupó de proporcionar ese contexto elaborando un
procedimiento estándar para condicionar la inhibición . Cuando aparece el EI, uno de los
estímulos condicionados lo anuncia, es el EC+ (un tono, por ejemplo). En el otro tipo de ensayo,
el EC+ se presenta junto con el segundo estímulo condicionado, el EC- (una luz, por ejemplo).
El EI no se presenta en esos ensayos. Los ensayos en que el EC - y el EC + se presentan sin el
EI son ensayos de condicionamiento inhibitorio. El contexto excitatorio para este
condicionamiento lo proporciona la presencia del EC + en los ensayos de condicionamiento
inhibitorio. Al ir emparejado el EC + con el EI en varios ensayos, el EC + se condiciona a
provocar una expectativa de EI. La ausencia del EI en los ensayos de condicionamiento
inhibitorio se produce, por tanto, en un contexto en el que el sujeto espera el EI.
16
El procedimiento de inhibición condicionada estándar es análogo a aquellas situaciones en que
se introduce un elemento que impide un desenlace que de otro modo sería altamente probable.
Un semáforo en rojo en un cruce con mucho tráfico es una señal (EC +) de peligro potencial (el
EI). Sin embargo, si un policía de tráfico nos indica que debemos cruzar la calle a pesar de la luz
roja (quizá porque los semáforos están estropeados), lo más probable es que no tengamos un
accidente. Es probable que la luz roja (EC +) unida a los gestos del agente (EC -) no vaya
seguida de peligro. Los gestos actúan como un EC- para inhibir o bloquear nuestra vacilación en
cruzar la calle a causa de la luz roja.
2. La inhibición diferencial.
Se llama inhibición diferencial a otro procedimiento que se utiliza con frecuencia para lograr la
inhibición condicionada. Este procedimiento es muy parecido al procedimiento estándar descrito
arriba. Como ocurría en el procedimiento estándar, el EI se presenta en algunos ensayos, y su
aparición viene siempre anunciada por la presentación del EC+. En otros ensayos, el EI no se
presenta, y los animales experimentan sólo el EC -. Así pues, el procedimiento de inhibición
diferencial implica dos modalidades de ensayo: EI seguido de EC + y EC - seguido de ausencia
de EI (véase figura 3.9). Como en el procedimiento estándar, el EC- se convierte en estímulo
inhibitorio condicionado.
El procedimiento de inhibición diferencial es análogo a dos semáforos en un cruce, uno rojo y
otro verde. La luz roja (EC +) señala el peligro (EI) de pasar por el cruce, mientras que la luz
verde (EC-) señala la ausencia de peligro (no EI). Si se atraviesa el cruce mientras está
encendida la luz verde (EC-), uno puede confiar en que no va a tener un accidente.
No está tan claro qué es lo que proporciona el contexto excitatorio para que se condicione la
inhibición en el procedimiento de condicionamiento diferencial como lo está en el procedimiento
estándar. En el procedimiento estándar la presencia del EC + en los ensayos iniciales del
condicionamiento inhibitorio provoca alguna expectativa de que aparezca el EI. El EC + no está
presente en los ensayos de condicionamiento inhibitorio del procedimiento de condicionamiento
diferencial. De hecho, esta es la única diferencia importante entre los dos procesos. Sin
embargo, existe otro factor en el procedimiento de condicionamiento diferencial que puede
producir un contexto excitatorio durante los ensayos de condicionamiento inhibitorio (EC-, no
EI)
17
LA MEDIDA DE LA INHIBICIÓN CONDICIONADA
Los sistemas de respuestas bidireccionales.: La identificación de tendencias de respuesta
opuestas es muy fácil con los sistemas de respuesta que pueden cambiar en direcciones opuestas
a partir de una actuación de línea de base (una actuación normal). Esto es habitual en muchas
respuestas fisiológicas. El ritmo cardiaco, la respiración y la temperatura, por ejemplo, pueden
aumentar o disminuir a partir de un nivel normal. Ciertas respuestas comportamentales son
también bidireccionales. Por ejemplo, los animales pueden acercarse a un estímulo o alejarse de
él, y la cantidad de veces que presionan la palanca puede aumentar o disminuir. En esos casos, la
excitación condicionada produce un cambio en la conducta en una dirección, y la inhibición
condicionada produce un cambio de conducta en la dirección opuesta. El procedimiento de
seguimiento del signo es el usado con más frecuencia para demostrar el condicionamiento
inhibitorio de respuestas bidireccionales. Como ya se puso de manifiesto anteriormente, las
palomas se acercan a estímulos visuales que señalan la inminente presentación de comida. Si se
utiliza por el contrario un procedimiento de condicionamiento inhibitorio, de forma que el
estímulo visual se convierte en una señal de ausencia de comida, las palomas se alejan del EC.
También se han obtenido pruebas de condicionamiento inhibitorio de respuestas bidireccionales
usando la técnica de supresión condicionada en las ratas. Como ya se vio, los estímulos que han
sido condicionados para señalar una descarga eléctrica posterior suprimen en las ratas las
respuestas de presión de la palanca con la que obtienen comida. Por el contrario, los estímulos
que han sido condicionados a señalar la posterior ausencia de descarga aumentan la tasa de
respuestas de presión de la palanca para conseguir comida. La preferencia de sabor es otro buen
ejemplo de bidireccionalidad. Ya hicimos la observación de que los animales reducen su
preferencia por los sabores que se han emparejado con una enfermedad. Aumenta su preferencia,
sin embargo, por aquellos sabores que han sido condicionados a predecir la ausencia de
enfermedad .
La prueba del estímulo compuesto o prueba de la sumación: El procedimiento más
versátil para valorar la inhibición es la prueba del estimulo compuesto o prueba de la sumación.
Este procedimiento tuvo una especial divulgación gracias a Pavlov y en las investigaciones
contemporáneas está empezando a ser considerado como el procedimiento más aceptable para
medir la inhibición condicionada.
Las dificultades que crean las respuestas con un bajo nivel de línea de base se superan con la
prueba del estímulo compuesto, ya que se presenta un estimulo excitatorio condicionado que
provoca la respuesta condicionada. La inhibición condicionada se mide entonces en términos de
reducción o inhibición de estas respuestas condicionadas. Así pues, la prueba consiste en
observar los efectos de un EC inhibitorio «en composición» con un EC + excitatorio. Otra forma
de considerar el procedimiento es observar la «sumación» de los efectos de un estímulo
inhibitorio (EC-) y un estímulo excitatorio (EC+).
18
La prueba del retraso en la adquisición: Otra prueba indirecta usada frecuentemente
para medir la inhibición condicionada es la prueba del retraso en la adquisición. El fundamento
de esta prueba es también bastante sencillo: si un estímulo inhibe activamente una respuesta
concreta, sería extremadamente difícil condicionar ese estímulo para que provocara esa misma
conducta. En otras palabras, el ritmo de adquisición de una respuesta condicionada concreta
debería retrasarse si el estímulo provoca inicialmente una inhibición de la respuesta.
Aunque en las Investigaciones sobre inhibición condicionada se ha empleado con frecuencia la
prueba del retraso en la adquisición, los estudios recientes sugieren que esta prueba no es tan útil,
para valorar la inhibición condicionada, como la prueba del estímulo compuesto. Una dificultad
seria es que son muchos los factores que pueden retrasar el curso del condicionamiento clásico
excitatorio.
LA EXTINCION
Del mismo modo que les conviene a los animales aprender nuevas respuestas a los estímulos, es
adaptativo para ellos que decrezca esa conducta una vez que las circunstancias ya no precisan de
ella. El proceso por el que las respuestas condicionadas a los estímulos van decreciendo se
llama extinción. El proceso para extinguir un estímulo condicionado es presentar repetidamente
el EC sin el estímulo incondicionado, o sin que exista ningún tipo de relación de señal con el EI.
Si el animal ha sido condicionado para salivar como respuesta a una campana, por ejemplo, y la
campana se presenta de forma repetida sin la comida, la salivación ante la campana irá
decreciendo.
Una advertencia sobre terminología: los procedimientos de extinción se dice que extinguen las
respuestas y/o los estímulos condicionados, no los organismos. Los animales no mueren cuando
están expuestos a condicionamientos de extinción. Otro comentario importante sobre la
definición es que la pérdida de la respuesta condicionada que se produce por la extinción no es la
misma que puede ocurrir a causa del olvido. En la extinción, las presentaciones repetidas del EC
son responsables por sí solas del descenso gradual de la respuesta condicionada. Olvidar, por el
contrario, consiste en un declive en la intensidad de la respuesta condicionada que puede ocurrir
simplemente por el paso del tiempo. La extinción implica una experiencia especial con el
estímulo condicionado. El olvido ocurre cuando de forma prolongada no se da una exposición al
estímulo condicionado.
LA EXTINCIÓN Y LA HABITUACIÓN
Tanto la extinción como la habituación implican la presentación repetida de un estimulo. La
diferencia esencial entre ellas es que, en la extinción, el estímulo que intervenía había sido
condicionado de antemano. En cambio, no se requiere una fase previa de condicionamiento para
la habituación. Teniendo en cuenta que los procedimientos de la extinción y de la habituación
son similares, se podría esperar que existieran semejanzas en los resultados que se obtienen.
19
Los investigadores comienzan a descubrir estas semejanzas. Los estudios recientes han
mostrado, por ejemplo, que los efectos del intervalo entre las sucesivas presentaciones de un
estímulo son similares en los modelos de habituación y de extinción .
Otra característica importante de la habituación es que, con el paso del tiempo, el estímulo
recobra su capacidad de evocar la respuesta. Este fenómeno se llama «recuperación
espontánea» de la habituación. Un efecto parecido se observa con los estímulos y/o las
respuestas que se extinguen. Si después de una serie de ensayos de extinción, se le da al animal
un período de descanso fuera del ambiente experimental, puede producirse la recuperación
espontánea de la respuesta extinguida. Sería de esperar una menor recuperación espontánea
después de sucesivas series de ensayos de extinción, como ocurriría en la habituación.
Finalmente, no habría recuperación después de los períodos de descanso.
Los efectos que ejercen los estímulos novedosos sobre la pérdida de disponibilidad a responder
son similares en la habituación y en la extinción. La presentación de un estímulo extraño a
menudo produce una recuperación de la respuesta elicitada por el estímulo habituado
(deshabituación). Se da un efecto comparable en la extinción. Si después de una serie de
ensayos de extinción se presenta un estímulo novedoso, puede producirse una recuperación de la
respuesta al EC extinguido. Esta recuperación de la respuesta condicionada producida por la
novedad se llama desinhibición. Es importante distinguir entre desinhibición y recuperación
espontánea . Aunque los dos procesos sean formas de recuperación de la respuesta condicionada,
en la recuperación espontánea la recuperación ocurre simplemente por el paso del tiempo, y en la
desinhibición ocurre por la presentación de un estímulo novedoso.
QUÉ SE APRENDE EN LA EXTINCIÓN
El fenómeno de la extinción se ajusta a nuestra definición de aprendizaje en tanto que implica un
cambio en la conducta (la pérdida de la disponibilidad a responder al estímulo) como resultado
de la experiencia (presentaciones repetidas de EC). Sin embargo, uno se puede preguntar qué es
lo que realmente se aprende. Una respuesta obvia es que la extinción no supone el aprendizaje
de algo nuevo, sino, simplemente, el desaprendizaje de la tendencia de respuesta previamente
condicionada. Según este punto de vista, el descenso gradual de la respuesta condicionada
debido a la extinción refleja simplemente la pérdida de aquello que se había aprendido antes. En
vez de adoptar ese punto de vista, Pavlov (1927) sugirió que, durante la extinción, los animales
aprenden a inhibir de forma activa la materialización de la respuesta condicionada en presencia
del EC. De acuerdo con esta interpretación, la extinción de una respuesta condicionada no
supone la pérdida del aprendizaje original, sino, más bien, el aprendizaje de una tendencia a
responder antagónica o inhibitorio. Esta inhibición condicionada impide entonces la aparición de
la respuesta condicionada.
La prueba primordial para la interpretación de la extinción como inhibición condicionada fue
suministrada por el fenómeno de la desinhibición. Pavlov hizo el siguiente razonamiento: si la
20
extinción consiste en aprender a inhibir la respuesta condicionada al EC, entonces la respuesta
debería recuperarse si esta inhibición fuera interrumpida mediante algún tratamiento.
La presentación de un estímulo novedoso presumiblemente alteraría la inhibición, provocando
así una recuperación en la respuesta condicionada, fenómeno que conocemos como
desinhibición.
Las pruebas efectuadas hasta este momento indican que la extinción no produce el mismo tipo de
inhibición de la conducta que el que se aprende en los procedimientos de inhibición
condicionada. Evidentemente, los procedimientos de extinción producen la supresión de la
conducta a través de alguna otra clase de mecanismo para inhibir la respuesta. La naturaleza
precisa de ese mecanismo no ha podido ser comprendida todavía . Sin embargo, es evidente que
la extinción no implica el desaprendizaje de una respuesta condicionada y el retorno del sujeto a
su estado primitivo.
21