Download Tema 4 El Aprendizaje

Document related concepts

Condicionamiento operante wikipedia , lookup

Teoría del aprendizaje social wikipedia , lookup

Enseñanza programada wikipedia , lookup

Modificación de conducta wikipedia , lookup

Reforzamiento wikipedia , lookup

Transcript
TEMA 4 EL APRENDIZAJE
La capacidad de aprendizaje es la más importante de todas las disposiciones
innatas y filogenéticos que nos permiten adaptarnos y sobrevivir en un mundo
cambiante y complejo.
APRENDIZAJE Y DISPOSICIONES INNATAS
DEFINICIÓN DE APRENDIZAJE:
El aprendizaje es un cambio relativamente permanente de los mecanismos de la
conducta, debido a la experiencia con los acontecimientos del medio.
El aprendizaje supone un cambio en los mecanismos de la conducta, no un cambio en
la conducta misma. Los cambios en la conducta pueden deberse otros procesos
distintos del aprendizaje. La conducta está determinada también por otros factores
además del aprendizaje: motivación,
oportunidad,
capacidades motoras y
sensoriales del organismo.
Lo que se observa es la ejecución de la conducta, no el aprendizaje de la conducta. No
se puede considerar automáticamente, que un cambio en la ejecución de la conducta
refleje aprendizaje. A partir de los cambios en la conducta (ejecución) se infieren los
cambios en los mecanismos de la conducta (aprendizaje).
Los cambios en la conducta producidos por el aprendizaje no siempre son
permanentes. Como consecuencia de una nueva experiencia, puede que una conducta
previamente aprendida no vuelva a darse.
Existen otros mecanismos que producen cambios permanentes en la conducta, pero
que no se consideran aprendizaje, como el desarrollo madurativo. Aunque el
aprendizaje se distinga de la maduración y la evolucion, no es independiente de estas
fuentes de cambio conductual. La aparición de un proceso concreto de aprendizaje, o
como este opere, depende del nivel de maduración del sujeto y de su historia evolutiva
(Domjan y Burkhard, 1986).
En las conductas instintivas no se requiere adiestramiento alguno para realizarlas; las
conductas que no se pueden efectuar sin adiestramiento reflejan aprendizaje.
El aprendizaje implica un cambio inferido en el estado mental de un organismo, el
conocimiento ha de codificarse o representarse de algún modo en la estructura
neurológica del organismo; y además un cambio en el potencial de conducta, se
distingue entre el estado de conocimiento y la conducta manifiesta, Tarpy y Meyer
(1978);
El aprendizaje es un cambio inferido en el estado mental de un organismo, el cual es
una consecuencia de la experiencia e influye de forma relativamente permanente en el
potencial del organismo para la conducta adaptativa posterior.
Tenemos que un sujeto puede adquirir unos conocimientos y, sin embargo, no
comportarse de forma tal que demuestre la adquisición de esos conocimientos; no
obstante ese sujeto posee ese potencial de comportamiento aun cuando realmente no
está ejecutando esa conducta.
PATRONES INNATOS DE CONDUCTA:
Las conductas innatas tienen un sustrato órgano-fisiológico. Muchas especies no
toman parte en ningún aprendizaje significativo porque no lo necesitan, sus
capacidades innatas bastan para afrontar las exigencias del espacio ecológico donde
habitan (Tarpy, 1997).
Tarpy (1997), las conductas son innatas cuando los individuos que las realizan han
sido aislados desde su nacimiento y no han tenido ocasión de aprenderlas; son muy
estereotipadas; se realizan de modo ritual
e invariable y están sujetas a la
modificación por la selección a lo largo de generaciones sucesivas por medio de la
selección, y estas conductas las realizan los individuos aun cuando se les coloca en un
contexto diferente.
Dentro de los comportamientos innatos se incluyen tradicionalmente los reflejos y los
instintos:
Los reflejos son las formas más elementales de la coordinación motora. Una acción
refleja es una respuesta relativamente estereotipada frente a un estímulo sensorial
específico; son respuestas innatas, involuntarias, automáticas y universales que existen
en todos los organismos que tienen sistema nervioso. Los reflejos se han desarrollo
para proporcionar un ajuste comportamental rápido. El arco reflejo es la conexión
neural más simple, y supone el mínimo de conexiones neuronales necesarias para la
acción refleja. Los reflejos innatos tienen diferentes grados de complejidad; los más
simples se sitúan al nivel de la médula espinal, pero otros implican otras estructuras
como el tronco cerebral. Los reflejos innatos son una parte importante del repertorio
conductual de un recién nacido, mientras otros reflejos requieren cierto grado de
desarrollo o maduración por parte del organismo. Ej. Reflejo de extensión, de flexión,
palpebral, salivar, plantar, rotuliano, etc.
LOS INSTINTOS: Son los patrones innatos más complejos; una conducta instintiva
suele estar provocada por una concatenación de acontecimientos o estímulos que
provocan comportamientos complejos, propios de una especie particular. La conducta
instintiva está programada filogenéticamente a nivel neuronal. Los programas
neuronales en los que se apoya la conducta
instintiva se denominan mecanismos de desencadenamiento innato, y los estímulos
que los ponen en marcha son los estímulos índice. Los estímulos índice activan los
programas neuronales y se desencadena una secuencia de conductas relativamente
fijas, que son instintivas. Estas conductas suponen unas pautas fijas de acción.
Tienen dos fases: fase apetitiva y fase terminal o de consumación. La fase apetitiva,
que es considerada como el componente motivacional del instinto, es una fase inicial
de búsqueda de un medio o situación apropiada para iniciar la siguiente fase, que es la
fase terminal de consumación o descarga. En un sentido restringido el instinto sería la
parte final de este ciclo, la fase consumatoria del proceso, conductas estereotipadas
propias de cada especie. La conducta instintiva está mediada en muchos casos por el
aprendizaje, (sobre todo en la fase apetitiva). A medida que se asciende en la escala
filogenético existe mayor flexibilidad y con ello la posibilidad de aprendizaje, sobre
todo de los estímulos que elicitan el instinto y de las conductas instintivas de
búsqueda.
HABITUACIÓN Y SENSIBILIZACIÓN:
Los cambios en las reacciones innatas de los de los animales ante los estímulos
ambientales tienen un elevado valor adaptativo (García, Brett y Rusiniak, 1989)
Los mecanismos de habituación y sensibilización ayudan a reducir la reactividad a los
estímulos irrelevantes y a canalizar la conducta a través de acciones organizadas y
dirigidas en respuesta a sólo algunos de los estímulos que se presentan. (Domjan y
Burkard, 1986).
Groves y Thompson (1970) sugieren que la habituación refleja una disminución en la
disposición de los reflejos innatos para responder. Como consecuencia de la
exposición repetida a un estímulo, disminuye su capacidad para provocar la respuesta,
La sensibilización, en cambio, refleja un aumento de la tendencia a reaccionar ante
cualquier estímulo.

HABITUACIÓN: Con la habituación disminuye la disposición para responder
ante un estímulo específico como consecuencia de la experiencia repetida con dicho
estímulo (Klein, 1987), El sujeto deja de responder a un estímulo aunque sigue siendo
capaz de percibir el estímulo y de realizar los movimientos musculares que requiere la
respuesta, por lo que la habituación es diferente de la adaptación sensorial, que es la
una disminución en la sensibilidad de algún órgano de los sentidos, y también la
habituación es diferente de la fatiga, donde los músculos que intervienen en una
respuesta no lo hacen debido al agotamiento. Cuando se presenta por primera vez un
estímulo, o si existe un cambio en los parámetros de un estímulo presente, se produce
una respuesta (refleja) de orientaciónEs una forma de ADAPTACIÓN. Los estímulos
débiles producen mayor habituación.

SENSIBILIZACIÓN: Es el incremento en la reacción ante los acontecimientos
ambientales (1987) sin que ocurra condicionamiento, ya que sí se trata de un
aprendizaje. Los procesos de sensibilización tiene, en general, efectos temporales.
Aunque en algunos casos la sensibilización persiste durante varias semanas, en la
mayoría de las situaciones el aumento de la disposición a responder es de corta
duración. El carácter temporal de un aumento en las respuestas puede servir para
identificarlo como un fenómeno de sensibilización.
La duración de los efectos de la sensibilización está determinada por la intensidad del
estímulo que la produjo. Cuanto más intenso es el estímulo más aumenta la
disponibilidad de responder y es mayor la duración de los efectos de la sensibilización.
También con los estímulos intensos se produce una mayor sensibilización a medida
que se incrementa la frecuencia del estímulo.
En contraste con la habituación, la sensibilización es menos específica para un
estímulo. Si un animal se sensibiliza o activa por cualquier motivo. Su reactividad
aumentará hacia una variedad de estímulos.
CONDICIONAMIENTO CLÁSICO
Implica el aprendizaje de relaciones entre
estímulos (EC y EI)
Es el mecanismo más simple por el que los organismos aprenden a dar respuestas
nuevas a los estímulos y aprenden las relaciones entre los estímulos.
Es un proceso de aprendizaje mediante el cual un estímulo que previamente no
suscitaba una respuesta, acaba provocándola a consecuencia de su asociación temporal
con otro estímulo que sí provoca la respuesta.
Pavlov, (1849-1936), (“Los refejos condicionados” 1927), en 1904 obtuvo el premio
Nobel de Fisiología por sus trabajos relacionados con la digestión. Fisiólogo ruso, fue
su descubridor de forma casual, y en relación con el reflejo salivar con perros.
Considero la salivación anticipatorio como una manifestación de una respuesta refleja
provocada por el estímulo de la comida. Esta nueva respuesta era resultado del
aprendizaje asociativo: el alimento, que ya provocaba salivación, se asoció, por ej.
Con el experimentador, éste entonces provocaba salivación. Pavlov (1927) sugirió que
tanto los animales como el hombre poseen reflejos incondicionados o innatos, los
cuales constan de dos elementos: 1- un Estímulo Incondicionado E I (por ej. comida),
que provoca 2- una Respuesta Incondicionada R I (por ej. salivación); y cuando un
estímulo ambiental neutro aparece junto con el E I, se forma un nuevo reflejo
denominado reflejo condicionado. El estímulo neutro se convierte en el estímulo
condicionado EC (por ej. un sonido o luz), y es capaz de provocar la respuesta
aprendida o respuesta condicionada RC (por ej. salivar ante el sonido o luz).
Cualquier estímulo neutro emparejado con un estímulo incondicionado puede,
mediante el condicionamiento, adquirir la capacidad de provocar una respuesta.
Los procedimientos del condicionamiento clásico se centran en la relación temporal
entre los distintos estímulos.
PARADIGMA DEL CONDICIONAMIENTO CLÁSICO(CC):
El paradigma del condicionamiento clásico que Pavlov utilizó para estudiar la
salivación anticipatorio. El estímulo incondicionado (EI) que produce de forma
automática una respuesta incondicionada (RI) que es una respuesta refleja innata al
estímulo incondicionado; y un estímulo condicionado (EC), con respecto al cual se ha
comprobado que al principio no produce una respuesta que se asemeje a la RI. Se
presenta el EC y el EI repetidamente en este orden y se desarrolla una respuesta al EC
semejante a la RI; esta respuesta se llama respuesta condicionada (RC) y supone una
respuesta aprendida. Mediante el condicionamiento clásico se obtiene funciones ECRC.
Antes del condicionamiento:
EC (tono) ………………………………….Ninguna respuesta
E I (comida)………………………………...R I (salivación)
Durante el condicionamiento: Emparejamiento repetido.
EC (tono) seguido por E I (comida)………R I (salivación)
Después del condicionamiento:
EC (tono)………………………………….RC (salivación)
FASES ESENCIALES DEL CONDICIONAMIENTO CLÁSICO (C C)
Un estudio de condicionamiento clásico incluye las fases de adquisición y extinción:
1.
ADQUISICIÓN: El condicionamiento clásico (CC), es un proceso gradual en el
que un estímulo adquiere la capacidad de provocar una respuesta condicionada,
pasando a ser un estímulo condicionado; esta capacidad se adquiere a través de la
asociación o emparejamiento repetido con un estímulo incondicionado, a este proceso
se le denomina adquisición.
La fuerza de la asociación que se desarrolla durante el período de adquisición depende
de las condiciones particulares utilizadas en el entrenamiento.
2.
EXTINCIÓN de la respuesta condicionada: Si después del condicionamiento se
presenta el estímulo condicionado, sin ir seguido del estímulo incondicionado, la
intensidad de la respuesta condicionada disminuye. A este procedimiento lo denominó
extinción, que es el proceso de eliminación de una respuesta previamente
condicionada. La fuerza de la RC disminuye al incrementar el número de
presentaciones del EC solo, sin ir seguido del EI, hasta que finalmente el EC no
provoca la RC.
En la extinción el estímulo que interviene había sido condicionado de antemano; en la
habituación no se requiere una fase previa de condicionamiento al estímulo (Domjan y
Burkhard, 1986).
En la extinción de una respuesta condicionada influyen tres factores:
La fuerza de la respuesta condicionada, cuanto más fuerte es la RC al final de la
adquisición, más tiempo tardará en extinguirse. Hall (1976) podría ser que la omisión
del EI durante la extinción modifica el nivel motivacional del sujeto respecto de la
adquisición y, por consiguiente, disminuyera la correlación entre el nivel de
adquisición de la RC y su resistencia a la extinción. El porcentaje de ensayos en los
que el E I (estímulo incondicionado) sigue al EC (estímulo condicionado), además de
presentar de forma emparejada el EC con el EI durante la adquisición, si se presenta en
algunos ensayos de adquisición el EC sin el EI, se produce generalmente una extinción
más lenta de la RC que emparejando siempre el EC con el EI (Humphreys, 1939). La
duración de la exposición al EC, cuanto más prolongado es la exposición al EC
durante la extinción, mayor es la reducción en la fuerza de la RC. La tasa de extinción
está determinada por la duración total de la exposición al EC solo, y no por el número
de ensayos de extinción; se demuestra que al aumentar la duración de la exposición al
EC se debilita la fuerza de la RC (Shipley, 1974; Monti y Smith, 1976)
Tras la fase de extinción, y a pesar de que la RC ha disminuído, la asociación del EC –
E I permanece relativamente intacta, no se elimina a consecuencia del procedimiento
de extinción, sino que únicamente resulta suprimida o inhibida. Existen varios
hallazgos que demuestran este hecho:

Recuperación espontánea: la fuerza de la RC (respuesta condicionada) se
recobra espontáneamente, sin un entrenamiento adicional, si el período de extinción va
seguido de un intervalo de descanso.

Deshinibición: se presenta cuando después de una serie de ensayos de extinción
se presenta un estímulo novedoso y se produce una recuperación espontánea de la
respuesta al EC extinguido. A esta recuperación de la RC producida por la novedad de
un estímulo se denomina desinhibición.
La recuperación espontánea ocurre simplemente por el paso del tiempo, y la
desinhibición por la presentación de un estímulo novedoso.

Renovación de la respuesta condicionada: si la extinción del EC se efectúa en
un entorno distinto al de la adquisición, la fuerza de la RC se recupera si se expone al
contexto inicial de adquisición. (Boston, 1991; Boston y Swartzentruber, 1991).

Generalización: si un estímulo concreto es condicionado, se puede dar la
respuesta condicionada RC en presencia de
condicionado.
estímulos semejantes al estímulo
CONDICIONAMIENTO
CLÁSICO
EXCITATORIO
(
EC+
(estímulo
condicionado en este cond. cl.)):
Es la modalidad de condicionamiento clásico más conocida es el condicionamiento
clásico excitatorio. Se aprende una respuesta al estímulo condicionado que es
congruente con el estímulo incondicionado. Como resultado del emparejamiento EC E I, el estímulo condicionado excita o activa una respuesta coherente con el E I. Al
estímulo condicionado en este condicionamiento excitatorio se le designa como EC+.
La excitación condicionada ocurre cuando la presentación del EC va seguida de la
presentación del EI.
Dentro del condicionamiento excitatorio se distinguen dos modalidades:
Puede ser excitatorio apetitivo cuando un EC va seguido de un EI apetitivo (ej,
comida o agua) y excitatorio aversivo Bechterev (1913) hacía sonar un tono neutro
EC y segundos después aplicaba una leve descarga eléctrica a la pata delantera del
perro. La RI a la descarga eléctrica era forcejear y retirar la pata; tras presentaciones
reiteradas de estos dos estímulos el tono provocaba la reacción de retirar la pata.
Factores que influyen en el Condicionamiento Clásico son:
Relaciones temporales, Intensidad del EC y EI y Naturaleza del EC
Procedimientos del EC+ relaciones temporales:
En los procedimientos del condicionamiento excitatorio se han empleado paradigmas
diferentes que pueden explicarse en función del nexo asociativo EC-EI y suponen
variaciones temporales entre ambos estímulos. Se reconoce que la relación temporal
entre EC y E I es uno de los factores más importantes que determinan el desarrollo del
condicionamiento clásico.
Estos procedimientos que constituyen diferentes formas de emparejar un EC con un
EI, no poseen la misma efectividad. Para poder compararlos y ver la forma en que se
produce el aprendizaje con los distintos procedimientos hay unas medidas aplicables a
todos ellos.
Medida o índice de condicionamiento: latencia de respuesta condicionada: Tiempo
transcurrido entre el inicio del EC y el inicio de la RC.
Procedimientos:
CONDICIONAMIENTO DE DEMORA: es normalmente el más eficaz; el EC se
presenta antes que el E I, y la terminación del EC coincide con la aparición del EI o
durante la presentación del mismo. Puede ser de demora corto, menos de un minuto,
larga el EC cinco-diez minutos, antes de la aparición del EI. La retención de la RC al
comienzo de EC en el condicionamiento de demora larga se conoce como inhibición
de la demora.
EC
EI
CONDICIONAMIENTO DE HUELLA: el EC comienza y termina antes de la
aparición del EI. Se diferencia del C. De demora en que el EC acaba antes de
producirse el inicio del EI. Existe un intervalo temporal antes de la presentación del EI
durante el cual no se administra el EC. El intervalo entre el final del EC y el principio
del EI se llama Intervalo de Huella. La superioridad del procedimiento de demora
sobre de huella depende en parte de otras características del experimento, como la
intensidad del EI y la demora total entre el inicio del EC y el inicio del EI (Tarpy,
1997).
En determinadas circunstancias el procedimiento de huella, en vez de enseñar a los
sujetos a ejecutar la respuesta, éstos aprenden a inhibir o retener la respuesta
condicionada (Kaplan, 1984).
EC
EI
CONDICIONAMIENTO SIMULTÁNEO: el EC y el EI se presentan a la vez. En
algunos experimentos se ha encontrado que este condicionamiento es ineficaz.
EC
EI
CONDICIONAMIENTO HACIA ATRÁS (retroactivo o retrógrado): es el menos
eficaz; el EI comienza y termina antes de que se presente el EC. El EI precede al EC.
Algunos estudios indican que sólo se produce condicionamiento hacia atrás cuando se
utilizan estímulos incondicionados nocivos y cuando se administra un número
pequeño de emparejamientos EC-EI (Spetch, Wilkie y Pinel, 1981).
EC
EI
Pseudocondicionamiento: Se produce este fenómeno cuando la exposición únicamente
al EI sólo, sin emparejamientos del EC-EI, produce por sí misma respuestas al EC, que
se asemejan a la RC.
Otros factores que influyen en el condicionamiento son la INTENSIDAD del EC y del
EI, y la NATURALEZA del EC. Según Seligman, existe una predisposición biológica a
asociar algunos EC con EI.
Condicionamiento CLÁSICO INHIBITORIO EC-:
Otra modalidad del condicionamiento clásico es el condicionamiento clásico
inhibitorio EC-. Los estímulos se pueden condicionar para señalar la ausencia de un EI
venidero, del mismo modo que se condicionan para señalar la aparición de un EI. El
EC-, mediante el condicionamiento, adquiere propiedades antagónicas respecto a un
EC+.
Mediante este condicionamiento se aprende a inhibir o retener una respuesta
condicionada, se aprende que un estímulo señala la ausencia de un EI. Un estímulo EC
se convierte en inhibitorio como consecuencia del emparejamiento del EC con la
ausencia de un EI.
INHIBICIÓN EXTERNA: Se produce cuando en el curso del condicionamiento se
presenta un nuevo estímulo y hace que se reduzca la fuerza de la RC, supone una
activación temporal del estado inhibitorio.
INHIBICIÓN LATENTE: Se produce cuando
la exposición al EC antes del
condicionamiento hace que dicho estímulo adquiera propiedades inhibitorias que
interfieren con el condicionamiento excitatorio al emparejar posteriormente el EC con
el EI.
La nota común de estos procesos es que no son permanentes, son transitorios
temporalmente. La inhibición de la RC puede llegar a ser un proceso permanente.
Se supone que la inhibición condicionada refleja la capacidad del EC- para activar el
estado inhibitorio, el cual puede suprimir la RC. Desde el punto de vista del
procedimiento un EC se convierte en inhibitorio cuando en el curso de un
condicionamiento excitatorio normal se empareja con la ausencia de un EI; como
consecuencia, el estímulo provoca una reacción contraria a la de un EC excitatorio.
Procedimientos del EC - Relaciones temporales:
Al condicionar un estímulo para que señale la ausencia de algún EI, este EI se presente
periódicamente en la situación experimental (Domjan y Burkard, 1986). Existen varios
procedimientos para crear una inhibición condicionada:
PROCEDIMIENTO ESTÁNDAR: Incluye dos estímulos condicionados y dos
modalidades de ensayo de condicionamiento, repetidas en un orden aleatorio. En
algunos ensayos se presenta el EC+ seguido del EI, y en otros se presenta el EC+ junto
con el EC- sin ir seguidos del EI; el EC- en este caso es el único acontecimiento
informante de la ausencia del E I. Los ensayos en los que se presentan
simultáneamente el EC+/EC- sin ir seguidos del EI se denominan ensayos de
condicionamiento inhibitorio.
INHIBICIÓN DIFERENCIAL: En algunos ensayos se presenta el EC+ seguido del EI,
y en otros se presenta el EC- seguido de la ausencia del EI. Parecido al anterior, no se
presentan simultáneamente el EC+ y el EC-. El EC+ no está presente en los ensayos de
condicionamiento inhibitorio, el EC- se convierte es estímulo inhibitorio
condicionado.
CONTINGENCIA NEGATIVA EC-EI o DESEMPAREJAMIENTO EXPLÍCITO:
Se diferencia de los anteriores en que no hay emparejamiento del EC+ y EI, )por lo
que al estímulo condicionado inhibitorio se le puede llamar simplemente EC
).
Consiste en presentar los EC y los EI de modo que no aparezcan simultáneamente; el
EC aparece en el intervalo entre las presentaciones del EI.
Para medir la inhibición condicionada se utiliza:
o
La prueba de la conducta dirigida
o
La prueba de sumación o del estímulo complejo
o
La prueba del retraso en la adquisicióN
Procedimiento estándar
E.C.+
E.C.
E.C.
E.C.+
E.I.
E.I.
CONDICIONAMIENTO INSTRUMENTAL (OPERANTE
El
condicionamiento
pavloviano
implica
el
aprendizaje
del
estímulo,
el
condicionamiento instrumental concierne al aprendizaje de la respuesta (Tarpy, 1997).
El condicionamiento instrumental es un tipo de aprendizaje que se refiere a la
conducta voluntaria. Una conducta se desarrolla por las consecuencias que produce. La
respuesta que tiene lugar principalmente porque sirve de instrumento para producir
ciertas consecuencias se llama conducta instrumental.
Los procesamientos se centran en la relación entre las apariciones o ejecuciones de una
respuesta específica (instrumental) y la administración del reforzador o refuerzo.
El condicionamiento Instrumental se basa en la ejecución de una respuesta específica y
la administración del reforzador.
El inicio de la investigación sobre condicionamiento instrumental tuvo su comienzo
con el trabajo de Thorndike:(1911) denomina al fortalecimiento de la asociación E-R,
debido a un acontecimiento satisfactorio o recompensa como: ley del efecto: Esta ley
establece que si una respuesta que se ejecuta en presencia de un estímulo va seguida de
un hecho satisfactorio, la asociación entre estímulo y la respuesta se fortalece; si la
respuesta va seguida de un hecho molesto, la asociación se debilita. Esta ley se
considera como precursora del reforzamiento.
Algunos autores hacen la distinción entre dos tipos de condicionamiento:
condicionamiento instrumental y condicionamiento operante:
Condicionamiento instrumental / condicionamiento operante:
En el
condicionamiento instrumental el ambiente limita las posibilidades de
recompensa, la persona o el animal estudiados tienen una oportunidad limitada de
comportarse (Klein (1987).
En el condicionamiento operante implica situaciones en las que no hay ninguna
limitación en la cantidad de reforzamiento que puede obtenerse (el animal o la persona
controla la frecuencia de la respuesta y por tanto, puede determinar la cantidad de
refuerzo obtenido).
Klein (1987) el concepto de recompensa se utiliza generalmente en situaciones de
condicionamiento
instrumental,
el
término
reforzador
se
emplea
en
el
condicionamiento operante.
Skinner propuso la palabra operante para definir la conducta que produce cambios o
que opera en el medio o en el ambiente.
No obstante, la mayoría de los autores consideran únicamente como término general el
de condicionamiento instrumental, que englobaría dos tipos de métodos de estudio:
Los métodos de ensayos discretos o aprendizaje ensayo a ensayo, respuesta única, las
posibilidades de respuesta en estas situaciones esta restringidas, oportunidad limitada
de comportarse y obtener la recompensa; el número total máximo de respuestas que
puede realizar coincide con el número de ensayos. Y los de operante libre. Skinner
(1938) el término operante como forma de dividir la conducta en unidades
significativas y medibles. La palabra operante se refiere a una conducta que produce
cambios en el medio o ambiente. Skinner los estímulos ambientales señalan la ocasión
para la respuesta. Estos estímulos informan de cuándo está disponible el reforzamiento
y actúan motivando la conducta operante. Se utilizara como medida la probabilidad de
la respuesta la tasa de aparición de la conducta operante, la frecuencia de la respuesta
en un intervalo concreto.
ELEMENTOS DEL CONDICIONAMIENTO INSTRUMENTAL
En el condicionamiento instrumental intervienen tres elementos:

LA RESPUESTA: Normalmente es voluntaria y motora pero puede ser cualquier
respuesta seleccionada por el investigador. El condicionamiento instrumental puede
llevar a la creación de una nueva unidad conductual que viene definida por los
elementos requeridos para obtener el refuerzo (Domjan y Burkard, 1986).

EL REFUERZO: Es cualquier estímulo que aumenta la probabilidad de emisión
de una conducta en el futuro.
Según Skinner (1938) los refuerzos pueden ser (atendiendo a la forma en la que han
adquirido su capacidad para reforzar su conducta):
Primarios (es aquel estímulo que tiene un valor innato o incondicionado, ej. comida),
y su valor de refuerzo está establecido biológicamente. Pueden no reforzar
permanentemente
una
conducta,
pueden
depender
de
condiciones
de
privación/saciación.
Secundarios (adquiere las propiedades reforzantes a través de su asociación con los
reforzadores primarios, ej. elogio asociado a golosina); son aquellos estímulos que el
principio fueron neutros, pero que por su asociación mediante un proceso de
condicionamiento clásico con sucesos reforzantes han adquirido su valor de refuerzo,
poseen una gran potencia y rara vez producen saciación.
Para Premack, en su teoría de la probabilidad diferencial, un reforzador es cualquier
actividad cuya probabilidad de ocurrencia es mayor que la de la conducta reforzada;
una conducta es reforzada por la oportunidad de realizar otra conducta que es más
deseada por el sujeto, un reforzador puede considerarse como una actividad, más que
como una cosa o un estímulo que se obtiene; (ej.: el reforzador no es el agua, sino
beber); facilita el identificar actividades reforzantes, puesto que siempre habrá algunas
conductas que las personas emitan con mayor frecuencia.
Relación o contingencia entre la respuesta y el reforzador, la cantidad y calidad del
reforzador aumentan la tasa de conducta; la experiencia con un refuerzo bajo aumenta
el efecto de un refuerzo alto, es el efecto contraste positivo, también se da al contrario;
si se pasa de un refuerzo grande a uno pequeño se produce el contraste negativo.

RELACIÓN
RESPUESTA-REFORZADOR:
En
estas
situciones
están
implicadas dos relaciones:
La relación temporal entre la respuesta y el refuerzo o CONTIGÜIDAD temporal.
Se refiere a la inmediatez en la presentación del refuerzo, es una variable muy
importante del condicionamiento instrumental; los reforzadores condicionados
permiten al sujeto pasar por alto la demora entre la respuesta y la entrega del refuerzo
primario (Winter y Perkins, 1982).
La relación o CONTINGENCIA respuesta-reforzador.
El aprendizaje se produce si, y sólo si, la presentación del refuerzo depende de la
ejecución previa de una conducta. Es el factor más importante del condicionamiento
instrumental.
Una contingencia positiva perfecta si se entrega el refuerzo después de cada aparición
de la respuesta y nunca se entrega si no aparece la respuesta; la contingencia es
negativa si el refuerzo tiene más probabilidad de entregarse cuando no se ejecuta la
respuesta que cuando se ejecuta; y la contingencia cero si el refuerzo tiene la misma
probabilidad de aparecer con y sin respuesta instrumental.
Procedimientos de condicionamiento instrumental:
Un refuerzo es cualquier acontecimiento que aumenta la probabilidad, eleva la tasa de
respuesta o de emisión de una conducta. El castigo es cualquier acontecimiento
consecutivo a una respuesta que reduce la probabilidad de que la respuesta se repita.
Hay dos factores a considerar:
Tipo de acontecimiento agradable
estímulo llamado apetitivo o positivo.
Tipo de acontecimiento desagradable
estímulo llamado aversivo o negativo.
La respuesta del sujeto produce el acontecimiento (o estímulo)
contingencia positiva
La respuesta del sujeto no produce el acontecimiento (o estímulo)
contingencia
negativa
REFORZAMIENTO POSITIVO: Contingencia POSITIVA entre la respuesta y un
estímulo reforzador apetitivo.
la respuesta del sujeto produce un refuerzo positivo
que es cualquier evento, conducta u objeto que aumenta la frecuencia de cualquier
conducta a la que sigue. La emisión de la respuesta tiene como consecuencia: la
aparición de un estímulo de refuerzo positivo. Es una relación positiva entre una
respuesta y la producción de un evento.
REFORZAMIENTO NEGATIVO: Se produce si tras la realización de una
determinada conducta, se produce la eliminación de un estímulo aversivo; habremos
reforzado negativamente dicha conducta, tal conducta incrementara su probabilidad de
repetirse en un futuro. Contingencia NEGATIVA entre la respuesta y el estímulo
reforzador aversivo.
La emisión de la respuesta interrumpe, elimina o impide la
presentación del estímulo aversivo: ESCAPE-EVITACIÓN.
La emisión de la respuesta tiene como consecuencia: la eliminación de un estímulo
aversivo.
CASTIGO POSITIVO: El castigo positivo se refiere a la utilización de un evento
físico o psicológicamente doloroso como castigo. Si no se ejecuta la respuesta no se
presenta el estímulo aversivo, en lugar de aumentar la probabilidad futura de
respuesta, la debilita, y es menos probable que se produzca. Contingencia POSITIVA
entre la respuesta y el estímulo punitivo aversivo.
el castigo no se denomina
estímulo reforzador sino estímulo punitivo, ya que su objetivo es la reducción de la
frecuencia de alguna conducta.
La emisión de la respuesta tiene como consecuencia: la aparición de un estímulo
aversivo.
CASTIGO NEGATIVO: El castigo negativo se produce cuando se aprende a dejar de
emitir una respuesta porque tiene como consecuencia la retirada o el cese de algún
evento positivo o significativo para el sujeto: COSTE DE RESPUESTA, donde la
respuesta no deseada hace que se retire o no se pueda obtener el reforzamiento.
TIEMPO FUERA o tiempo fuera de reforzamiento, se utiliza un período de tiempo
durante el cual el reforzamiento no está disponible.
PROGRAMAS DE REFORZAMIENTO: (pueden ser contínuos o intermitentes)
Un programa de reforzamiento es una pauta o regla que determina la forma y el
momento en los que la aparición de una respuesta va a ir seguida de un refuerzo
(Domjan y Burkhard, 1986).
Programa de REFORZAMIENTO CONTINUO RF1: se da refuerzo cada vez que se
emite la conducta objetivo, el recomendado durante la fase de adquisición de una
conducta.
En los programas INTERMITENTES no se refuerzan todas las emisiones de la
conducta:
PROGRAMAS DE RAZÓN:
En estos programas la administración del refuerzo depende del nº de respuestas dadas
por el sujeto:

RAZÓN FIJA (RF): el nº se mantiene constante. Es necesario emitir un número
de respuestas determinado para obtener el refuerzo. RF10:(tienen que darse 10
respuestas para obtener un refuerzo, y se refuerza cada décima respuesta). Pausa postreforzamiento: (característica distintiva: la pausa se interrumpe temporalmente
después del refuerzo).

RAZÓN VARIABLE (RV): Igual que el anterior, pero aquí el requisito del
número de conductas no se mantiene constante, sino que se obtiene el refuerzo tras
realizar un número medio de respuestas. RV10: (refuerzo tras una media de 10
respuestas). No existen pausas predecibles.
Normalmente da una tasa media de respuestas más elevada que con cualquier otro tipo
de programa.
PROGRAMAS DE INTERVALO:
En estos programas la administración del refuerzo depende del paso del tiempo. La
respuesta se refuerza sólo si se realiza transcurrida una determinada cantidad de
tiempo a partir de la última presentación del reforzador.

INTERVALO FIJO (IF): Es necesario emitir la respuesta apropiada después de
un período de tiempo estipulado. IF-1: (reforzado por la primera respuesta tras un
minuto). Se refuerza la primera conducta después del intervalo. A este tipo de
programas Ferster y Skinner lo llamaron festoneado: patrón de respuesta en que la
respuesta deja de emitirse después de obtener el refuerzo y luego aumenta lentamente.
(ej: esperar el reparto de correos todos los días a la misma hora, se deja de estar
pediente del correo una vez recibido y aumenta la conducta de espera cuando va
llegando la hora del reparto)

INTERVALO VARIABLE (IV): Igual que el anterior, pero el requisito del
tiempo fijo no es constante. Se obtiene refuerzo tras un intervalo de tiempo medio. IV2: (el intervalo medio es de 2 minutos). La tasa de respuestas es bastante estable entre
refuerzos.
EXTINCIÓN de la CONDUCTA INSTRUMENTAL:
Una repuesta adquirida mediante condicionamiento instrumental puede extinguirse si
el refuerzo deja de presentarse tras la emisión de la respuesta. Si al sujeto se le
devuelve a la situación experimental se produce la RECUPERACIÓN ESPONTÁNEA.
Factores que contribuyen a la resistencia a la extinción:
o
MAGNITUD DEL REFUERZO depende del nivel de entrenamiento durante la
adquisición.
Si el nivel de entrenamiento es mínimo, un refuerzo alto produce mayor resistencia a
la extinción. En cambio entrenamiento largo y refuerzo alto produce menor resistencia
a la extinción. Entrenamiento largo y refuerzo pequeño produce mayor resistencia a la
extinción de la conducta.
o
DEMORA DEL REFUERZO depende de su consistencia; una demora constante
no afecta a la extinción; una demora variable aumenta la resistencia a la extinción de la
conducta.
o
CONSISTENCIA DEL REFUERZO una respuesta que no ha sido reforzada
cada vez resiste más a la extinción que una que ha sido reforzada siempre.
DISCRIMINACIÓN Y GENERALIZACIÓN DEL ESTÍMULO
Estos dos procesos suponen un aprendizaje adaptativo ante la complejidad del medio
ambiente:
DISCRIMINACIÓN:
El proceso de responder de distinta manera ante estímulos diferentes, o de responder
ante unos estímulos pero no ante otros se denomina DISCRIMINACIÓN.
Existen estímulo discriminativos positivos y negativos, señalan la presencia o ausencia
de refuerzo.
GENERALIZACIÓN:
Los organismos aprenden a responder de la misma manera ante estímulos semejantes o
parecidos, es el proceso de GENERALIZACIÓN.
Realmente la situación de condicionamiento instrumental contiene tres elementos: los
estímulos ambientales, la respuesta y el reforzador. Estas claves ambientales pueden
llegar a controlar la aparición de la respuesta.
Sólo en el caso de que la presencia de un estímulo altere la frecuencia de una conducta
se puede hablar de estímulo discriminativo. Existen estímulos discriminativos
positivos (ED), que indican que si la conducta se emite en presencia de ellos se
obtendrá refuerzo, y estímulos discriminativos negativos (EΔ), cuya presencia indica la
no disponibilidad de refuerzo.
El gradiente de generalización se utiliza tanto para el condicionamiento clásico como
para el instrumental. En el experimento de Guttman y Kalisch (1956) con cuatro
grupos de palomas, durante el entrenamiento de condicionamiento, presentaron a cada
grupo un tipo de luz de diferente longitud de onda que varió desde el verde amarillento
al rojo, y posteriormente tras el entrenamiento de adquisición comprobaron la
generalización a otras luces de colores parecidos; los resultados demostraron que las
palomas daban el número máximo de respuestas lógicamente ante el estímulo
entrenado y que el nivel disminuía conforme aumentaba la diferencia de longitud de
onda entre el estímulo entrenado y los de prueba.