Download Slide 1 - WordPress.com

Document related concepts

Condicionamiento operante wikipedia , lookup

Reforzamiento wikipedia , lookup

Teoría del aprendizaje social wikipedia , lookup

Modificación de conducta wikipedia , lookup

Principio de Premack wikipedia , lookup

Transcript
Domjan 7
Condicionamiento
Instrumental: mecanismos
motivacionales
Profa: Carolina Mora
La estructura asociativa del
condicionamiento instrumental
La noción de asociación es
fundamental para describir cómo
los
organismos
aprenden
relaciones entre eventos en el
área del aprendizaje Asociativo
En el aprendizaje instrumental es
importante conocer la función que
desempeñan los tres elementos
participantes:
estímulo
discriminativo,
respuesta
y
reforzador
Teorías sobre la asociación en el
condicionamiento instrumental
• asociación estímulo-respuesta
(E-R)
• asociación entre el estímulo y
el reforzador o consecuencia
(E-C)
• asociación entre la respuesta y
la consecuencia (R-C).
Primera teoría: la asociación
estímulo-respuesta (E-R)
Cuyo ejemplo más representativo es la ley del efecto de
Thorndike.. El condicionamiento instrumental implica el
establecimiento de una relación E-R , entre la respuesta
instrumental (R) y los estímulos contextuales (E)
que están
presentes cuando la respuesta es reforzada
(R)
Respuesta instrumental:
presionar un pedal que abre el
mecanismo
(E) Estímulos contextuales: caja
asociación estímulo-respuesta (E-R)
en estas teorías la función del reforzador es fortalecer la asociación
E-R.
El reforzador en sí mismo no es codificado como parte de la estructura
asociativa, sino que es una especie de “fortalecedor” que facilita la
formación de dicha asociación E-R.
(R)
Respuesta instrumental:
presionar un pedal que abre el
mecanismo
(E) Estímulos contextuales: caja
(ER) Reforzador: Comida
Segunda Teoría: la asociación entre
el estímulo y el reforzador (E-C)
cuando se refuerza una respuesta
en presencia de un estímulo, el
estímulo también se aparea
explícitamente
con
el
reforzador
permitiendo
el
establecimiento
de
una
asociación entre ambos.
Los hábitos son cosas que
hacemos
de
manera
automática , de la misma
forma cada vez y sin
pensar
Constituyen el 45% del
comportamiento humano
Desde esta teoría, los hábitos surgen cuando la
gente utiliza de manera repetida una conducta en
un contexto particular, para conseguir una meta.
Una vez que se adquiere el hábito se realizan sin
mediación de una meta, más bien se convierte en
una reacción automática al contexto de estímulo
en que se obtuvo previamente la meta
Los hábitos y la asociación
estímulo-respuesta (E-C)
La visión anterior, esta siendo utilizada para explicar comportamientos como el
uso de drogas:
Consumir una droga de abuso se considera una conducta instrumental que en
principio es reforzada por los aspectos positivos de la experiencia . Sin embargo,
con el uso repetido, el consumo se vuelve un hábito en el sentido de que llega a
ser una reacción automática a las señales del contexto que provocan la conducta
de búsqueda de droga sin considerar sus consecuencias
Los hábitos y la asociación
estímulo-respuesta (E-C)
Este modelo también se ha usado para explicar conductas
como la infidelidad, la alimentación y las apuestas
compulsivas.
La teoría de los dos procesos de
Rescorla y Solomon (1967)
Supone que existen dos tipos distintos de aprendizaje:
el condicionamiento pavloviano y el instrumental y
ambos son interdependiente
Condicionamiento
clásico
Condicionamiento
instrumental
interdependencia
Cómo se prueba que una asociación pavloviana EC influye en la conducta instrumental?
Prueba de tranferencia
pavloviana instrumental
Fases
descripción
Condicionamiento
instrumental
estándar
La presión de una palanca de se
refuerza con comida
Condicionamiento
pavloviano
Se saca la palanca de respuestas
de la caja experimental y se
empareja el tono con comida
EN
Campana
EI
Comida
Transferencia
pavloviana
instrumental
Se
permite
nuevamente
presionar la palanca y se
presenta periódicamente el EC
(tono).
La tasa de respuesta de presión
de la palanca se incrementa
cuando se presenta el EC
La
RI
Salivación
La presentación del EC
pavloviano
para la
comida incrementa la
tasa
de
respuesta
instrumental
para
la
presentación
comida
El EC influye o motiva la
respuesta instrumental
Asuntos inconclusos en la prueba de
transferencia pavloviana
A los investigadores le ha preocupado
mucho la posibilidad de que los
resultados de los experimentos de
transferencia pavloviana se deban a
que los EC provocan RC manifiestas
que interfieren o se suman a la
conducta requerida para obtener el
reforzamiento instrumental
=
=
=
La teoría de los 2 procesos
asume que el condicionamiento
clásico media en la conducta
instrumental,
por medio del
condicionamiento de emociones
positivas o negativas
=
=
Valencia
emocional
positiva
=
=
Más motivación para
presionar la palanca
Condicionamiento clásico
EC
mujer
EI
Senos grandes
RI
excitación
Condicionamiento operante
ED
Mujer (otra mujer)
C.O
el coquetea
consecuencia
excitación
ella le responde riéndose
Transferencia pavloviana instrumental
ED
Mujer
Senos grandes
C.O
el coquetea más
frecuente o intensamente
Consecuencia
mayor excitación
cuando ella le responde
riéndose
Condicionamiento clásico
EC
Cuchillo
EI
Herida
RI
temor
Condicionamiento operante
ED
Ladrón
C.O
huida
consecuencia
escape ante el temor de ser agredido
Transferencia pavloviana instrumental
ED
Ladrón
Que usa
cuchillo
C.O
huida más
rápida
Consecuencia
escapa más rápidamente porque experimenta
mayor temor a ser agredido con el cuchillo
Tercera teoría: la asociación entre la
respuesta (R) y la consecuencia (C).
La intuición sugiere que la conducta
instrumental implica asociaciones R-C.
• Nos peinamos esperando que eso
mejore nuestra apariencia
• Vamos al cine porque esperamos que la
película resulte entretenida
• Abrimos el refrigerador anticipando que
eso nos permite obtener algo de comer
La asociación entre la respuesta y la
consecuencia (R-C).
La suposición de que existen asociaciones R-C se
ha apoyado en los trabajos que muestran que los
cambios en el reforzador afectan a la respuesta
instrumental incluso cuando estos cambios se
realizan después de que la respuesta haya sido ya
aprendida
la técnica conocida como devaluación de la consecuencia está basada en la idea
de que, si en el condicionamiento instrumental se establece una asociación R-C,
cualquier cambio en el valor de la consecuencia tras el aprendizaje debería llevar a
un cambio en la respuesta.
Así, cuando la consecuencia fuera devaluada tras el condicionamiento, debería
encontrarse una reducción en la respuesta que produce la consecuencia
devaluada.
Se realizó un experimento en 3 fases.
En la primera se reforzó a las ratas por empujar una varita vertical a la derecha o a la
izquierda
Las respuestas en una dirección eran reforzadas con bolitas de comida y las respuestas
en la dirección contraria eran reforzadas con un sorbo de una solución dulce
En la segunda fase: una vez que quedaron bien establecidas las dos
respuestas, se sacó la vara y se realizó el procedimiento de devaluación,
asociando uno de los reforzadores con cloruro de litio para condicionar la
aversión al reforzador
+
La tercera fase fue idéntica a la fase inicial, con la excepción de que la respuesta de presión
de palanca no fue seguida por reforzador alguno. Las ratas en la condición apareada dieron
menos respuestas que las ratas de la condición no apareada. El cambio en el valor de la
consecuencia después del aprendizaje inicial no debiera de haber tenido efectos sobre la
respuesta en el caso de que el aprendizaje hubiera sido E-R. El encontrar ese efecto sugiere
que la consecuencia forma parte de lo que el sujeto aprende en el condicionamiento
instrumental.
Menos probable
Más probable
Antecedentes de la regulación
conductual
Thorndike
describía
a
un
reforzador como un estímulo que
produce un estado satisfactorio
de cosas
Teoría de la respuesta
consumatoria
La teoría de las respuestas
consumatoria
constituyó
una
innovación,
pues cambio la
busqueda de los reforzadores de
tipos especiales de estímulos a
tipos especiales de respuesta.
La teoría supuso que
las
respuestas consumatorias (como
masticar y tragar) son reforzantes
porque implican la consumación o
completamiento de una secuencia
conductual instintiva
La sacarina,
funciona como un
reforzador eficaz aunque no tenga
valor nutritivo y no pueda satisfacer
una necesidad biológica
El principio de Premack
Este principio parte de dos supuestos.
1. si a un sujeto se le da acceso libre a dos actividades dedicará un tiempo
determinado a cada una de ellas y ese porcentaje de tiempo reflejará el grado
de preferencia de esa actividad (principio de probabilidad diferencial)
2. una actividad preferida (A) se volverá el reforzador de la actividad menos
preferida (B) si el acceso a la actividad (A) depende de la ejecución de la
actividad menos preferida.
El principio de
Probabilidad
Diferencial
70%
10%
Impongo
una
contingencia
instrumental: sólo te dejo jugar
con tu video juego (conducta
preferida) si te portas bien con tus
hermanos (conducta no preferida)
20%
La hipótesis de la privación de la
respuesta
Quiero que dejes de ver a ese
hombre horrible!!!. Lo tienes
prohibido!!!
Nadie me
impedirá ver a mi
príncipe
Lo importante no es la probabilidad diferencial de las conductas (cuáles se repiten más
y cuáles se repiten menos), sino el estado de privación de una determinada conducta.
Puede que en el estado natural, la conducta de correr sea una conducta de baja
probabilidad, pero si yo privo el acceso a esta conducta, entonces la puedo usar como
respuesta reforzadora
Regulación conductual y el punto
de éxtasis conductual
Un individuo tiene que comer, respirar , beber, alimentarse, mantenerse
caliente, etc. Todas esas actividades tienen que ocurrir en proporciones
particulares. Uno no desea comer en exceso o exageradamente poco,
ejercitarse de más o casi nada
Punto de éxtasis conductual: si
los organismos tienen la libertad
para distribuir sus respuestas entre
las alternativas de las que disponen,
lo harán de la forma en que les
resulte más cómoda u óptima
Imposición de una contingencia
ambiental
Si dejamos a un sujeto libre, se quedará en el punto de éxtasis conductual. Eso
puede ser malo. p.e estudiar poco, fumar mucho…)
El terapeuta quiere modificar esa distribución de conductas haciendo que se
aparten del punto de deleite. Como?. Mediante reforzamientos y castigos
Curva de demanda: relación
beneficio/coste
La sensibilidad al precio se llama
elasticidad. Si los caramelos son caros, la
gente no los compra (producto elástico)
Si la gasolina es cara,
se compra
igualmente porque no existe otro sustituto
(producto no elástico
Caramelos ----------------Gasolina ---------------------
Curva de demanda: relación
beneficio/coste
Curva de demanda: relación
beneficio/coste
La cantidad de cigarrillos fumados disminuye si el terapeuta pide
al paciente que “pague” 1 dólar por cada cigarrillo que fume
Y más todavía si son 5 dólares…
Disponibilidad de Sustitutos
Cuando hay disponible un producto (o conducta)
que sustituye a otro que se ha vuelto “caro”,
entonces podemos abandonar el producto caro y
pasar al sustituto
Un ejemplo con productos
Disponibilidad de Sustitutos
Llevarla al cine,
implica pagar las
entradas, comprar
refrescos, cotufas y
chucherias
Hola, Hola, Mi vida!!!, ya
llegué, traje unos DVD
buenísimos!!!
Un ejemplo con
conductas
Disponibilidad de Sustitutos
Disponibilidad de Sustitutos
Disponibilidad de Sustitutos
Disponibilidad de Sustitutos
Disponibilidad de Sustitutos
Disponibilidad de Sustitutos
Usemos el mismo principio en el tratamiento de las adicciones a las drogas
Se fija un costo alto para el uso de las drogas (multas, penas de cárcel, daño
físico y psíquico
Se emplea un reforzador que sustituye a la droga pero NO es una droga (falta
encontrar ese sustituto)
Eso hace que la demanda a la droga sea más elástica: al aumentar la droga se
consume menos droga y más el sustituto que hemos buscado
Factores que influyen en la
elasticidad de la demanda
Rango de precios:
Los productos baratos suelen seguir vendiéndose bien aunque suban de precio
El doble de 5 Bs.F es 10. B.s F
El doble de 5.000 Bs.F es 10.000 B.s F
Factores que influyen en la
elasticidad de la demanda
Nivel de ingreso:
Un coste elevado no significa mucho para quien es rico.
Igualmente, cuanto más respuestas o tiempo tengan disponibles los
sujetos serán menos sensibles a las subidas de coste
Algunos problemas con la aproximación
de la regulación conductual
El punto de éxtasis se formula desde una visión molar (como un
conjunto y a lo largo de un período amplio. Sin embargo, esta
demostrado que es importante cómo se alcanza ese punto de
deleite (pautas de elección en los cambios de una conducta a
otra, desde un punto de vista más molecular
Le respondo o
no le
respondo?
MOLAR
MOLECULAR
Algunos problemas con la aproximación
de la regulación conductual
El valor “reforzante” de una conducta puede cambiar según si es obligada o no?
Al principio una conducta A puede ser agradable, pero cuando la utilizo para
reforzar otra conducta B, estoy imponiendo la conducta A. ¿cómo sé si sigue
siendo tan agradable como al principio?
Me encanta
tocar la
guitarra
Qué
hace
sentada?,
tiene
que
tocar
la
guitarra para
que
los
clientes se
diviertan
Situación A
Situación B
Contribuciones de la aproximación de la
regulación conductual
Antes se pensaba en los reforzadores como tipos especiales de estímulos, desde
la aproximación de la regulación conductual, la causa del reforzamiento está en la
forma en que el flujo libre, natural, de la conducta se ve alterada por las
contingencias instrumentales
Cantar 1 hora
Cantar 15 horas
Contribuciones de la aproximación de la
regulación conductual
Ahora,. El entrenamiento instrumental ya
no sirve para “fijar” o “eliminar” una
conducta,
sino que crea una nueva
distribución de conductas en general
Contribuciones de la aproximación de la
regulación conductual
Una respuesta reforzadora no tiene nada inherentemente distinto de una respuesta instrumental:
no proporciona ningún beneficio especial, por ejemplo fisiológico (ej. Hacer ejercicio vs comer
caramelo).
Simplemente, el que una conducta sea reforzadora va a depender de los papeles que les asigne
el terapeuta
Quiero que dejes de ver a ese
hombre horrible!!!. Lo tienes
prohibido!!!
Nadie me
impedirá ver a mi
príncipe
Contribuciones de la aproximación de la
regulación conductual
Ha contribuido a ver el condicionamiento instrumental
como un sistema, en vez de como elementos aislados.
Al cambiar un solo elemento, el sistema entero cambia