Download reforzador

Document related concepts

Condicionamiento operante wikipedia , lookup

Reforzamiento wikipedia , lookup

Modificación de conducta wikipedia , lookup

Principio de Premack wikipedia , lookup

Enseñanza programada wikipedia , lookup

Transcript
CONDICIONAMIENTO
INSTRUMENTAL
Ley del Efecto - Thorndike
La conexión estimulo – respuesta se imprime
cuando un placer resulta del acto y se errade
cuando no es así.
a)
Lo que sucede como resultado de la conducta
influirá sobre esa conducta en el futuro.
b)
Si produce placer tiene la probabilidad de
repetirse, si produce incomodidad no lo hará.
Condicionamiento Operante - Skinner
Las respuestas de un organismo no son necesariamente
provocadas por algún estimulo, sino que están influidas por
las consecuencias que ellas determinan en el ambiente
(reforzadores).
El ser humano puede ser estudiado aisladamente y no
necesariamente en grupos, luego pueden hacerse
generalizaciones.
Mediante una cuidadosa recolección de datos puede lograrse
un mayor progreso hacia la predicción y el control de la
conducta, que a través de la formulación de grandes teorías.
ANTECEDENTE
CONDUCTA
CONSECUENCIA
Caja de Skinner
Caja –problema.
El experimentador tiene
el control total del
ambiente del animal,
pero es el animal quien
tiene que hacer el
trabajo.
Se diseño para que una
rata o pichón hiciera
cosas adentro en lugar
de escapar de ella.
Tiene una palanca, bajo
la cual se encuentra una
charola de comida.
Thorndike
skinner
La conducta debe ser
instrumental para generar
respuestas y así la conducta se
repita.
Aprendizaje por ensayo y error.
Caja de skinner (La rata trabaja
dentro no se escapa) Y el
experimentador tiene el control.
Skinner tiene términos objetivos y
descriptivos.
Thorndike racionales.
La conducta no debe ser
respondiente si no operante.
( No es una conducta refleja y todos
los factores influyen)
Un estimulo es la señal para que la respuesta ocurra. La
conducta se aprende después de ganarse algo.
Si la respuesta genera placer se queda si no se errade.
El tipo de respuesta que se
escoge puede ser cualquiera,
con tal que se pueda observar
objetiva y confiablemente.
REFORZADOR
El reforzador tiene que ser un
suceso cuya presencia
aumenta el nivel de la
respuesta definida.
cualquier cosa se acepta como
reforzador si logra aumentar el
nivel de la respuesta que se
pretende.
La respuesta tiene que ocurrir
antes que pueda reforzarse,
esto significa que el organismo
esta motivado para este
comportamiento.
CORRELACION DEL REFORZADOR CON LA
APARICION DEL TIPO DE RESPUESTA
El reforzador puede ocurrir despues de cada respuesta,
despues de cada decima respuesta; pero cualquiera que
sea la relacion, tiene que ser predecible.
Lo mas importante es que la relación entre
respuesta y reforzador sea confiable o
segura y predecible.
EL REFORZADOR TIENE QUE
SEGUIR A LA RESPUESTA
La esencia del aprendizaje por reforzamiento es que el
nivel de la respuesta esta a un nivel insignificante
antes del reforzador, y que el nivel de ejecución
aumenta con el reforzador.
Inmediatamente de producirse
la respuesta se da el
reforzador.
Medidas para el manejo de las variables del
reforzamiento
- Frecuencia
Numero de respuestas por unidad de
tiempo.
Antes del aprendizaje la conducta
ocurre con poca frecuencia, después
de que se inicia el proceso de
aprendizaje aumenta.
-Latencia
Tiempo que transcurre entre la
presentación de una señal y la
aparición de una respuesta
Conducta Supersticiosa
•Conducta sin sentido que ocurre
coincidiendo accidentalmente con un
reforzador, lo que aumenta la probabilidad
de que ocurra en el futuro.
•Ocurre el numero suficiente de veces para
que vuelva a repetirse.
* Esta conducta SE APRENDE.
REFORZADORES PRIMARIOS Y
SECUNDARIOS
El reforzador primario pertenece
íntimamente a los reforzadores que sirven
para la supervivencia biológica.
Por el contrario; el reforzador secundario
depende de una historia de aprendizaje; la
experiencia determina si un estimulo es un
reforzador o no.
Teorias del Reforzamiento
- Teoría de la reducción del impulso
- Teoría de contigüidad
TEORIA DE REDUCCION DE
IMPULSOS
Sostiene que la supervivencia biológica exige que el
organismo se desarrolle en condiciones suficientes de
determinados estados; y que cuando hay una desviación de
un estado optimo se produce un estado de necesidad
primaria o fundamental.
Hull afirma que el organismo
dispone de un jerarquia de
respuestas en cualquier situación
de aprendizaje instrumental,
y que una de ellas lleva al
reforzamiento y las otras no.
TEORIA DE LA CONTIGUIDAD
Una combinación de estímulos que ha
acompañado a un movimiento tendera, a
repetirse, a ser seguida por ese movimiento.
La función de una recompensa es la de apartar al animal de los
estímulos que actúan inmediatamente antes de la recompensa.
esto evita que el animal haga otras conductas contrarias al
estimulo y por tanto, cuando los estímulos ocurren de nuevo se
repite la respuesta.
Reforzador positivo
Es un estimulo que
aumenta o disminuye
la fuerza de una
respuesta o la
probabilidad de que
suceda.
Las conductas
condicionadas reciben el
nombre de
comportamiento operante..
(comportamiento
controlado por su
consecuencia)
Los estímulos no sirven como
reforzadores ya que dependen del
sujeto.
El termino recompensa
se usa incorrectamente
como sinónimo de
reforzador positivo.
Por tratamiento se pueden obtener 5 resultados según
se desea, al modificar una conducta…
1) Se adquiera o
desarrolle.
2) Se Fortalezca
3) Se mantenga
4) Disminuya o
5) Suprima por
completo.
La efectividad de un reforzador positivo depende
de su tamaño, cantidad, tipo o calidad y
es aun mejor si sigue inmediatamente a la
conducta deseada.
Reforzador negativo
Reforzamiento por
eliminación de un
estimulo.
El reforzador negativo
también incrementa la
conducta.
No debe confundirse
con el castigo.
Los reforzadores negativos pueden ser estímulos no
condicionados primarios como:
O secundarios como…
El reforzador negativo actúa en
dos tipos de aprendizaje:
Condicionamiento de
escape:
El organismo aprende a dar una
respuesta que pone fin a una
situación aversiva.
Condicionamiento de
evitación:
Tiene lugar cuando un organismo
responde ala señal de la
ocurrencia de un suceso
desagradable, de modo que hace
posible su evitación,.
Castigo
Estimulo que debilita o suprime la conducta o
respuesta.
Pueden ser estímulos incondicionados o
condicionados.
Condicionados: Amenazas, multas, supresión
de privilegios.
Incondicionados: choque eléctrico, luz, ruido
intenso, golpes.
Castigo Tipo 1
A una respuesta le sigue la aparición
de un estimulo aversivo.
Castigo Tipo 2
La conducta es seguida por la
remoción de un reforzador
positivo.
REFORZADOR
POSITIVO
REFORZADOR
NEGATIVO
Fortalece la conducta que
produce su presentación.
Fortalece la conducta que
tiene como resultado su
supresión o evitación.
CASTIGO
Debilita las conductas que
tienen como resultado
su presentación.
Extinción
La extinción es la eliminación de una consecuencia que
mantiene o intensifica una conducta. Es un método
eficaz para disminuir conductas indeseables.
La extinción requiere
la eliminación del
reforzador
responsable de
mantener la conducta
inapropiada.
Existen dos etapas de
conducta-respuesta
La primera se da inmediatamente después de que se ha eliminado el
reforzador que mantiene una conducta, esta por lo general aumenta o
disminuye con violencia.
Durante la segunda, la conducta blanco disminuye o aumenta
sistemáticamente(siguiendo un orden)
Se podrán encontrar dos dificultades:
La primera es la consistencia o sea, que el reforzamiento
positivo se debe eliminar cada vez que la conducta ocurra
con frecuencia, pero si la conducta se refuerza
intermitentemente, esto es no cada vez que ocurra sino en
ciertas ocasiones y en otras no, será mas difícil que se logre
la extinción.
La segunda es controlar el
suministro del reforzador, si no
se posee el control del ambiente
reforzante del individuo, puede haber
alguien que este reforzando el
comportamiento preciso que se trata de
extinguir.
Otra característica de la extinción es :
La recuperación espontanea.
Con frecuencia tras haberse extinguido el comportamiento,
regresa cuando se presenta una situación idéntica o similar
ala que antes dio origen al reforzamiento de la respuesta
extinguida.
Se entregara el reforzamiento periódicamente a intervalos
irregulares de tiempo, como en los programas de TF.
El reforzamiento no depende de la ejecución de una respuesta,
el reforzador se da a partir de un promedio de tiempo.
Programas de reforzamiento
Cada uno se asocia a
un patrón característico
de respuestas.
Otro aspecto importante de skinner
tiene que ver con los efectos de la
frecuencia en que se presentan los
reforzadores sobre la conducta.
Se dividen en dos :
1) Programas simples
2) Programas complejos
PROGRAMAS SIMPLES
• REFORZAMIENTO CONTINUO:
Se refuerza la conducta a cada respuesta.
es útil para moldear la conducta.
Este programa no es común en el ambiente natural, ya que
la conducta se refuerza en ocasiones y en otras no.
• REFORZAMIENTO INTERMITENTE:
Cuando el reforzamiento ocurre en algunas
ocasiones pero en otras no.
A su vez se divide en:
• RAZÓN FIJA:
• Cuando tiene que ocurrir un número determinado de
respuestas antes de que sobrevenga el reforzador, y
este número es constante en todo el aprendizaje.
• RAZÓN VARIABLE:
• El reforzamiento ocurre después de un número variable
de respuestas y no después de un número fijo
• La conducta deseada debe estar bien establecida en el
programa de razon fija antes de pasar a la de razón
variable.
• INTERVALO FIJO:
• Este programa es periodico, ya que se
refuerza la primera respuesta que ocurra
después de que ha transcurrido un
periodo especifico de tiempo.
• Se ha observado que en programas de intervalo fijo,
entre más largo sea el intervalo entre reforzamientos,
más bajo es el nivel de desempeño.
• INTERVALO VARIABLE:
• Este programa es aperiodico, las respuestas se
refuerzan después de intervalos de diverso
tamaño, cuya duración tiene un promedio de
acuerdo al valor que define al programa.
• Al igual que en el programa de intervalo fijo, sólo la
primera respuesta después del intervalo recibe el
reforzador.
• PROGRAMA DE TIEMPO FIJO:
• Se entrega un reforzador después de un
determinado periodo de tiempo,
independientemente de la conducta.
Reforzamiento diferencial de tasas bajas
(RDTB)
Se refuerza la respuesta solo si ocurre después de
un intervalo especifico de tiempo a partir de la ultima
respuesta.
Reforzamiento diferencial de tasas altas
(RDTA)
En este programa se requiere que ocurra un mínimo
de repuestas en un periodo determinado.
Reforzamiento diferencial de conducta incompatible
(RDCI)
Se refuerza una respuesta que es incompatible con
aquellas no deseadas.
Programas Complejos
(Combinaciones de los programas simples)
• Programa Múltiple
Una respuesta se encuentra bajo
control de 2 o más programas
simples, cada uno asociado con un
Estimulo particular.
MULT IF10 RV15
• Programa Encadenado (CADENA)
Se utilizan diversos programas uno seguido
del otro (cuando un programa termina o a
partir de una señal comienza el siguiente).
CADENA RF10 IF15 RV20
Moldeamiento
Es un método por el cual se puede establecer
una conducta que por lo general no emite un
individuo, o que quizá jamás ha producido o
tiene muy poca probabilidad de hacerlo.
Es un proceso gradual de reforzar
selectivamente la conducta que se
encuentra mas próxima a la conducta final
que deseamos.
Hay dos formas de intervenir para moldear
la conducta:
Progresiva
Cadena
Para iniciar la intervención se necesita que la conducta
se exhiba, y cuando esta ocurre debe recompensarse de
inmediato con un reforzador potente .
Instigación
Ayuda externa que se le puede dar a un
organismo.
Modelamiento
Es aprendizaje mediante
observación e imitación.
Como método de
modificación de conducta
se muestra al sujeto una
conducta individual para
que este la imite.
Según Bandura la
exposición a un modelo
tiene tres efectos.
Modelamiento o aprendizaje observacional: El
sujeto imita en forma prácticamente idéntica al modelo.
Efectos inhibidores y des inhibidores: Imitar a un
modelo a fin de inhibir o desinhibir una conducta .
(El niño puede imitar cuando a otro lo premian por hacer
algo bueno o viceversa)
Producir o facilitar una respuesta: La conducta modelo
se utiliza para facilitar la ocurrencia de una conducta ya
adquirida . ( Ej. decir gracias)
Antes de aplicar el modelamiento se
debe considerar…..
¿El sujeto esta capacitado
para seguir el modelo?
¿El modelo es bueno?
¿Se recompensara al sujeto por imitar
al modelo?
Un modelo que es
demasiado brillante,
bueno, rápido etc., será
rechazado por el sujeto.
Diseño A-B
Medida
de la variable
dependiente
Línea base A
Periodo experimental B
Tiempo (días, sesiones, periodos)
Diseño A-B-A
Medida
de la variable
dependiente
Línea base
A
Periodo experimental
B
Regresión a la
línea base
(inversión)
A
Tiempo ( días, sesiones, periodos)
Medida
de la
variable
dependiente
Línea
base
A
Periodo
experimental
B
Regresión a
la línea base
A
Tiempo ( días, sesiones, periodos)
Reinicio del
tratamiento
B
Medida
de la variable
dependiente
R.D.O.C.
Línea
base
A
Periodo
experimental
B
Reforzamiento
diferencial de otras
conductas
C
Tiempo ( días, sesiones, periodos)
Antes del
tratamiento
B