Download reforzador
Document related concepts
Transcript
CONDICIONAMIENTO INSTRUMENTAL Ley del Efecto - Thorndike La conexión estimulo – respuesta se imprime cuando un placer resulta del acto y se errade cuando no es así. a) Lo que sucede como resultado de la conducta influirá sobre esa conducta en el futuro. b) Si produce placer tiene la probabilidad de repetirse, si produce incomodidad no lo hará. Condicionamiento Operante - Skinner Las respuestas de un organismo no son necesariamente provocadas por algún estimulo, sino que están influidas por las consecuencias que ellas determinan en el ambiente (reforzadores). El ser humano puede ser estudiado aisladamente y no necesariamente en grupos, luego pueden hacerse generalizaciones. Mediante una cuidadosa recolección de datos puede lograrse un mayor progreso hacia la predicción y el control de la conducta, que a través de la formulación de grandes teorías. ANTECEDENTE CONDUCTA CONSECUENCIA Caja de Skinner Caja –problema. El experimentador tiene el control total del ambiente del animal, pero es el animal quien tiene que hacer el trabajo. Se diseño para que una rata o pichón hiciera cosas adentro en lugar de escapar de ella. Tiene una palanca, bajo la cual se encuentra una charola de comida. Thorndike skinner La conducta debe ser instrumental para generar respuestas y así la conducta se repita. Aprendizaje por ensayo y error. Caja de skinner (La rata trabaja dentro no se escapa) Y el experimentador tiene el control. Skinner tiene términos objetivos y descriptivos. Thorndike racionales. La conducta no debe ser respondiente si no operante. ( No es una conducta refleja y todos los factores influyen) Un estimulo es la señal para que la respuesta ocurra. La conducta se aprende después de ganarse algo. Si la respuesta genera placer se queda si no se errade. El tipo de respuesta que se escoge puede ser cualquiera, con tal que se pueda observar objetiva y confiablemente. REFORZADOR El reforzador tiene que ser un suceso cuya presencia aumenta el nivel de la respuesta definida. cualquier cosa se acepta como reforzador si logra aumentar el nivel de la respuesta que se pretende. La respuesta tiene que ocurrir antes que pueda reforzarse, esto significa que el organismo esta motivado para este comportamiento. CORRELACION DEL REFORZADOR CON LA APARICION DEL TIPO DE RESPUESTA El reforzador puede ocurrir despues de cada respuesta, despues de cada decima respuesta; pero cualquiera que sea la relacion, tiene que ser predecible. Lo mas importante es que la relación entre respuesta y reforzador sea confiable o segura y predecible. EL REFORZADOR TIENE QUE SEGUIR A LA RESPUESTA La esencia del aprendizaje por reforzamiento es que el nivel de la respuesta esta a un nivel insignificante antes del reforzador, y que el nivel de ejecución aumenta con el reforzador. Inmediatamente de producirse la respuesta se da el reforzador. Medidas para el manejo de las variables del reforzamiento - Frecuencia Numero de respuestas por unidad de tiempo. Antes del aprendizaje la conducta ocurre con poca frecuencia, después de que se inicia el proceso de aprendizaje aumenta. -Latencia Tiempo que transcurre entre la presentación de una señal y la aparición de una respuesta Conducta Supersticiosa •Conducta sin sentido que ocurre coincidiendo accidentalmente con un reforzador, lo que aumenta la probabilidad de que ocurra en el futuro. •Ocurre el numero suficiente de veces para que vuelva a repetirse. * Esta conducta SE APRENDE. REFORZADORES PRIMARIOS Y SECUNDARIOS El reforzador primario pertenece íntimamente a los reforzadores que sirven para la supervivencia biológica. Por el contrario; el reforzador secundario depende de una historia de aprendizaje; la experiencia determina si un estimulo es un reforzador o no. Teorias del Reforzamiento - Teoría de la reducción del impulso - Teoría de contigüidad TEORIA DE REDUCCION DE IMPULSOS Sostiene que la supervivencia biológica exige que el organismo se desarrolle en condiciones suficientes de determinados estados; y que cuando hay una desviación de un estado optimo se produce un estado de necesidad primaria o fundamental. Hull afirma que el organismo dispone de un jerarquia de respuestas en cualquier situación de aprendizaje instrumental, y que una de ellas lleva al reforzamiento y las otras no. TEORIA DE LA CONTIGUIDAD Una combinación de estímulos que ha acompañado a un movimiento tendera, a repetirse, a ser seguida por ese movimiento. La función de una recompensa es la de apartar al animal de los estímulos que actúan inmediatamente antes de la recompensa. esto evita que el animal haga otras conductas contrarias al estimulo y por tanto, cuando los estímulos ocurren de nuevo se repite la respuesta. Reforzador positivo Es un estimulo que aumenta o disminuye la fuerza de una respuesta o la probabilidad de que suceda. Las conductas condicionadas reciben el nombre de comportamiento operante.. (comportamiento controlado por su consecuencia) Los estímulos no sirven como reforzadores ya que dependen del sujeto. El termino recompensa se usa incorrectamente como sinónimo de reforzador positivo. Por tratamiento se pueden obtener 5 resultados según se desea, al modificar una conducta… 1) Se adquiera o desarrolle. 2) Se Fortalezca 3) Se mantenga 4) Disminuya o 5) Suprima por completo. La efectividad de un reforzador positivo depende de su tamaño, cantidad, tipo o calidad y es aun mejor si sigue inmediatamente a la conducta deseada. Reforzador negativo Reforzamiento por eliminación de un estimulo. El reforzador negativo también incrementa la conducta. No debe confundirse con el castigo. Los reforzadores negativos pueden ser estímulos no condicionados primarios como: O secundarios como… El reforzador negativo actúa en dos tipos de aprendizaje: Condicionamiento de escape: El organismo aprende a dar una respuesta que pone fin a una situación aversiva. Condicionamiento de evitación: Tiene lugar cuando un organismo responde ala señal de la ocurrencia de un suceso desagradable, de modo que hace posible su evitación,. Castigo Estimulo que debilita o suprime la conducta o respuesta. Pueden ser estímulos incondicionados o condicionados. Condicionados: Amenazas, multas, supresión de privilegios. Incondicionados: choque eléctrico, luz, ruido intenso, golpes. Castigo Tipo 1 A una respuesta le sigue la aparición de un estimulo aversivo. Castigo Tipo 2 La conducta es seguida por la remoción de un reforzador positivo. REFORZADOR POSITIVO REFORZADOR NEGATIVO Fortalece la conducta que produce su presentación. Fortalece la conducta que tiene como resultado su supresión o evitación. CASTIGO Debilita las conductas que tienen como resultado su presentación. Extinción La extinción es la eliminación de una consecuencia que mantiene o intensifica una conducta. Es un método eficaz para disminuir conductas indeseables. La extinción requiere la eliminación del reforzador responsable de mantener la conducta inapropiada. Existen dos etapas de conducta-respuesta La primera se da inmediatamente después de que se ha eliminado el reforzador que mantiene una conducta, esta por lo general aumenta o disminuye con violencia. Durante la segunda, la conducta blanco disminuye o aumenta sistemáticamente(siguiendo un orden) Se podrán encontrar dos dificultades: La primera es la consistencia o sea, que el reforzamiento positivo se debe eliminar cada vez que la conducta ocurra con frecuencia, pero si la conducta se refuerza intermitentemente, esto es no cada vez que ocurra sino en ciertas ocasiones y en otras no, será mas difícil que se logre la extinción. La segunda es controlar el suministro del reforzador, si no se posee el control del ambiente reforzante del individuo, puede haber alguien que este reforzando el comportamiento preciso que se trata de extinguir. Otra característica de la extinción es : La recuperación espontanea. Con frecuencia tras haberse extinguido el comportamiento, regresa cuando se presenta una situación idéntica o similar ala que antes dio origen al reforzamiento de la respuesta extinguida. Se entregara el reforzamiento periódicamente a intervalos irregulares de tiempo, como en los programas de TF. El reforzamiento no depende de la ejecución de una respuesta, el reforzador se da a partir de un promedio de tiempo. Programas de reforzamiento Cada uno se asocia a un patrón característico de respuestas. Otro aspecto importante de skinner tiene que ver con los efectos de la frecuencia en que se presentan los reforzadores sobre la conducta. Se dividen en dos : 1) Programas simples 2) Programas complejos PROGRAMAS SIMPLES • REFORZAMIENTO CONTINUO: Se refuerza la conducta a cada respuesta. es útil para moldear la conducta. Este programa no es común en el ambiente natural, ya que la conducta se refuerza en ocasiones y en otras no. • REFORZAMIENTO INTERMITENTE: Cuando el reforzamiento ocurre en algunas ocasiones pero en otras no. A su vez se divide en: • RAZÓN FIJA: • Cuando tiene que ocurrir un número determinado de respuestas antes de que sobrevenga el reforzador, y este número es constante en todo el aprendizaje. • RAZÓN VARIABLE: • El reforzamiento ocurre después de un número variable de respuestas y no después de un número fijo • La conducta deseada debe estar bien establecida en el programa de razon fija antes de pasar a la de razón variable. • INTERVALO FIJO: • Este programa es periodico, ya que se refuerza la primera respuesta que ocurra después de que ha transcurrido un periodo especifico de tiempo. • Se ha observado que en programas de intervalo fijo, entre más largo sea el intervalo entre reforzamientos, más bajo es el nivel de desempeño. • INTERVALO VARIABLE: • Este programa es aperiodico, las respuestas se refuerzan después de intervalos de diverso tamaño, cuya duración tiene un promedio de acuerdo al valor que define al programa. • Al igual que en el programa de intervalo fijo, sólo la primera respuesta después del intervalo recibe el reforzador. • PROGRAMA DE TIEMPO FIJO: • Se entrega un reforzador después de un determinado periodo de tiempo, independientemente de la conducta. Reforzamiento diferencial de tasas bajas (RDTB) Se refuerza la respuesta solo si ocurre después de un intervalo especifico de tiempo a partir de la ultima respuesta. Reforzamiento diferencial de tasas altas (RDTA) En este programa se requiere que ocurra un mínimo de repuestas en un periodo determinado. Reforzamiento diferencial de conducta incompatible (RDCI) Se refuerza una respuesta que es incompatible con aquellas no deseadas. Programas Complejos (Combinaciones de los programas simples) • Programa Múltiple Una respuesta se encuentra bajo control de 2 o más programas simples, cada uno asociado con un Estimulo particular. MULT IF10 RV15 • Programa Encadenado (CADENA) Se utilizan diversos programas uno seguido del otro (cuando un programa termina o a partir de una señal comienza el siguiente). CADENA RF10 IF15 RV20 Moldeamiento Es un método por el cual se puede establecer una conducta que por lo general no emite un individuo, o que quizá jamás ha producido o tiene muy poca probabilidad de hacerlo. Es un proceso gradual de reforzar selectivamente la conducta que se encuentra mas próxima a la conducta final que deseamos. Hay dos formas de intervenir para moldear la conducta: Progresiva Cadena Para iniciar la intervención se necesita que la conducta se exhiba, y cuando esta ocurre debe recompensarse de inmediato con un reforzador potente . Instigación Ayuda externa que se le puede dar a un organismo. Modelamiento Es aprendizaje mediante observación e imitación. Como método de modificación de conducta se muestra al sujeto una conducta individual para que este la imite. Según Bandura la exposición a un modelo tiene tres efectos. Modelamiento o aprendizaje observacional: El sujeto imita en forma prácticamente idéntica al modelo. Efectos inhibidores y des inhibidores: Imitar a un modelo a fin de inhibir o desinhibir una conducta . (El niño puede imitar cuando a otro lo premian por hacer algo bueno o viceversa) Producir o facilitar una respuesta: La conducta modelo se utiliza para facilitar la ocurrencia de una conducta ya adquirida . ( Ej. decir gracias) Antes de aplicar el modelamiento se debe considerar….. ¿El sujeto esta capacitado para seguir el modelo? ¿El modelo es bueno? ¿Se recompensara al sujeto por imitar al modelo? Un modelo que es demasiado brillante, bueno, rápido etc., será rechazado por el sujeto. Diseño A-B Medida de la variable dependiente Línea base A Periodo experimental B Tiempo (días, sesiones, periodos) Diseño A-B-A Medida de la variable dependiente Línea base A Periodo experimental B Regresión a la línea base (inversión) A Tiempo ( días, sesiones, periodos) Medida de la variable dependiente Línea base A Periodo experimental B Regresión a la línea base A Tiempo ( días, sesiones, periodos) Reinicio del tratamiento B Medida de la variable dependiente R.D.O.C. Línea base A Periodo experimental B Reforzamiento diferencial de otras conductas C Tiempo ( días, sesiones, periodos) Antes del tratamiento B