Download Tema 4 El Aprendizaje
Document related concepts
Transcript
TEMA 4 EL APRENDIZAJE La capacidad de aprendizaje es la más importante de todas las disposiciones innatas y filogenéticos que nos permiten adaptarnos y sobrevivir en un mundo cambiante y complejo. APRENDIZAJE Y DISPOSICIONES INNATAS DEFINICIÓN DE APRENDIZAJE: El aprendizaje es un cambio relativamente permanente de los mecanismos de la conducta, debido a la experiencia con los acontecimientos del medio. El aprendizaje supone un cambio en los mecanismos de la conducta, no un cambio en la conducta misma. Los cambios en la conducta pueden deberse otros procesos distintos del aprendizaje. La conducta está determinada también por otros factores además del aprendizaje: motivación, oportunidad, capacidades motoras y sensoriales del organismo. Lo que se observa es la ejecución de la conducta, no el aprendizaje de la conducta. No se puede considerar automáticamente, que un cambio en la ejecución de la conducta refleje aprendizaje. A partir de los cambios en la conducta (ejecución) se infieren los cambios en los mecanismos de la conducta (aprendizaje). Los cambios en la conducta producidos por el aprendizaje no siempre son permanentes. Como consecuencia de una nueva experiencia, puede que una conducta previamente aprendida no vuelva a darse. Existen otros mecanismos que producen cambios permanentes en la conducta, pero que no se consideran aprendizaje, como el desarrollo madurativo. Aunque el aprendizaje se distinga de la maduración y la evolucion, no es independiente de estas fuentes de cambio conductual. La aparición de un proceso concreto de aprendizaje, o como este opere, depende del nivel de maduración del sujeto y de su historia evolutiva (Domjan y Burkhard, 1986). En las conductas instintivas no se requiere adiestramiento alguno para realizarlas; las conductas que no se pueden efectuar sin adiestramiento reflejan aprendizaje. El aprendizaje implica un cambio inferido en el estado mental de un organismo, el conocimiento ha de codificarse o representarse de algún modo en la estructura neurológica del organismo; y además un cambio en el potencial de conducta, se distingue entre el estado de conocimiento y la conducta manifiesta, Tarpy y Meyer (1978); El aprendizaje es un cambio inferido en el estado mental de un organismo, el cual es una consecuencia de la experiencia e influye de forma relativamente permanente en el potencial del organismo para la conducta adaptativa posterior. Tenemos que un sujeto puede adquirir unos conocimientos y, sin embargo, no comportarse de forma tal que demuestre la adquisición de esos conocimientos; no obstante ese sujeto posee ese potencial de comportamiento aun cuando realmente no está ejecutando esa conducta. PATRONES INNATOS DE CONDUCTA: Las conductas innatas tienen un sustrato órgano-fisiológico. Muchas especies no toman parte en ningún aprendizaje significativo porque no lo necesitan, sus capacidades innatas bastan para afrontar las exigencias del espacio ecológico donde habitan (Tarpy, 1997). Tarpy (1997), las conductas son innatas cuando los individuos que las realizan han sido aislados desde su nacimiento y no han tenido ocasión de aprenderlas; son muy estereotipadas; se realizan de modo ritual e invariable y están sujetas a la modificación por la selección a lo largo de generaciones sucesivas por medio de la selección, y estas conductas las realizan los individuos aun cuando se les coloca en un contexto diferente. Dentro de los comportamientos innatos se incluyen tradicionalmente los reflejos y los instintos: Los reflejos son las formas más elementales de la coordinación motora. Una acción refleja es una respuesta relativamente estereotipada frente a un estímulo sensorial específico; son respuestas innatas, involuntarias, automáticas y universales que existen en todos los organismos que tienen sistema nervioso. Los reflejos se han desarrollo para proporcionar un ajuste comportamental rápido. El arco reflejo es la conexión neural más simple, y supone el mínimo de conexiones neuronales necesarias para la acción refleja. Los reflejos innatos tienen diferentes grados de complejidad; los más simples se sitúan al nivel de la médula espinal, pero otros implican otras estructuras como el tronco cerebral. Los reflejos innatos son una parte importante del repertorio conductual de un recién nacido, mientras otros reflejos requieren cierto grado de desarrollo o maduración por parte del organismo. Ej. Reflejo de extensión, de flexión, palpebral, salivar, plantar, rotuliano, etc. LOS INSTINTOS: Son los patrones innatos más complejos; una conducta instintiva suele estar provocada por una concatenación de acontecimientos o estímulos que provocan comportamientos complejos, propios de una especie particular. La conducta instintiva está programada filogenéticamente a nivel neuronal. Los programas neuronales en los que se apoya la conducta instintiva se denominan mecanismos de desencadenamiento innato, y los estímulos que los ponen en marcha son los estímulos índice. Los estímulos índice activan los programas neuronales y se desencadena una secuencia de conductas relativamente fijas, que son instintivas. Estas conductas suponen unas pautas fijas de acción. Tienen dos fases: fase apetitiva y fase terminal o de consumación. La fase apetitiva, que es considerada como el componente motivacional del instinto, es una fase inicial de búsqueda de un medio o situación apropiada para iniciar la siguiente fase, que es la fase terminal de consumación o descarga. En un sentido restringido el instinto sería la parte final de este ciclo, la fase consumatoria del proceso, conductas estereotipadas propias de cada especie. La conducta instintiva está mediada en muchos casos por el aprendizaje, (sobre todo en la fase apetitiva). A medida que se asciende en la escala filogenético existe mayor flexibilidad y con ello la posibilidad de aprendizaje, sobre todo de los estímulos que elicitan el instinto y de las conductas instintivas de búsqueda. HABITUACIÓN Y SENSIBILIZACIÓN: Los cambios en las reacciones innatas de los de los animales ante los estímulos ambientales tienen un elevado valor adaptativo (García, Brett y Rusiniak, 1989) Los mecanismos de habituación y sensibilización ayudan a reducir la reactividad a los estímulos irrelevantes y a canalizar la conducta a través de acciones organizadas y dirigidas en respuesta a sólo algunos de los estímulos que se presentan. (Domjan y Burkard, 1986). Groves y Thompson (1970) sugieren que la habituación refleja una disminución en la disposición de los reflejos innatos para responder. Como consecuencia de la exposición repetida a un estímulo, disminuye su capacidad para provocar la respuesta, La sensibilización, en cambio, refleja un aumento de la tendencia a reaccionar ante cualquier estímulo. HABITUACIÓN: Con la habituación disminuye la disposición para responder ante un estímulo específico como consecuencia de la experiencia repetida con dicho estímulo (Klein, 1987), El sujeto deja de responder a un estímulo aunque sigue siendo capaz de percibir el estímulo y de realizar los movimientos musculares que requiere la respuesta, por lo que la habituación es diferente de la adaptación sensorial, que es la una disminución en la sensibilidad de algún órgano de los sentidos, y también la habituación es diferente de la fatiga, donde los músculos que intervienen en una respuesta no lo hacen debido al agotamiento. Cuando se presenta por primera vez un estímulo, o si existe un cambio en los parámetros de un estímulo presente, se produce una respuesta (refleja) de orientaciónEs una forma de ADAPTACIÓN. Los estímulos débiles producen mayor habituación. SENSIBILIZACIÓN: Es el incremento en la reacción ante los acontecimientos ambientales (1987) sin que ocurra condicionamiento, ya que sí se trata de un aprendizaje. Los procesos de sensibilización tiene, en general, efectos temporales. Aunque en algunos casos la sensibilización persiste durante varias semanas, en la mayoría de las situaciones el aumento de la disposición a responder es de corta duración. El carácter temporal de un aumento en las respuestas puede servir para identificarlo como un fenómeno de sensibilización. La duración de los efectos de la sensibilización está determinada por la intensidad del estímulo que la produjo. Cuanto más intenso es el estímulo más aumenta la disponibilidad de responder y es mayor la duración de los efectos de la sensibilización. También con los estímulos intensos se produce una mayor sensibilización a medida que se incrementa la frecuencia del estímulo. En contraste con la habituación, la sensibilización es menos específica para un estímulo. Si un animal se sensibiliza o activa por cualquier motivo. Su reactividad aumentará hacia una variedad de estímulos. CONDICIONAMIENTO CLÁSICO Implica el aprendizaje de relaciones entre estímulos (EC y EI) Es el mecanismo más simple por el que los organismos aprenden a dar respuestas nuevas a los estímulos y aprenden las relaciones entre los estímulos. Es un proceso de aprendizaje mediante el cual un estímulo que previamente no suscitaba una respuesta, acaba provocándola a consecuencia de su asociación temporal con otro estímulo que sí provoca la respuesta. Pavlov, (1849-1936), (“Los refejos condicionados” 1927), en 1904 obtuvo el premio Nobel de Fisiología por sus trabajos relacionados con la digestión. Fisiólogo ruso, fue su descubridor de forma casual, y en relación con el reflejo salivar con perros. Considero la salivación anticipatorio como una manifestación de una respuesta refleja provocada por el estímulo de la comida. Esta nueva respuesta era resultado del aprendizaje asociativo: el alimento, que ya provocaba salivación, se asoció, por ej. Con el experimentador, éste entonces provocaba salivación. Pavlov (1927) sugirió que tanto los animales como el hombre poseen reflejos incondicionados o innatos, los cuales constan de dos elementos: 1- un Estímulo Incondicionado E I (por ej. comida), que provoca 2- una Respuesta Incondicionada R I (por ej. salivación); y cuando un estímulo ambiental neutro aparece junto con el E I, se forma un nuevo reflejo denominado reflejo condicionado. El estímulo neutro se convierte en el estímulo condicionado EC (por ej. un sonido o luz), y es capaz de provocar la respuesta aprendida o respuesta condicionada RC (por ej. salivar ante el sonido o luz). Cualquier estímulo neutro emparejado con un estímulo incondicionado puede, mediante el condicionamiento, adquirir la capacidad de provocar una respuesta. Los procedimientos del condicionamiento clásico se centran en la relación temporal entre los distintos estímulos. PARADIGMA DEL CONDICIONAMIENTO CLÁSICO(CC): El paradigma del condicionamiento clásico que Pavlov utilizó para estudiar la salivación anticipatorio. El estímulo incondicionado (EI) que produce de forma automática una respuesta incondicionada (RI) que es una respuesta refleja innata al estímulo incondicionado; y un estímulo condicionado (EC), con respecto al cual se ha comprobado que al principio no produce una respuesta que se asemeje a la RI. Se presenta el EC y el EI repetidamente en este orden y se desarrolla una respuesta al EC semejante a la RI; esta respuesta se llama respuesta condicionada (RC) y supone una respuesta aprendida. Mediante el condicionamiento clásico se obtiene funciones ECRC. Antes del condicionamiento: EC (tono) ………………………………….Ninguna respuesta E I (comida)………………………………...R I (salivación) Durante el condicionamiento: Emparejamiento repetido. EC (tono) seguido por E I (comida)………R I (salivación) Después del condicionamiento: EC (tono)………………………………….RC (salivación) FASES ESENCIALES DEL CONDICIONAMIENTO CLÁSICO (C C) Un estudio de condicionamiento clásico incluye las fases de adquisición y extinción: 1. ADQUISICIÓN: El condicionamiento clásico (CC), es un proceso gradual en el que un estímulo adquiere la capacidad de provocar una respuesta condicionada, pasando a ser un estímulo condicionado; esta capacidad se adquiere a través de la asociación o emparejamiento repetido con un estímulo incondicionado, a este proceso se le denomina adquisición. La fuerza de la asociación que se desarrolla durante el período de adquisición depende de las condiciones particulares utilizadas en el entrenamiento. 2. EXTINCIÓN de la respuesta condicionada: Si después del condicionamiento se presenta el estímulo condicionado, sin ir seguido del estímulo incondicionado, la intensidad de la respuesta condicionada disminuye. A este procedimiento lo denominó extinción, que es el proceso de eliminación de una respuesta previamente condicionada. La fuerza de la RC disminuye al incrementar el número de presentaciones del EC solo, sin ir seguido del EI, hasta que finalmente el EC no provoca la RC. En la extinción el estímulo que interviene había sido condicionado de antemano; en la habituación no se requiere una fase previa de condicionamiento al estímulo (Domjan y Burkhard, 1986). En la extinción de una respuesta condicionada influyen tres factores: La fuerza de la respuesta condicionada, cuanto más fuerte es la RC al final de la adquisición, más tiempo tardará en extinguirse. Hall (1976) podría ser que la omisión del EI durante la extinción modifica el nivel motivacional del sujeto respecto de la adquisición y, por consiguiente, disminuyera la correlación entre el nivel de adquisición de la RC y su resistencia a la extinción. El porcentaje de ensayos en los que el E I (estímulo incondicionado) sigue al EC (estímulo condicionado), además de presentar de forma emparejada el EC con el EI durante la adquisición, si se presenta en algunos ensayos de adquisición el EC sin el EI, se produce generalmente una extinción más lenta de la RC que emparejando siempre el EC con el EI (Humphreys, 1939). La duración de la exposición al EC, cuanto más prolongado es la exposición al EC durante la extinción, mayor es la reducción en la fuerza de la RC. La tasa de extinción está determinada por la duración total de la exposición al EC solo, y no por el número de ensayos de extinción; se demuestra que al aumentar la duración de la exposición al EC se debilita la fuerza de la RC (Shipley, 1974; Monti y Smith, 1976) Tras la fase de extinción, y a pesar de que la RC ha disminuído, la asociación del EC – E I permanece relativamente intacta, no se elimina a consecuencia del procedimiento de extinción, sino que únicamente resulta suprimida o inhibida. Existen varios hallazgos que demuestran este hecho: Recuperación espontánea: la fuerza de la RC (respuesta condicionada) se recobra espontáneamente, sin un entrenamiento adicional, si el período de extinción va seguido de un intervalo de descanso. Deshinibición: se presenta cuando después de una serie de ensayos de extinción se presenta un estímulo novedoso y se produce una recuperación espontánea de la respuesta al EC extinguido. A esta recuperación de la RC producida por la novedad de un estímulo se denomina desinhibición. La recuperación espontánea ocurre simplemente por el paso del tiempo, y la desinhibición por la presentación de un estímulo novedoso. Renovación de la respuesta condicionada: si la extinción del EC se efectúa en un entorno distinto al de la adquisición, la fuerza de la RC se recupera si se expone al contexto inicial de adquisición. (Boston, 1991; Boston y Swartzentruber, 1991). Generalización: si un estímulo concreto es condicionado, se puede dar la respuesta condicionada RC en presencia de condicionado. estímulos semejantes al estímulo CONDICIONAMIENTO CLÁSICO EXCITATORIO ( EC+ (estímulo condicionado en este cond. cl.)): Es la modalidad de condicionamiento clásico más conocida es el condicionamiento clásico excitatorio. Se aprende una respuesta al estímulo condicionado que es congruente con el estímulo incondicionado. Como resultado del emparejamiento EC E I, el estímulo condicionado excita o activa una respuesta coherente con el E I. Al estímulo condicionado en este condicionamiento excitatorio se le designa como EC+. La excitación condicionada ocurre cuando la presentación del EC va seguida de la presentación del EI. Dentro del condicionamiento excitatorio se distinguen dos modalidades: Puede ser excitatorio apetitivo cuando un EC va seguido de un EI apetitivo (ej, comida o agua) y excitatorio aversivo Bechterev (1913) hacía sonar un tono neutro EC y segundos después aplicaba una leve descarga eléctrica a la pata delantera del perro. La RI a la descarga eléctrica era forcejear y retirar la pata; tras presentaciones reiteradas de estos dos estímulos el tono provocaba la reacción de retirar la pata. Factores que influyen en el Condicionamiento Clásico son: Relaciones temporales, Intensidad del EC y EI y Naturaleza del EC Procedimientos del EC+ relaciones temporales: En los procedimientos del condicionamiento excitatorio se han empleado paradigmas diferentes que pueden explicarse en función del nexo asociativo EC-EI y suponen variaciones temporales entre ambos estímulos. Se reconoce que la relación temporal entre EC y E I es uno de los factores más importantes que determinan el desarrollo del condicionamiento clásico. Estos procedimientos que constituyen diferentes formas de emparejar un EC con un EI, no poseen la misma efectividad. Para poder compararlos y ver la forma en que se produce el aprendizaje con los distintos procedimientos hay unas medidas aplicables a todos ellos. Medida o índice de condicionamiento: latencia de respuesta condicionada: Tiempo transcurrido entre el inicio del EC y el inicio de la RC. Procedimientos: CONDICIONAMIENTO DE DEMORA: es normalmente el más eficaz; el EC se presenta antes que el E I, y la terminación del EC coincide con la aparición del EI o durante la presentación del mismo. Puede ser de demora corto, menos de un minuto, larga el EC cinco-diez minutos, antes de la aparición del EI. La retención de la RC al comienzo de EC en el condicionamiento de demora larga se conoce como inhibición de la demora. EC EI CONDICIONAMIENTO DE HUELLA: el EC comienza y termina antes de la aparición del EI. Se diferencia del C. De demora en que el EC acaba antes de producirse el inicio del EI. Existe un intervalo temporal antes de la presentación del EI durante el cual no se administra el EC. El intervalo entre el final del EC y el principio del EI se llama Intervalo de Huella. La superioridad del procedimiento de demora sobre de huella depende en parte de otras características del experimento, como la intensidad del EI y la demora total entre el inicio del EC y el inicio del EI (Tarpy, 1997). En determinadas circunstancias el procedimiento de huella, en vez de enseñar a los sujetos a ejecutar la respuesta, éstos aprenden a inhibir o retener la respuesta condicionada (Kaplan, 1984). EC EI CONDICIONAMIENTO SIMULTÁNEO: el EC y el EI se presentan a la vez. En algunos experimentos se ha encontrado que este condicionamiento es ineficaz. EC EI CONDICIONAMIENTO HACIA ATRÁS (retroactivo o retrógrado): es el menos eficaz; el EI comienza y termina antes de que se presente el EC. El EI precede al EC. Algunos estudios indican que sólo se produce condicionamiento hacia atrás cuando se utilizan estímulos incondicionados nocivos y cuando se administra un número pequeño de emparejamientos EC-EI (Spetch, Wilkie y Pinel, 1981). EC EI Pseudocondicionamiento: Se produce este fenómeno cuando la exposición únicamente al EI sólo, sin emparejamientos del EC-EI, produce por sí misma respuestas al EC, que se asemejan a la RC. Otros factores que influyen en el condicionamiento son la INTENSIDAD del EC y del EI, y la NATURALEZA del EC. Según Seligman, existe una predisposición biológica a asociar algunos EC con EI. Condicionamiento CLÁSICO INHIBITORIO EC-: Otra modalidad del condicionamiento clásico es el condicionamiento clásico inhibitorio EC-. Los estímulos se pueden condicionar para señalar la ausencia de un EI venidero, del mismo modo que se condicionan para señalar la aparición de un EI. El EC-, mediante el condicionamiento, adquiere propiedades antagónicas respecto a un EC+. Mediante este condicionamiento se aprende a inhibir o retener una respuesta condicionada, se aprende que un estímulo señala la ausencia de un EI. Un estímulo EC se convierte en inhibitorio como consecuencia del emparejamiento del EC con la ausencia de un EI. INHIBICIÓN EXTERNA: Se produce cuando en el curso del condicionamiento se presenta un nuevo estímulo y hace que se reduzca la fuerza de la RC, supone una activación temporal del estado inhibitorio. INHIBICIÓN LATENTE: Se produce cuando la exposición al EC antes del condicionamiento hace que dicho estímulo adquiera propiedades inhibitorias que interfieren con el condicionamiento excitatorio al emparejar posteriormente el EC con el EI. La nota común de estos procesos es que no son permanentes, son transitorios temporalmente. La inhibición de la RC puede llegar a ser un proceso permanente. Se supone que la inhibición condicionada refleja la capacidad del EC- para activar el estado inhibitorio, el cual puede suprimir la RC. Desde el punto de vista del procedimiento un EC se convierte en inhibitorio cuando en el curso de un condicionamiento excitatorio normal se empareja con la ausencia de un EI; como consecuencia, el estímulo provoca una reacción contraria a la de un EC excitatorio. Procedimientos del EC - Relaciones temporales: Al condicionar un estímulo para que señale la ausencia de algún EI, este EI se presente periódicamente en la situación experimental (Domjan y Burkard, 1986). Existen varios procedimientos para crear una inhibición condicionada: PROCEDIMIENTO ESTÁNDAR: Incluye dos estímulos condicionados y dos modalidades de ensayo de condicionamiento, repetidas en un orden aleatorio. En algunos ensayos se presenta el EC+ seguido del EI, y en otros se presenta el EC+ junto con el EC- sin ir seguidos del EI; el EC- en este caso es el único acontecimiento informante de la ausencia del E I. Los ensayos en los que se presentan simultáneamente el EC+/EC- sin ir seguidos del EI se denominan ensayos de condicionamiento inhibitorio. INHIBICIÓN DIFERENCIAL: En algunos ensayos se presenta el EC+ seguido del EI, y en otros se presenta el EC- seguido de la ausencia del EI. Parecido al anterior, no se presentan simultáneamente el EC+ y el EC-. El EC+ no está presente en los ensayos de condicionamiento inhibitorio, el EC- se convierte es estímulo inhibitorio condicionado. CONTINGENCIA NEGATIVA EC-EI o DESEMPAREJAMIENTO EXPLÍCITO: Se diferencia de los anteriores en que no hay emparejamiento del EC+ y EI, )por lo que al estímulo condicionado inhibitorio se le puede llamar simplemente EC ). Consiste en presentar los EC y los EI de modo que no aparezcan simultáneamente; el EC aparece en el intervalo entre las presentaciones del EI. Para medir la inhibición condicionada se utiliza: o La prueba de la conducta dirigida o La prueba de sumación o del estímulo complejo o La prueba del retraso en la adquisicióN Procedimiento estándar E.C.+ E.C. E.C. E.C.+ E.I. E.I. CONDICIONAMIENTO INSTRUMENTAL (OPERANTE El condicionamiento pavloviano implica el aprendizaje del estímulo, el condicionamiento instrumental concierne al aprendizaje de la respuesta (Tarpy, 1997). El condicionamiento instrumental es un tipo de aprendizaje que se refiere a la conducta voluntaria. Una conducta se desarrolla por las consecuencias que produce. La respuesta que tiene lugar principalmente porque sirve de instrumento para producir ciertas consecuencias se llama conducta instrumental. Los procesamientos se centran en la relación entre las apariciones o ejecuciones de una respuesta específica (instrumental) y la administración del reforzador o refuerzo. El condicionamiento Instrumental se basa en la ejecución de una respuesta específica y la administración del reforzador. El inicio de la investigación sobre condicionamiento instrumental tuvo su comienzo con el trabajo de Thorndike:(1911) denomina al fortalecimiento de la asociación E-R, debido a un acontecimiento satisfactorio o recompensa como: ley del efecto: Esta ley establece que si una respuesta que se ejecuta en presencia de un estímulo va seguida de un hecho satisfactorio, la asociación entre estímulo y la respuesta se fortalece; si la respuesta va seguida de un hecho molesto, la asociación se debilita. Esta ley se considera como precursora del reforzamiento. Algunos autores hacen la distinción entre dos tipos de condicionamiento: condicionamiento instrumental y condicionamiento operante: Condicionamiento instrumental / condicionamiento operante: En el condicionamiento instrumental el ambiente limita las posibilidades de recompensa, la persona o el animal estudiados tienen una oportunidad limitada de comportarse (Klein (1987). En el condicionamiento operante implica situaciones en las que no hay ninguna limitación en la cantidad de reforzamiento que puede obtenerse (el animal o la persona controla la frecuencia de la respuesta y por tanto, puede determinar la cantidad de refuerzo obtenido). Klein (1987) el concepto de recompensa se utiliza generalmente en situaciones de condicionamiento instrumental, el término reforzador se emplea en el condicionamiento operante. Skinner propuso la palabra operante para definir la conducta que produce cambios o que opera en el medio o en el ambiente. No obstante, la mayoría de los autores consideran únicamente como término general el de condicionamiento instrumental, que englobaría dos tipos de métodos de estudio: Los métodos de ensayos discretos o aprendizaje ensayo a ensayo, respuesta única, las posibilidades de respuesta en estas situaciones esta restringidas, oportunidad limitada de comportarse y obtener la recompensa; el número total máximo de respuestas que puede realizar coincide con el número de ensayos. Y los de operante libre. Skinner (1938) el término operante como forma de dividir la conducta en unidades significativas y medibles. La palabra operante se refiere a una conducta que produce cambios en el medio o ambiente. Skinner los estímulos ambientales señalan la ocasión para la respuesta. Estos estímulos informan de cuándo está disponible el reforzamiento y actúan motivando la conducta operante. Se utilizara como medida la probabilidad de la respuesta la tasa de aparición de la conducta operante, la frecuencia de la respuesta en un intervalo concreto. ELEMENTOS DEL CONDICIONAMIENTO INSTRUMENTAL En el condicionamiento instrumental intervienen tres elementos: LA RESPUESTA: Normalmente es voluntaria y motora pero puede ser cualquier respuesta seleccionada por el investigador. El condicionamiento instrumental puede llevar a la creación de una nueva unidad conductual que viene definida por los elementos requeridos para obtener el refuerzo (Domjan y Burkard, 1986). EL REFUERZO: Es cualquier estímulo que aumenta la probabilidad de emisión de una conducta en el futuro. Según Skinner (1938) los refuerzos pueden ser (atendiendo a la forma en la que han adquirido su capacidad para reforzar su conducta): Primarios (es aquel estímulo que tiene un valor innato o incondicionado, ej. comida), y su valor de refuerzo está establecido biológicamente. Pueden no reforzar permanentemente una conducta, pueden depender de condiciones de privación/saciación. Secundarios (adquiere las propiedades reforzantes a través de su asociación con los reforzadores primarios, ej. elogio asociado a golosina); son aquellos estímulos que el principio fueron neutros, pero que por su asociación mediante un proceso de condicionamiento clásico con sucesos reforzantes han adquirido su valor de refuerzo, poseen una gran potencia y rara vez producen saciación. Para Premack, en su teoría de la probabilidad diferencial, un reforzador es cualquier actividad cuya probabilidad de ocurrencia es mayor que la de la conducta reforzada; una conducta es reforzada por la oportunidad de realizar otra conducta que es más deseada por el sujeto, un reforzador puede considerarse como una actividad, más que como una cosa o un estímulo que se obtiene; (ej.: el reforzador no es el agua, sino beber); facilita el identificar actividades reforzantes, puesto que siempre habrá algunas conductas que las personas emitan con mayor frecuencia. Relación o contingencia entre la respuesta y el reforzador, la cantidad y calidad del reforzador aumentan la tasa de conducta; la experiencia con un refuerzo bajo aumenta el efecto de un refuerzo alto, es el efecto contraste positivo, también se da al contrario; si se pasa de un refuerzo grande a uno pequeño se produce el contraste negativo. RELACIÓN RESPUESTA-REFORZADOR: En estas situciones están implicadas dos relaciones: La relación temporal entre la respuesta y el refuerzo o CONTIGÜIDAD temporal. Se refiere a la inmediatez en la presentación del refuerzo, es una variable muy importante del condicionamiento instrumental; los reforzadores condicionados permiten al sujeto pasar por alto la demora entre la respuesta y la entrega del refuerzo primario (Winter y Perkins, 1982). La relación o CONTINGENCIA respuesta-reforzador. El aprendizaje se produce si, y sólo si, la presentación del refuerzo depende de la ejecución previa de una conducta. Es el factor más importante del condicionamiento instrumental. Una contingencia positiva perfecta si se entrega el refuerzo después de cada aparición de la respuesta y nunca se entrega si no aparece la respuesta; la contingencia es negativa si el refuerzo tiene más probabilidad de entregarse cuando no se ejecuta la respuesta que cuando se ejecuta; y la contingencia cero si el refuerzo tiene la misma probabilidad de aparecer con y sin respuesta instrumental. Procedimientos de condicionamiento instrumental: Un refuerzo es cualquier acontecimiento que aumenta la probabilidad, eleva la tasa de respuesta o de emisión de una conducta. El castigo es cualquier acontecimiento consecutivo a una respuesta que reduce la probabilidad de que la respuesta se repita. Hay dos factores a considerar: Tipo de acontecimiento agradable estímulo llamado apetitivo o positivo. Tipo de acontecimiento desagradable estímulo llamado aversivo o negativo. La respuesta del sujeto produce el acontecimiento (o estímulo) contingencia positiva La respuesta del sujeto no produce el acontecimiento (o estímulo) contingencia negativa REFORZAMIENTO POSITIVO: Contingencia POSITIVA entre la respuesta y un estímulo reforzador apetitivo. la respuesta del sujeto produce un refuerzo positivo que es cualquier evento, conducta u objeto que aumenta la frecuencia de cualquier conducta a la que sigue. La emisión de la respuesta tiene como consecuencia: la aparición de un estímulo de refuerzo positivo. Es una relación positiva entre una respuesta y la producción de un evento. REFORZAMIENTO NEGATIVO: Se produce si tras la realización de una determinada conducta, se produce la eliminación de un estímulo aversivo; habremos reforzado negativamente dicha conducta, tal conducta incrementara su probabilidad de repetirse en un futuro. Contingencia NEGATIVA entre la respuesta y el estímulo reforzador aversivo. La emisión de la respuesta interrumpe, elimina o impide la presentación del estímulo aversivo: ESCAPE-EVITACIÓN. La emisión de la respuesta tiene como consecuencia: la eliminación de un estímulo aversivo. CASTIGO POSITIVO: El castigo positivo se refiere a la utilización de un evento físico o psicológicamente doloroso como castigo. Si no se ejecuta la respuesta no se presenta el estímulo aversivo, en lugar de aumentar la probabilidad futura de respuesta, la debilita, y es menos probable que se produzca. Contingencia POSITIVA entre la respuesta y el estímulo punitivo aversivo. el castigo no se denomina estímulo reforzador sino estímulo punitivo, ya que su objetivo es la reducción de la frecuencia de alguna conducta. La emisión de la respuesta tiene como consecuencia: la aparición de un estímulo aversivo. CASTIGO NEGATIVO: El castigo negativo se produce cuando se aprende a dejar de emitir una respuesta porque tiene como consecuencia la retirada o el cese de algún evento positivo o significativo para el sujeto: COSTE DE RESPUESTA, donde la respuesta no deseada hace que se retire o no se pueda obtener el reforzamiento. TIEMPO FUERA o tiempo fuera de reforzamiento, se utiliza un período de tiempo durante el cual el reforzamiento no está disponible. PROGRAMAS DE REFORZAMIENTO: (pueden ser contínuos o intermitentes) Un programa de reforzamiento es una pauta o regla que determina la forma y el momento en los que la aparición de una respuesta va a ir seguida de un refuerzo (Domjan y Burkhard, 1986). Programa de REFORZAMIENTO CONTINUO RF1: se da refuerzo cada vez que se emite la conducta objetivo, el recomendado durante la fase de adquisición de una conducta. En los programas INTERMITENTES no se refuerzan todas las emisiones de la conducta: PROGRAMAS DE RAZÓN: En estos programas la administración del refuerzo depende del nº de respuestas dadas por el sujeto: RAZÓN FIJA (RF): el nº se mantiene constante. Es necesario emitir un número de respuestas determinado para obtener el refuerzo. RF10:(tienen que darse 10 respuestas para obtener un refuerzo, y se refuerza cada décima respuesta). Pausa postreforzamiento: (característica distintiva: la pausa se interrumpe temporalmente después del refuerzo). RAZÓN VARIABLE (RV): Igual que el anterior, pero aquí el requisito del número de conductas no se mantiene constante, sino que se obtiene el refuerzo tras realizar un número medio de respuestas. RV10: (refuerzo tras una media de 10 respuestas). No existen pausas predecibles. Normalmente da una tasa media de respuestas más elevada que con cualquier otro tipo de programa. PROGRAMAS DE INTERVALO: En estos programas la administración del refuerzo depende del paso del tiempo. La respuesta se refuerza sólo si se realiza transcurrida una determinada cantidad de tiempo a partir de la última presentación del reforzador. INTERVALO FIJO (IF): Es necesario emitir la respuesta apropiada después de un período de tiempo estipulado. IF-1: (reforzado por la primera respuesta tras un minuto). Se refuerza la primera conducta después del intervalo. A este tipo de programas Ferster y Skinner lo llamaron festoneado: patrón de respuesta en que la respuesta deja de emitirse después de obtener el refuerzo y luego aumenta lentamente. (ej: esperar el reparto de correos todos los días a la misma hora, se deja de estar pediente del correo una vez recibido y aumenta la conducta de espera cuando va llegando la hora del reparto) INTERVALO VARIABLE (IV): Igual que el anterior, pero el requisito del tiempo fijo no es constante. Se obtiene refuerzo tras un intervalo de tiempo medio. IV2: (el intervalo medio es de 2 minutos). La tasa de respuestas es bastante estable entre refuerzos. EXTINCIÓN de la CONDUCTA INSTRUMENTAL: Una repuesta adquirida mediante condicionamiento instrumental puede extinguirse si el refuerzo deja de presentarse tras la emisión de la respuesta. Si al sujeto se le devuelve a la situación experimental se produce la RECUPERACIÓN ESPONTÁNEA. Factores que contribuyen a la resistencia a la extinción: o MAGNITUD DEL REFUERZO depende del nivel de entrenamiento durante la adquisición. Si el nivel de entrenamiento es mínimo, un refuerzo alto produce mayor resistencia a la extinción. En cambio entrenamiento largo y refuerzo alto produce menor resistencia a la extinción. Entrenamiento largo y refuerzo pequeño produce mayor resistencia a la extinción de la conducta. o DEMORA DEL REFUERZO depende de su consistencia; una demora constante no afecta a la extinción; una demora variable aumenta la resistencia a la extinción de la conducta. o CONSISTENCIA DEL REFUERZO una respuesta que no ha sido reforzada cada vez resiste más a la extinción que una que ha sido reforzada siempre. DISCRIMINACIÓN Y GENERALIZACIÓN DEL ESTÍMULO Estos dos procesos suponen un aprendizaje adaptativo ante la complejidad del medio ambiente: DISCRIMINACIÓN: El proceso de responder de distinta manera ante estímulos diferentes, o de responder ante unos estímulos pero no ante otros se denomina DISCRIMINACIÓN. Existen estímulo discriminativos positivos y negativos, señalan la presencia o ausencia de refuerzo. GENERALIZACIÓN: Los organismos aprenden a responder de la misma manera ante estímulos semejantes o parecidos, es el proceso de GENERALIZACIÓN. Realmente la situación de condicionamiento instrumental contiene tres elementos: los estímulos ambientales, la respuesta y el reforzador. Estas claves ambientales pueden llegar a controlar la aparición de la respuesta. Sólo en el caso de que la presencia de un estímulo altere la frecuencia de una conducta se puede hablar de estímulo discriminativo. Existen estímulos discriminativos positivos (ED), que indican que si la conducta se emite en presencia de ellos se obtendrá refuerzo, y estímulos discriminativos negativos (EΔ), cuya presencia indica la no disponibilidad de refuerzo. El gradiente de generalización se utiliza tanto para el condicionamiento clásico como para el instrumental. En el experimento de Guttman y Kalisch (1956) con cuatro grupos de palomas, durante el entrenamiento de condicionamiento, presentaron a cada grupo un tipo de luz de diferente longitud de onda que varió desde el verde amarillento al rojo, y posteriormente tras el entrenamiento de adquisición comprobaron la generalización a otras luces de colores parecidos; los resultados demostraron que las palomas daban el número máximo de respuestas lógicamente ante el estímulo entrenado y que el nivel disminuía conforme aumentaba la diferencia de longitud de onda entre el estímulo entrenado y los de prueba.