Download Conductual Vol_2 Num_1

Document related concepts

Pin (programa computacional) wikipedia , lookup

Human Relations Area Files wikipedia , lookup

Hippolyta (DC Comics) wikipedia , lookup

Frederick Singer wikipedia , lookup

Generador electrostático wikipedia , lookup

Transcript
Conductual, Revista Internacional de Interconductismo y Análisis de Conducta
Vol. 2, No. 1
2014
Conductual
Revista Internacional de Interconductismo y Análisis de Conducta
International Journal of Interbehaviorism and Behavior Analysis
Ref.: Conductual, 2014, 2, 1
ISSN: 2340-0242
ISSN: 2340-0242
Conductual, International Journal of Interbehaviorism and Behavior Analysis
Ref.: Conductual, 2014, 2, 1
ISSN: 2340-0242
Conductual, Revista Internacional de Interconductismo y Análisis de Conducta
Indice
Editorial .........................................................................................................................................................................1
Maxwell Structures. (Killen, P.R.) ....................................................................................................................................4
La falacia del argumento cronológico: reflexiones acerca de la confusión entre modernidad y progreso y
sus repercusiones sobre el desarrollo de la psicología. (Freixa i Baqué, E. y Froján-Parga M.X.) .................................... 13
Redes neuronales, procesos cognoscitivos y análisis de la conducta. (Escobar-Hernández, R.) ............................... 23
Adquisición y extinción de respuestas discretas vs secuencias de respuestas. (Alonso-Orozco, I., Martínez-Sánchez, H.
y Bachá-Méndez, G.) ......................................................................................................................................................... 44
Descuento social: una comparación por género y edad. (Ávila-Santibáñez, R. y Toledo-Razo, A.C.) ............................ 57
Ref.: Conductual, 2014, 2, 1
ISSN: 2340-0242
Conductual, International Journal of Interbehaviorism and Behavior Analysis
Comité Editorial
Editores Generales
Campo-Delgado, Jorge. Conductual.com
Valle-Bravo, José Manuel. Conductual.com
Comité Editorial
Ixel Alonso. Universidad de Guadalajara, México
Gustavo Bachá. Universidad Nacional Autónoma de México
Carlos Fernando Aparicio. Salem State University, USA
Raúl Ávila S. Universidad Nacional Autónoma de México
Rogelio Escobar. Universidad Nacional Autónoma de México
Esteve Freixa i Baqué. Université de Picardie Amiens, Francia
María Xesús Froján Parga. Universidad Autónoma de Madrid, España
Peter R. Killeen. Arizona State University, USA
M. Jackson Marr. Georgia Tech, USA
Héctor Martínez Sánchez. Universidad de Guadalajara, México
Piña López Julio Alfonso. Universidad de Sonora, México
Aldo C. Toledo. Universidad Nacional Autónoma de México
Julio Varela. Universidad de Guadalajara, México
Patrick Zawadsky. Universidade do Oeste de Santa Catarina, Brasil
Revisores Invitados
Diana Delgado. Fundación Universitaria Konrad Lorenz, Colombia
Francois Tonneau. Universidade Federal do Pará, Brasil
Oscar Zamora Arévalo. Universidad Nacional Autónoma de México
Ref.: Conductual, 2014, 2, 1
ISSN: 2340-0242
Conductual, Revista Internacional de Interconductismo y Análisis de Conducta
Editorial
Editorial 1
Hace un año emprendimos este proyecto con el propósito de difundir gratuitamente trabajos
originales que aportaran nuevos conocimientos tanto en el ámbito interconductual como en el del análisis
de la conducta. Consideramos que el objetivo se ha mantenido. Usted, estimado lector, lo juzgará. Este
primer número del segundo volumen contiene cinco artículos, en su mayoría de corte teórico pero, como
ha ocurrido en números anteriores, los trabajos se distribuyen en muy diferentes áreas de análisis y
estudio.
En el primer artículo, Peter R. Killeen analiza las Estructuras de Maxwell que, en palabras del
autor, son una especie de sistemas no lineales de excepcional importancia para los analistas conductuales.
Los sistemas son más fáciles de comprender cuando son derivados de funciones lineales pero es gracias a
los sistemas no lineales que es posible nuestra existencia y que podamos comprender y escribir en forma
compleja. Algunos sistemas no lineales son relativamente sometibles, sin embargo otros apenas lo son, por
ejemplo: el paso del cristal al líquido o el de la materia a la vida. Es por esto que, en lugar de una
explicación, surge frecuentemente el descriptor emergente. El éxito de las ciencias físicas aconseja iniciar su
andadura con las cosas más simples pero no iniciarla con la primera que se encuentre. Las estructuras de
Maxwell proveen la primera interesante no linealidad simple y es por ello que ofrecemos el ensayo en este
documento.
James C. Maxwell físico del siglo XIX unificó el estudio de la electricidad y del magnetismo y
propuso un campo de ecuaciones para identificar la no linealidad. Las proyecciones bidimensionales que
muestra Killeen intentan representar una potencial función multidimensional. Las llama estructuras tanto
por su función matemática como por su concreción en una entidad física o psicológica, refieren a la
potencial superficialidad que existe en una potencial cuesta. Pueden tener cualquier forma pero si la
cuenca rebasa la cúspide se rompería el sistema. En este artículo el autor revisa la naturaleza de las
funciones, los sistemas de retroalimentación y las técnicas que, para bien o para mal, “toman ventaja de
esos estados particulares cuando ocurren”.
Mediante un análisis minucioso y con múltiples ejemplos de la conducta personal y social
argumenta acerca de la creación de dichas estructuras (orden a partir del caos, retroalimentación positiva y
negativa), su explotación (amenazas contra la estabilidad, el empuje, tracción, momentum, bombeo,
saturación, erosión, seducción) y su preservación. Uno de los revisores del artículo comentó que “Sin
duda, este trabajo será muy difícil para la mayoría de los lectores y desafiante, incluso para aquellos que
puedan conocer un poco de física”. El otro revisor escribió “Recomiendo la publicación de este inusual
pero interesante artículo”. Ante el reto, este artículo inaugura nuestro segundo volumen.
Esteve Freixa i Baqué y María de Xesús Froján Parga, tomando como ejemplo particular el campo
de la psicología clínica, ilustran mediante ejemplos de la historia y de diferentes artes y disciplinas, la falacia
en la que se puede incurrir al confundir la modernidad con el progreso, como se ha argumentado
frecuentemente respecto al surgimiento del cognitivismo posterior al conductismo: Si es posterior, es
moderno, si es moderno, lo antiguo es caduco y por lo tanto no es mejor que el sucesor y no tendrá
ningún sentido volver a plantear su vigencia o seguir utilizándolo. El argumento resulta para los autores
mínimamente válido y no aplicable en el campo de la ciencia. Sobre todo, si el enfoque cognitivo es a
todas luces un retroceso basado en el dualismo ontológico, epistemológico y metodológico. Los autores
argumentan que la trampa consiste en suponer que modernidad y progreso son en cierta forma sinónimos
1
La referencia de esta editorial en la Web es: http://conductual.com/content/editorial-vol-2-no-1
Ref.: Conductual, 2014, 2, 1, 1-3
ISSN: 2340-0242
1
Conductual, International Journal of Interbehaviorism and Behavior Analysis
Campo-Delgado, J. y Valle-Bravo, J.M.
y se encargan para ello de demostrarlo con preguntas sencillas: ¿acaso el impresionismo es más adelantado
que el barroco?
En el caso de las llamadas terapias de tercera generación (PAF y TAC), Freixa y Froján refieren
que éstas dieron inicio en la pasada década de los 90 y que en realidad, después de las terapias
cognoscitivas (segunda generación), lo que hacen es regresar a los planteamientos básicos del conductismo
radical pero, a diferencia de las terapias conductistas de la primer generación, se basan centralmente en la
conducta verbal, las relaciones de equivalencia, el concepto de conducta gobernada por reglas y el
moldeamiento de la conducta verbal, que es una de las más potentes técnicas para lograr el cambio de la
conducta. A pesar de que existen numerosas publicaciones cognoscitivas en las que se afirma –entre otras
cosas- que el conductismo es simplista y reduccionista, los autores preguntan: ¿Y si fuese ese enfoque el
que definitivamente está pasado de moda? El trabajo termina considerando que posiblemente el progreso
está en la recuperación o reconstrucción del conductismo radical.
Rogelio Escobar presenta un documento que podemos clasificar como tutorial de las redes
neuronales dada la poca relación que ha existido entre este campo y el Análisis de la Conducta. ¿Pueden
beneficiarse ambos si existiera más interés recíproco? El trabajo tiene el objetivo de mostrar las ventajas.
Un primer aspecto que se aclara es la existencia de dos tipos de redes. El primero se basa en el empleo de
la metáfora del procesamiento de la información, dando origen a la creación de modelos simbólicos de
corte cognoscitivo en los que se asume que las personas representan su conocimiento mediante la
manipulación de símbolos. Se trata pues de un planteamiento dualista, desde donde se le quiera considerar,
y posiblemente de aquí, su rechazo generalizado. El segundo modelo de redes son las neurales o
conexionistas que rechazan la metáfora y toman como referente el funcionamiento neuronal, esto es, la
sinapsis que puede existir entre dos o más neuronas. Las características importantes de este tipo de redes
son: (1) procesamiento paralelo que permite considerar el funcionamiento de más de una red
simultáneamente y (2) que la “representación”, sea del aprendizaje o de la memoria, se encuentra
distribuida en todas sus partes, no es localizacionista. Dichos modelos tienen como base el trabajo de
McCullock y Pitts (1953) en el que una neurona puede recibir entradas excitatorias e inhibitorias siendo
binario su estado y dando por supuesto que la estructura de la red no cambia con el tiempo. El valor de
activación se obtiene mediante la suma del producto de las entradas y de los pesos de la conexión. Sólo si
el resultado es mayor que el umbral, la neurona se activa (dispara). En la actualidad se considera además la
frecuencia del potencial por tanto se concibe que las neuronas no operan binariamente sino como
convertidores de voltaje o analógicos dando origen a la función sigmoidal y permitiendo que la estructura
de la red cambie. Para poder incluir más funciones, a los modelos se les agregó una o más capas ocultas
cuyo funcionamiento y cálculo se ejemplifica. Escobar describe e ilustra las redes supervisadas y las no
supervisadas resaltando los casos de modelos que simulan el condicionamiento pavloviano y el operante.
En palabras del autor, la adopción de estos modelos podría ayudar a saber lo que ocurre en las relaciones
funcionales entre el ambiente y la conducta y con ello, integrar la consideración de procesos cognoscitivos
y los hallazgos de las neurociencias.
Ixel Alonso, Héctor Martínez y Gustavo Bachá sorprenden con un sencillo experimento de
adquisición-extinción de respuesta pero que tiene implicaciones teóricas importantes e interesantes.
Tradicionalmente, en el Análisis Experimental de la Conducta se eligió una respuesta discreta a la que se
ha considerado la unidad de conductual. Los autores, como algunos otros anteriores, indagan la
posibilidad de definir otras unidades conductuales para lo cual entrenaron tres grupos de ratas. A dos de
ellos se les requirió una secuencia de respuestas que podía ser responder dos veces a la misma palanca
izquierda o derecha (secuencia homogénea) o bien responder una vez a dos palancas diferentes (secuencia
heterogénea). Al tercer grupo se le entrenó bajo un RF2 típico. En la fase de adquisición, los dos primeros
grupos después de ejecutar la secuencia específica que se determinó para cada grupo, se oscurecía la
Ref.: Conductual, 2014, 2, 1, 1-3
ISSN: 2340-0242
2
Conductual, Revista Internacional de Interconductismo y Análisis de Conducta
Editorial
cámara experimental, sonaba un tono, se entregaba el reforzador y después de tres segundos se volvía a
encender la cámara, dando inicio al siguiente ensayo. Ante la ocurrencia de una secuencia no requerida
había un blackout de 10 segundos. La fase continuó hasta que se obtuvieron 1,000 reforzadores. La fase de
extinción se mantuvo durante 20 días y si el sujeto respondía dos veces a cualquier palanca, se apagaban
las luces durante seis segundos, sin otorgar reforzamiento y daba inicio un nuevo ensayo.
Al grupo RF2 se le entrenó a responder una vez a una de las palancas hasta obtener 1,000
reforzadores. La fase de extinción se efectuó durante 10 días manteniéndose prendidas las luces de la
cámara durante toda la sesión que, al igual que los grupos anteriores, se suspendió después de 30 minutos
o, en este caso, 100 respuestas.
A diferencia de experimentos anteriores, en este caso se registraron las respuestas de todos los
sujetos a cualquiera de las palancas tanto en la fase de adquisición como en la extinción. Los resultados
muestran una clara diferencia entre los grupos entrenados a responder secuencialmente y el grupo RF2. Si
bien éste último tendió a una tasa cercana a cero al final de la fase de extinción, los grupos entrenados bajo
criterio secuencial mantuvieron una tasa de 20 respuestas en promedio además de que las secuencias no
reforzadas se incrementaron en esta fase. Los autores concluyen que aunque no disponen de una
interpretación para el fenómeno, seguramente la réplica de este experimento arrojará luz al respecto.
Por último, Raúl Ávila y Aldo Toledo presentan un trabajo no experimental en relación al llamado
descuento social que consiste en la valoración que una persona hace de otra persona imaginaria a partir de la
edad que tiene esta última. Siguiendo las investigaciones de este campo, su método se ajusta a las formas
en que se han recopilado los datos y su tratamiento mediante una adaptación de la función de descuento
temporal que consiste en elegir recompensas presentes y futuras. Con esa base, y considerando que
también debe considerarse que un individuo forma parte de un grupo social, se ha medido la “distancia”
social mediante la elección de recompensas monetarias hipotéticas que pueden o no compartir con alguien
más y esto último parece estar en función de la “distancia” social que hay entre el participante y la persona
con la que podrían compartir la recompensa. Ésta se compartirá más fácilmente con alguien que se
considera más “cercano” en términos de la edad de ambos. Se ha sugerido que esto podría ser un
parámetro de medición para la conducta egoísta y altruista. Después de la explicación de de la ecuación de
descuento hiperbólico de la recompensa, Ávila y Toledo incluyen en su estudio dos grupos etarios
(jóvenes y adultos) además del factor género mediante una réplica sistemática del experimento de Jones y
Rachlin (2006).
Para lo anterior, tradujeron el cuestionario empleado por Jones y Rachlin adaptando al medio
mexicano la cantidad de la recompensa. Contaron con la participación de 200 personas variando
homogéneamente en dos grupos la edad y género de los participantes. Los resultados respecto a la edad –
distancia social- en general respaldan los obtenidos en investigaciones anteriores, esto es, que a mayor
distancia social, menor será la posibilidad de compartir y viceversa. Sin embargo, se identificó que, en la
medida en que la edad aumenta, los participantes tendieron más a compartir, contrario al caso de los
jóvenes. ¿Autocontrol o impulsividad? Queda a juicio de mayores evidencias. Con respecto al género, los
investigadores no encontraron diferencias significativas entre el género ni tampoco en relación a la edad.
Para finalizar Ávila y Toledo sugieren la extensión de este tipo de estudios hacia la población infantil dado
que en un estudio reciente se encontraron patrones atípicos a los encontrados con personas de más edad.
31 de Marzo de 2014
Madrid-Girona, España
Jorge Campo y José Manuel del Valle
Editores Generales
Ref.: Conductual, 2014, 2, 1, 1-3
ISSN: 2340-0242
3
Conductual, International Journal of Interbehaviorism and Behavior Analysis
Killen, P.R.
Maxwell Structures. 1
Peter R. Killeen2
Arizona State University
Abstract
There exists a species of nonlinear system of exceptional relevance to behavioral scientists. It is the
embodiment of a locally stable basin of attraction atop an unstable potential gradient. The universal
importance of such para-stable entities was first identified by James Clerk Maxwell. This review
characterizes the structures and the forces that can stabilize or destabilize them, and their relevance to us
as psychologists and citizens.
Key words: balance-points, behavioral forces, dynamic systems, kindling.
Resumen
Existe una especie de sistema no lineal de excepcional importancia para los científicos del
comportamiento. Es la encarnación de un nicho de atracción localmente estable encima de un gradiente
de potencial inestable. La importancia universal de este tipo de entidades para-estables fue identificada por
primera vez por James Clerk Maxwell. Esta revisión caracteriza las estructuras y las fuerzas que pueden
estabilizar o desestabilizar dichas entidades y su importancia para nosotros como psicólogos y ciudadanos.
Palabras clave: puntos de equilibrio, fuerzas conductuales, sistemas dinámicos, ignición.
Systems are easiest to comprehend when their derivatives are linear functions of independent
variables. But it is because of nonlinearities that systems such as ourselves exist, systems able to
comprehend, and to write these reflective sentences.
Some nonlinearities are relatively tractable—simple quadratic and exponential functions, not far
bent from straight and narrow. Others, edgy discontinuities, are essential adjuncts to comprehension, as
they bound categories, separate entities, and characterize the binary logic of computers. Other
nonlinearities, the enchanting changes of phase—from crystal to liquid, from laminar flow to turbulence,
from matter to life—are intractable in the large, even when docile in microcosm. It is for these that the
descriptor emergent so often emerges as explanation in lieu of explanation.
The success of physical sciences counsels the behavioral sciences to start simple. But not to start
with the first simple thing found; instead to survey the domain to be essayed, so that easy things are
chosen to lead, in progressive steps, to a successful assault on the more difficult. Maxwell structures
provide the first simple interesting nonlinearity, and thus the subject of this essay.
Maxwell, the great Victorian physicist who unified the study of electricity and magnetism, and
whose field equations remain among the most elegant in science, identified a nonlinearity of special
interest:
Web reference for this article: http://conductual.com/content/maxwell-structures
Correspond with: Peter Killeen. Department of Psychology. Box 871104. Arizona State University. Tempe, AZ 85287-1104.
Email: [email protected]. FAX: (480) 965-8544. Siri: (480) 967-0560
1
2
Ref.: Conductual, 2014, 2, 1, 4-12
ISSN: 2340-0242
4
Conductual, Revista Internacional de Interconductismo y Análisis de Conducta
Maxwell Structures
“The rock loosed by frost and balanced on a singular point of the mountain-side, the little spark
which kindles the great forest, the little word which sets the world a fighting, the little scruple
which prevents a man from doing his will, the little spore which blights all the potatoes, the little
gemmule which makes us philosophers or idiots. Every existence above a certain rank has its
singular points: the higher the rank, the more of them. At these points, influences whose physical
magnitude is too small to be taken account of by a finite being, may produce results of the
greatest importance. All great results produced by human endeavor depend on taking advantage
of these singular states when they occur.” (1882/1969, p. 443)
Figure 1 represents these phenomena as Maxwell structures, sketched as a 2-dimensional projection
of a multidimensional potential function. Following Maxwell, I use this particular nonlinear force function
to characterize personal and social forces with quite different carriers than gravity and electromagnetism
(Killeen, 1992). Laplace studied potential functions long before, but it is Maxwell’s attention to a special
class of potential functions that captures our attention. (Other equally important potential functions are
discussed by Kelso, 1995). The function that characterizes the prototypical Maxwell structure—called
structure here in reference to both its mathematical description as a function, and its embodiment in a
physical or psychological entity—is the shallow potential well atop a large potential hill. The terrain along
the other unpictured dimensions may take any shape, but must be locally uphill, or the system would roll
out of this basin, as off a saddle, through the front or back of the page. It requires work to destabilize
structures that reside in these high basins, just as it does to kindle a fire; but the energy then released is out
of proportion to that work. Here I review the nature of these functions, the feedback systems which
maintain or destroy them, and techniques that, to weal or woe, “take advantage of these singular states
when they occur”.
Figure 1. Clockwise from top left: A prototypical Maxwell Structure; an asymmetric one; an unstable one; an adamant
one.
Ordinates
The x-axis of the Maxwell structures shown in Figure 1 are the values of a system parameter such
as heat. It takes energy to make a spark; but if its heat carries kindling over a flashpoint, the energy is
returned with compound interest. Maxwell structures may be symmetric, or may reside as concave ledges
on an otherwise monotonic slope. This is the case for the spark: Only increases in temperature can move
it over the lip.
Ref.: Conductual, 2014, 2, 1, 4-12
ISSN: 2340-0242
5
Conductual, International Journal of Interbehaviorism and Behavior Analysis
Killen, P.R.
The y-axis of Figure 1 is potential energy. This energy may be realized as work if the system is
loosed to careen down the potential slope, transforming its elevation into kinetic energy. The forest
contains much more potential energy before it is set afire than after. The energy released may be
squandered to the sky, or doled out in faggots to boilers and stoves for more useful work.
Ordered structures that inhabit the tops of potential hills are not more complex than those at the
ground state, they are simpler. The description of matter in a healthy forest requires—and provides when
received—less information than does its random bed of ashes. Statistical descriptions of such random
ensembles are simple, but they are actually a retreat to a description of the class rather than of the
individuals in it. Precise description of undifferentiated conglomerations at the ground requires
voluminous, and worthless, information. Even Maxwell’s demons cannot utilize that kind of information
to perform work.
We may partition energy/enthalpy into bound energy and free energy; the former is a product of
energy and temperature that is unavailable for doing work; the latter is the energy that may be converted
into work, and is synonymous with negentropy. Whereas we think of nourishment as a way of gaining
energy, Schrödinger (1944) observed that it was the greater negative entropy of the complex structured
materials we consume compared to those that we excrete, that “fuels” life. It is far easier to convert an
existing structure, such as a complex protein, to our own ends than to build one from the ground up.
Metaphorically, we understand how some of the energy of other humans may be partially converted into
work, but a portion always remains bound, not amenable to conversion.
Entropy and energy are closely related, both in thermodynamic terms, and in looser parlance. The
generation of power requires compartments of matter at different temperatures that can be mixed.
Although the total amount of energy remains the same after the mixture (the first law of thermodynamics),
the entropy of the mixture is greater (the second law of thermodynamics). The free energy is less. The
constituents are amenable to more economical description before the blending than is the mixture.
Entropy concerns the partitioning of randomness, just as the analysis of variance concerns the partitioning
of variance. We attach significance to structures that are sufficiently distinct from the ambient noise to
justify the “degrees of freedom” lost in their separate categorization—that is, the naming of them. That
discrimination can be achieved with a sufficiently broad structure even if it hugs the ground—in theory.
Think of a small hill of energy—negentropy—a hill of structure/order in a flat desert. But more than a
just-discriminable difference is necessary for the distinction to be useful. The higher the hill above the
ground, the more effective the partition is in separating the energy levels, and the more informative is the
resulting distinction. The child is admonished not to make a mountain out of a molehill. The greatest
power is available when the proportion of variance that can be explained by the partition approaches 1.0;
when the compartments start icy cold and burning hot, black and white, zero and one, towering and flat.
There is thus more that is knowable about ordered systems, those that have the potential for work,
than about random ones. Once we understand the key to the system—have mastered its logic or its
mathematics or its rhythm—we can predict and control it. Intrinsic order, and thus the potential for
power, is a necessary condition for knowledge. Not all knowledge, however, is powerful. Some knowledge
is merely significant, whereas other knowledge is potent. Knowledge is powerful if it corresponds to
structures that rise high above the landscape of noise, permitting us to “take advantage of these singular
states when they occur”. In modern analysis this distinction is carried by the statistic called relative
entropy, or Kullback-Leibler divergence. An unbiased estimate of this difference between distributions,
measured in information theoretic units, is given by the Aikaike Information Criterion—a statistic seeing
increasing use in model comparison to tell us how well the structure of our description matches the
structure of the data. Rounding the circle, a century ago Henry Adams proposed a theory of history based
Ref.: Conductual, 2014, 2, 1, 4-12
ISSN: 2340-0242
6
Conductual, Revista Internacional de Interconductismo y Análisis de Conducta
Maxwell Structures
on the second law of thermodynamics; 50 years ago the MaxEnt school reinterpreted classical
thermodynamics in information theoretic terms (e.g., Jaynes, 1957); and a generation ago, economic
theory was interpreted in thermodynamic terms ("thermoeconomics"; e.g., Georgescu-Roegen, 1971). This
hermeneutic cycle (Hermeneutic, 2014) is a helix that rises higher above the entropic plane as we learn
more and more about the connectedness of theoretical structures; as each turn subsumes more under less.
Thus, our knowledge of randomness and structure itself forms a potential structure.
Creating Maxwell Structures
Order out of chaos.
Because Maxwell structures are simpler than random ensembles, they are often created
spontaneously wherever energy flows. Although the second law tells us that entropy is always increasing, it
started minuscule, when all matter was concentrated, a universe of nothing and a dot of everything. The
continual redistribution of energy since the big bang provides many opportunities for the evolution of
locally organized structures, from Saturn’s rings to the convection currents that roil the water of a teapot.
The high-frequency energy received from the sun is the prime mover of life on earth; all of the rich
structures we are and seek to understand are parasitic upon it, each finding their own way to do work by
short-circuiting its ultimate reradiation to the night sky as lower frequency heat. These Maxwell structures
emerge because they redistribute energy more efficiently than random processes (Prigogine & Stengers,
1984). While some are evanescent, others, like the red spot of Jupiter, persist for ages. An edge in an
energy flow, shade in sun, fast among slow, are the provender for a feast on lambent energy. By speeding
heat on its way, negentropic structures create order. Biological nets and ratchets that capture that
negentropy are evolution’s primary craft.
Positive feedback.
Positive feedback is the key exploiter and destroyer of Maxwell structures. The most impressive
Maxwell structures are the ones in which the energy released in movement down the slope itself creates
the conditions for further movement—where actions create chain reactions. A rolling stone gathers
momentum, often sufficient to roll over or crush through other basins in its way. A spark can catch, with
the energy released heating nearby tinder over their potential barriers, leading to fires, to conflagration, to
firestorms. Hysterical words can set the neighbors a fighting; the frightened find safety in numbers, their
kith rally ‘round kin, reflecting their passion, and a local feud becomes a world war. The probability of
contagion increases with the number of threats to a biological system, and otherwise latent pathogens are
goaded into feeding-frenzy virulence when hosts become compromised.
Systems that dwell in Maxwell basins fascinate us as a match fascinates a boy; achieving
‘maximum output with minimum input’ seems an evolutionary imperative, leading to the technological
virtuosity of Homo sapiens, and to the eventual perils of his chemical and nuclear fires. Enormous energy is
required to fuse helium; but once carried over its Maxwell brim with a fission chain reaction, the fusion
will shake the earth. Prometheus was the boy who taught the man how to trigger, burn, explode.
Negative
Negative feedback is the key defender of Maxwell structures, lending permanence to their
otherwise fragile stability. A rock can “balance on a singular point of the mountain-side” because its base
erodes more slowly under pressure, and thus, like a juggler on a geologic time scale, continuously corrects
asymmetries to keep support under its center. The dissipative surface of combustion around a spark is
large compared to its volume, and the flame usually gutters before kindling a great forest; the little spore
Ref.: Conductual, 2014, 2, 1, 4-12
ISSN: 2340-0242
7
Conductual, International Journal of Interbehaviorism and Behavior Analysis
Killen, P.R.
which would blight the potatoes must first tunnel through the potato’s toxic skin. The little gemmule
which makes us philosophers or idiots is crystalline DNA. It is seduced from its stable autonomy by
recombination in meiosis, evolved to evade predators and repair coding errors, thereby defending the
conjoint potential well of the species.
Exploiting Maxwell Structures
If we believe Maxwell that “All great results produced by human endeavor depend on taking
advantage of these singularities”, then it is near such singularities that the greatest potential for
psychological endeavor are to be found. Some structures are remote from significant precipices, and thus
possess little potential in their domain. Of those close to gradients, some reside at the bottom of deep
potential wells, and rest adamantine; others, balanced for an instant at the tip of an unstable equilibrium,
tumbled so quickly that their contemplation is reserved for the mind’s eye, winked out in the early chaos
of creation. How do we find malleable systems worth reengineering? How do we ease the scruples of a
compulsive, or bind the lips that would utter words to set the world a fighting? How do we constrain
bankers to be responsible; undermine corrupt and oppressive dictators; foster entrepreneurial societies?
The answers are as different as the milieu in which the structures reside, but have some common
principles.
Threats to stability
Complex systems are a resource for other complex systems, exploited wherever they are found.
Predators on a system’s negentropy are nature’s value-added tax. They are themselves in turn dunned,
having at each level their own species of fleas to bite them. Each therefore erects defenses to preserve the
shallow well that guards their identity from incorporation into another’s structure. Arms races between
predator and prey are the first great engine of evolution, because life and sustenance are the preconditions
for stability. Wheels need not be continually reinvented if their designs are passed on, whether in oral
tradition or in DNA. Such investment drives the second great engine of evolution, the struggle to
conserve those structures.
Stabilization is a counterproductive cost until stability is threatened, so the forces of stabilization
are always reactions to agents of destabilization. Pounds of cure are more commonplace than ounces of
prevention. Biological detectors uncover instabilities before they go over the top, rallying quenching
mechanisms into play, be they at the level of antigens or grosser humors: Fears of strangers, of things that
slither or go bump in the night, of pathogens, along with many other threats fingered by our paleo-control
system, all goad our neo-control systems into defense. Firebreaks and quarantines stem contagion by
separating compartments below their critical mass for kindling. Deviates are shunned, anarchists silenced,
traitors hung, presses stopped. Long before Machiavelli governments mastered these techniques, and they
are being constantly reinvented and redeployed (Wolf, 2007). Societies erect hurdles of tradition that only
rebels surmount. Scruples are inculcated by moral preceptors, eased by psychotherapists, and exploited by
populists. Disruption is channeled in time and space. Strategies of self-control work by bringing remote
attractors to bear on behavior that is about to slip over into the pull of local gradients.
Stabilization that is too effective is also counterproductive, as it leaves the system in stasis.
Biological systems become sitting ducks for predators. The “stability-plasticity dilemma” names the
problem of finding the right balance of resistance to random change combined with a capacity for
adaptive modification. Entrenched regimes often prevail until a novel threat topples their rigid defenses.
Compared to clones, sexually reproducing organisms trade stability of (their individual) form and function
for recombination with individuals that have at least comparable credentials for survival. Making selective
modification sexy is perhaps the best way to effect change, but there are others.
Ref.: Conductual, 2014, 2, 1, 4-12
ISSN: 2340-0242
8
Conductual, Revista Internacional de Interconductismo y Análisis de Conducta
Maxwell Structures
Pushing
Maxwell structures can be destabilized by simply forcing the system over the brim. The efficiency
of the technique depends upon the direction from which the force is applied. Pushing the system out of a
multidimensional basin requires forces to be juggled—whether driving a recalcitrant herd, controlling
nuclear fusion, or pushing wet spaghetti, pushing is plagued by problems of control and containment.
Anger, an emergent, undifferentiated energy, can empower escape from the structure or destruction of its
control mechanisms. Force often engenders reactance, and thus necessitates containment by forces of
tradition, authority, or whip. Some guns in every war target the backs of compatriots to encourage them
out of the trenches. Totalitarian techniques of crowd control—informers and spies and the threat of their
ubiquity—were the enemies of the last century. Religious techniques of crowd control train the controlled
to fashion and wear their own bridles and burkas—inculcating aversive moods of guilt, shame or sin to
accompany every imagined liberty. Conjoined with state control, it is the enemy of our century.
Contemporary Big Brothers watch from their windows, their computers, their heavens; they cause birds to
fall to the ground, number the hairs on your head and the cookies in your computer. Escape is futile.
When the success of control is uncertain, controllers may push the system over its potential
barrier strategically: Disease is precipitated by inoculation, avalanches by explosives, conspiracies by agents
provocateurs, wars by preemptive strikes. Casus belli are uncovered or arranged. Object lessons are taught.
Pulling
Maxwell structures can be destabilized by pulling the system over its brim; where aversive control
pushes, positive control pulls. Pulling systems out of minima requires a trace that will not break under the
tension. It is difficult to engender long chains of behavior with distant reinforcers, and techniques of
shaping, fading, and conditioned reinforcement are used to distribute the forcing energy along the
proposed route. Leadership that transforms the trudge against the slope into an exhilarating climb is
essential to all popular movements. The message of the leader must be echoed by the people and their
presses, to keep it alive throughout the ascent. Progress is seen most often when each step finds some
reward, through peers or publicists.
Momentum
Potential energy is transformed into kinetic energy as systems move downhill, and back into
potential energy as they swing uphill again. The momentum of the system at the base of the slope is
cashed out by motion uphill, again banked as increasing potential as the system mounts the slope. Systems
without enough energy to overcome a potential barrier may store additional energy by moving back to get
a running start, investing in an ascent of an opposite hill, and liberating that accrued potential in a
downhill plunge. The energy for the ascent may be produced by converting energy from behind or in
front. Flumes guide fluids downhill to rush over the next grade, pushed by those behind. Siphons
constrain fluids down the next grade to suck more fluid up over the edge behind. Constraint by the pipes
is essential. Heroic acts of the past inspire commitment from youth; once committed, they rush down the
hills to find their own medals, their victory an inducement to the next generation. Inspiration by
legends—saints, heroes and rebels—sustains most social endeavors.
Prodigious feats can be accomplished by organisms that are able to accumulate energy over longer
epochs, and trigger it in an evanescent burst of power. Falcons ascend slow thermals to plunge explosively
on prey; cicadas bend their ribs until they buckle, producing their piercing chirp; fleas compress a protein
spring to release it, propelling leaps of hundreds of body-lengths. Humans often “get up a head of steam”
Ref.: Conductual, 2014, 2, 1, 4-12
ISSN: 2340-0242
9
Conductual, International Journal of Interbehaviorism and Behavior Analysis
Killen, P.R.
by methodically rehearsing past injuries or slights, energizing emotional states that carry them over
obstacles. The elation of Easter wells up from the depression of Lent. War dances, tales of atrocities, and
boot camps fortify armies to overcome hardship and manslaughter. Taboos restraining theft, rape, and
murder are eroded in the fog of war. Politicians with their “fingers on the pulse” of their constituents
personify movements already in progress, repudiating positions that are aging out of season. Such
exploitations of momentum elicit the epithets “opportunist” or “leader”, depending on one’s own
declination. The litany of the oppressed becomes the chorus of the militants, and martyrs become prudent
investments toward the potential for breaking over.
Pumping
If there is a natural ebb and flow to movement within the basin, small additions of energy at each
cycle may pump the system over the top, just as repeated pushes on a swing can raise it to giddy heights,
and small inductions from a coil pump a laser beam through its mirrored crystal. Resonance stores energy
dynamically, permitting amplification of precisely timed stimuli. Skillful confidence men dupe their victims
by catching the rhythms of fear and greed, over-correcting on each cycle. Compensatory B processes
following on the heels of A processes (Solomon and Corbit, 1973) are capitalized by the industries of
addiction. When an individual’s cycles of need and satisfaction are in phase with another’s, the cumulative
energy of that resonance has the potential to overwhelm all other control systems. Getting psyched,
passionate love, and mass hysteria are some of the emergents of resonance. Individuals out of phase
dampen each other’s momentum. Downers, wet blankets, cold fish and realists modulate romantics,
spastics, hyperactives, and enthusiasts—until they are ejected.
Saturation
The first task of a movement is to build a critical mass in space or time. Defenses can be
overcome by continued or wide-spread assault. Springs in thermostats thrown for the nth time experience
metal fatigue, just as parents saying “no” for the nth time experience mental fatigue. Systematic
desensitization exhausts emotional barriers. A suitor may bring candy and flowers and dinners soft words
and seclusion and gentle touch. Enough cannon fodder overwhelms entrenched positions. The civil rights
movement sought to exhaust reactionary forces by saturating jails and courts with dissenters. Knowing
this liability, many control systems deal harshly with wrong thinkers and repeat offenders in an attempt to
stem the tide before it crests.
Erosion
Control systems may be worn down or suborned by denial of their legitimacy, by weakening their
leverage, by eluding their control. It is wiser to disarm the enemy than fight him. War-paint and battledress cloak their warriors from moral responsibilities; press cards protect against charges of libel or
voyeurism; tenure shields from political retaliation and efficiency review alike. The rich never break laws
that they can bend or buy. Control is subverted by drugs that lull inhibitions, and by texts that undermine
foundations. Because the denial of legitimacy is so fundamental a threat, it commands the full attention of
the authorities; many jails in this world hold more political prisoners than civil offenders, just as the many
hells of the next world contain more infidels than sinners.
Flanking
Passes through multidimensional landscapes may carry one out of a basin with less work than a
frontal assault on the nearest potential barrier. These flanking maneuvers may work by appeal to elastic
higher goods, such as consistency, liberty, or defense of God, with attraction to local signs of the goals
Ref.: Conductual, 2014, 2, 1, 4-12
ISSN: 2340-0242
10
Conductual, Revista Internacional de Interconductismo y Análisis de Conducta
Maxwell Structures
drawing the individual around the barrier to their ultimate realization. Finding the paths requires guides
and gurus, rebels and heroes who are less constrained by local control mechanisms. Fear of the unknown
is one of the greatest barriers, and once a path is found, others find it easier to follow: When Rosa Parks
sat in the front of the bus from fatigue, it inspired many other blacks to sit in the front for the fight.
Censoring deviant behavior and rumors of greener valleys are the first imperatives for all control systems.
Blessed become the meek, the hungry, and the poor. All societies have formulated acts against sedition,
indices of prohibited books, taboos, inquisitions, blacklists, and simple defamations for the unconforming.
Tall stakes are hammered down. “Foreign” ideas are condemned generically; outlaws outlaw deviance, and
saints are canonized only when they are safely in heaven, subject to interpretation. Control of the media is
the first move of nascent tyrannies; a counter-control mechanism of some democracies is protection of
the media.
Seduction
Insofar as the vast energy available from the passage down the slope can be brought to bear on
behavior within the well, it may be used to motivate movement over the brink. But this must be done
without engaging negative feedback. In humans, this is often accomplished by mislabeling—one is
induced to attend a communist rally for intellectual reasons, or to be fair to both sides of the issue; to
reveal military secrets in the cause of humanity; to visit his room to hear a new album; to consider the
products of Madison Avenue as routes to status, economy, ease, modernity, youth, wisdom, and any
destination other than hedonistic indulgence. Control mechanisms often focus the most opprobrium
against the first wayward step. Once that step is taken, self-labeling—Born to be Wild, Rebel Without a
Cause, Outsider—and the pleasures anticipated beyond the pale, make each additional step slipperier than
the previous. Once enroute, dissonance is reduced—Why would I have been interested if there hadn’t
been some intrinsic value to the activity/product?—and consistency protected—How can I say ‘no’ now
and save face?—leading many up the garden path until the gradient changes sign, and the die is cast.
Preserving Maxwell Structures
To realize the simplicity of objects at the top of Maxwell structures we must understand their
code, as though they were glyphs to be deciphered. Without that key, we see but chaos and confusion.
Structures are often invisible until they are understood; and too often we are ignorant that we are ignorant;
we see not a mystery, but nothing. It was Newton’s unweaving and reweaving of the rainbow that let us
see light’s dimensions for the first time. The mystery of the uncertain or the untamed provokes fear in the
timid, curiosity in the brave. If only, those latter hope, I could break the code, find the grail, decipher the
glyphs, then I shall find harmony, simplicity, truth. And perhaps also find a way to exploit the structure to
my benefit. The drive for understanding—for discovering patterns of simplicity within the cacophony of
the world, to ease fear or increase profit—is a universal. Many societies recognize the value of such
curiosity by improving the perceptual skills of its citizens in schools and universities, and by treating the
accumulation of knowledge as a primary good. Others squelch it as a threat to established order.
As important as the creation of knowledge is its preservation, in environments that are robust
against dissolution; books that won’t burn, bits that won’t be wiped, Maxwell Structures that won’t be
eroded. Media that won’t be left without readers. Evolution requires variation and selection and retention.
Each of these processes—tolerance of variation, selection of productive innovation, and retention
through access to secure information—form the core of stable societies. It is height of the elevation of the
elite above the hoi polloi that energizes discontent. Equitable distribution of access to power—letting all
who would attempt, reap the potential of knowledge—reduces the potential for strife. In the Federalist
Papers and elsewhere, the founding fathers of the United States understood the importance of creating
Ref.: Conductual, 2014, 2, 1, 4-12
ISSN: 2340-0242
11
Conductual, International Journal of Interbehaviorism and Behavior Analysis
Killen, P.R.
one nation. The alternative, a federation of states, was unstable and would lead inevitably to internecine
wars. They studied ways to implement positive and negative feedback, discovered the importance of a
variety of time-constants, of seed operations, and the important different roles for self-quenching versus
self propagating features; most importantly, they recognized the importance of a system in which selfinterest would work toward stability, not against it. They designed the new democracy to last (Platt, 1966).
If it is to last in nations that aspire to stable democracy, then citizens who teach citizens must keep this
appreciation always before them, refine it, and teach it to their students. They must give them the keys to
the code.
References
Georgescu-Roegen, N. (1971). The Entropy Law and the Economic Process. Cambridge, MA: Harvard
University Press.
Hermeneutic circle. (2014, January 2). In Wikipedia, The Free Encyclopedia. Retrieved 21:16, March 2, 2014.
Jaynes, E. T. (1957). Information theory and statistical mechanics. Physical Review Letters, 106, 620-630.
Kelso, J. A. (1995). Dynamic Patterns: The Self-Organization of Brain and Behavior (Complex Adaptive Systems).
Cambridge, MA: MIT Press.
Killeen, P. R. (1992). Mechanics of the animate. Journal of the Experimental Analysis of Behavior, 57, 429-463.
Maxwell, J. C. (1882) Science and free will. Reprinted in L. Campbell & W. Garnett (eds), The life of James
Clerk Maxwell. London: Johnson Reprint Corp.
Platt, J. R. (1966). The step to man. New York: John Wiley & Sons, Inc.
Prigogine, I., & Stengers, I. (1984). Order out of chaos. New York: Bantam Books.
Schrödinger, E. (1944/1995). What is Life? Cambridge University Press.
Solomon, R. L., & Corbit, J. D. (1973). An opponent-process theory of motivation: II. Cigarette addiction.
Journal of Abnormal Psychology, 81, 158.
Wolf, N. (2007). The end of America: Letter of warning to a young patriot. Chelsea Green Publishing,
chelseagreen.com.
Ref.: Conductual, 2014, 2, 1, 4-12
ISSN: 2340-0242
12
Conductual, Revista Internacional de Interconductismo y Análisis de Conducta
La falacia del argumento cronológico
La falacia del argumento cronológico: reflexiones acerca de la confusión entre modernidad y
progreso y sus repercusiones sobre el desarrollo de la psicología. 1
Esteve Freixa i Baqué
Université de Picardie. Amiens. Francia
María Xesús Froján Parga2
Universidad Autónoma de Madrid. España
Resumen
Este trabajo es una reflexión acerca de los conceptos de modernidad y progreso y los peligros de utilizar
un argumento cronológico como prueba de que una posición científica, filosófica, histórica o artística es
más avanzada que otra. En psicología esta argumentación cobra una especial relevancia a la hora de
justificar las posiciones cognitivistas como una superación de las conductistas. En las siguientes páginas se
ilustra con diversos ejemplos la falacia del argumento cronológico y se plantea a modo de ejemplo la
supuesta modernidad de las terapias de tercera generación, que si ocupan este lugar lo hacen precisamente
por lo que suponen de vuelta a los planteamientos más tradicionales del conductismo radical y del
aprendizaje operante: el interés en la posición skinneriana sobre conducta verbal, la definición de la
conducta como una contingencia de tres términos, la diferenciación del aprendizaje por reglas y por
contingencias o el quehacer terapéutico como un proceso de condicionamiento verbal.
Palabras clave: conductismo, cognitivismo, terapias de tercera generación.
Abstract
This work is a reflection on the concepts of modernity and progress and the dangers of using a
chronological argument as proof that a scientific, philosophical, historic or artistic position is more
advanced than the other. In psychology, this argumentation becomes prominent when justifying cognitive
views as an overcoming of behaviorism. In the next pages, the fallacy of the chronological argument is
illustrated with examples, such as the supposedly modern Third Generation Therapies, who owe the place
they hold precisely to their role in the return of the most traditional approaches of radical behaviorism and
operant learning: the interest in the Skinnerian standpoint on verbal behavior, the definition of behavior as
a three-term contingency, the distinction between rule-mediated and contingency-mediated learning or the
therapeutic work as a verbal conditioning process.
Key words: behaviorism, cognitivism, third generation therapies.
Si el marxismo comparte con el psicoanálisis, según el análisis clásico de Popper, su falta de
falsabilidad, al menos presenta hoy en día con el conductismo una cosa en común: reivindicarlo
constituye, a los ojos de una gran mayoría, un absoluto sinsentido y un anacronismo ridículo.
La referencia de este artículo en la Web es: http://conductual.com/content/la-falacia-del-argumento-cronologico
Correspondencia: María Xesús Froján Parga. Departamento de Psicología Biológica y de la Salud. Universidad Autónoma de
Madrid. C) Ivan Pavlov 6, Campus universitario de Cantoblanco. 28049 Madrid (España). Email:: [email protected]
1
2
Ref.: Conductual, 2014, 2, 1, 13-22
ISSN: 2340-0242
13
Conductual, International Journal of Interbehaviorism and Behavior Analysis
Freixa i Baqué, E. y Froján-Parga M.X.
El problema de la cronología es justamente uno de los elementos más comúnmente esgrimidos para
decretar el carácter indiscutiblemente obsoleto de una concepción de la psicología, como es la conductista,
a la que, como mucho, se le reconoce el mérito, puramente histórico, de haber representado un progreso
respecto a los métodos introspectivos dominantes en el momento de su emergencia pero que pronto
alcanzó sus límites debido al enfoque en términos de "caja negra". La leyenda de la caja negra, tan falsa
como arraigada, ha perseguido al conductismo hasta la actualidad, dotando de argumentos a sus
detractores que, en un gran número de casos, no han leído un solo texto original de Skinner. La ola
cognitivista que le sucedió debía pues, supuestamente, relegarlo al museo de los trastos viejos y
establecerse como la verdadera psicología científica moderna, lejos de los aparentemente simplistas
diseños basados en los estímulos y las respuestas. Desde luego no se compartían los argumentos del Nobel
de Física Feynman, para quien explicar de manera simple lo complejo era una necesidad y una prueba de
que se comprendía un tema (Feynman, 2004).
Aparte de que caracterizar la posición conductista como perteneciendo al esquema S - R de tipo
“caja negra” (afirmación cotidiana y constante por parte de los psicólogos en general y de los cognitivistas
en particular) refleja una sublime necedad y una magna ignorancia de las concepciones neo-conductistas
como las de Skinner y Kantor y traduce una lamentable pero frecuente confusión entre el conductismo
metodológico y el conductismo radical (Fuentes y Quiroga, 2004), el hecho de enfatizar los aspectos
cronológicos no representa en absoluto un argumento mínimamente válido. A lo largo de este texto
mostraremos tanto la falacia del argumento cronológico como la validez actual de las bases
epistemológicas y metodológicas del conductismo para afrontar los problemas que la psicología se puede
plantear. Nos centraremos para ello en el desarrollo más espectacular que ha tenido la psicología aplicada
en los últimos tiempos, esto es, las terapias llamadas de tercera generación. El término tercera generación hace
referencia tanto a cuestiones cronológicas (terapias que suceden a otras anteriores) como de desarrollo
(suponen un avance sobre las terapias anteriores). Sin embargo vamos a ver que sí son de tercera
generación en cuanto a que siguen cronológicamente a las de segunda generación, pero que su novedad
radica en que representan un regreso a cuestiones olvidadas, abandonadas o rechazadas en su momento y
que a partir de los años 90 resurgen con gran fuerza y constituyen la fortaleza de este tipo de
aproximaciones clínicas. No es nuestro objetivo en este trabajo hacer un análisis de este tipo de terapias
sino únicamente señalar su defensa de planteamientos epistemológicos y metodológicos considerados
hasta entonces arcaicos, caducos o superados. Este tipo de terapias han sido mayoritariamente aclamadas y
recibidas como la recuperación del timón en una psicología clínica que a principios de los 90 iba a la
deriva. Que luego se hayan mantenido fieles o no a sus planteamientos iniciales o hayan derivado hacia
derroteros más que cuestionables para los autores de este trabajo sería otro tema que no vamos a discutir
aquí pero que no podemos dejar de señalar. Sin embargo, lo que sí vamos a discutir son los conceptos de
modernidad y progreso, muchas veces utilizados como sinónimos, y los problemas que tal identificación
conlleva.
Modernidad y progreso
Si el simple hecho de aparecer ulteriormente fuese suficiente para declarar superado y caduco lo
que le precedió, entonces deberíamos admitir que el arte abstracto es superior al figurativo y el arte
conceptual superior, a su vez, al abstracto. O que Bernard Henry-Lévi es mejor filósofo que Kant y que
éste es superior a Aristóteles. ¿Y quién pretendería que la Restauración del Antiguo Régimen monárquico,
por el mero hecho de acontecer posteriormente, representa un progreso respecto a la Revolución
Francesa?
Puede parecer que se está confundiendo el Arte y la Historia con la Ciencia y que estas disciplinas
no obedecen a las mismas reglas, no siguen los mismos esquemas ni poseen las mismas características.
Ref.: Conductual, 2014, 2, 1, 13-22
ISSN: 2340-0242
14
Conductual, Revista Internacional de Interconductismo y Análisis de Conducta
La falacia del argumento cronológico
Vamos a detenernos en este punto analizando una especificidad muy peculiar de la ciencia: su aspecto
acumulativo. ¿Qué se quiere decir cuando se afirma que la ciencia es acumulativa? Sencillamente, que, a lo
largo de los siglos, puede constatarse un real progreso en los conocimientos de tal o cual aspecto de la
Naturaleza. Que, por ejemplo, cualquier simple bachiller del siglo XXI sabe más biología molecular que su
bisabuelo, aunque éste hubiese sido premio Nobel de biología en su época. Que el más gandul de los
alumnos de la facultad de físicas sabe más física que Aristóteles (probablemente el hombre con más
conocimientos al respecto de su época). Y ello por la sencilla razón de que, a menudo (aunque no
siempre), como las “matrioskas” rusas, los nuevos descubrimientos, que se basan en los anteriores, vienen
a “recubrirlos” formando una muñeca más voluminosa que incluye e integra en su seno la anterior, y así
indefinidamente. Es en este sentido que puede afirmarse que gracias al saber, las ciencias, progresan. Al
contrario, en el campo de las artes o de la filosofía, esta noción de progreso es mucho más problemática, por
las razones obvias que hemos indicado antes (¿el impresionismo es más “adelantado” que el barroco?). Se
dice a menudo, al respecto, que más bien que obedecer a la ley de la acumulación, del progreso, de la
linealidad, obedece a la “ley del péndulo”, pasando de un extremo al otro, cada nuevo movimiento
artístico, cada nueva escuela filosófica, cada nueva teoría pedagógica construyéndose en oposición y en
reacción a la anterior, sin que pueda apreciarse un progreso objetivo y debiendo uno conformarse con una
cuestión de preferencia, opinión, sintonía o “vibraciones positivas”.
Pero si oponemos estos dos conceptos lo que conseguimos, como siempre que se utiliza un
argumento maniqueo, es un detrimento de los matices y caricaturización de las dos posiciones. Porque lo
de la linealidad es cierto si se contempla de manera global, macroscópica, con una cierta perspectiva molar,
a largo plazo. Pero si observamos un momento dado de la historia de la ciencia con una lupa, de manera
microscópica, con una perspectiva molecular, a corto plazo, nos podemos dar cuenta de que esta
progresión general, este vector recto, se compone en realidad, de “micro-meandros”, de “ziz-zags”, de
“tres pasos para adelante-un paso para atrás”, que en ningún caso pueden ser asimilados a un movimiento
pendular, que en modo alguno invalidan la noción de progreso y de avance, pero que pueden desorientar
al observador contemporáneo, sin versión a largo plazo, y hacerle creer que ese meandro, ese paso atrás
antes de dar tres para adelante, por el solo hecho de llegar cronológicamente después, representa un
progreso.
Cuando se habla de un ciclo, resulta relativamente fácil, en general, fechar su inicio. Suele
coincidir con un hecho relevante, con un acontecimiento mayor, con un evento extraordinario. Por
ejemplo, la Revolución Francesa, la revolución proletaria o la revolución conductista. En cambio, decretar
de manera certera y definitiva, el final de un ciclo, puede resultar mucho más delicado, difícil y arriesgado.
Lo que uno puede considerar en un momento dado, sin perspectiva histórica por estarlo viviendo “en
directo”, como el final de un ciclo puede muy bien resultar varios años después, no haber sido más que
uno de los meandros o “zig-zags” de los que hablábamos hace un instante.
Si leemos, por ejemplo, la prensa francesa de la época del Imperio napoleónico o la
inmediatamente posterior, la de la época de la Restauración de la monarquía, queda claro que para los
ciudadanos de aquel país en aquel momento histórico, la famosa Revolución Francesa no había sido más
que un “accidente”, una etapa transitoria y coyuntural, en aquellos momentos totalmente superada. El
ciclo revolucionario iniciado con la toma de la Bastilla el 14 de julio de 1789 se hallaba definitivamente
cerrado (Bainville, 2007). La perífrasis usada para referirse a él era “el paréntesis revolucionario”. Qué mejor
metáfora que la del paréntesis para significar un acontecimiento perfectamente acotado, con sus límites
temporales indiscutiblemente establecidos, con su alfa y su omega reconocidos y admitidos por todos. El
paréntesis representa la imagen misma de un ciclo, de algo que tiene un inicio y un final objetivamente
marcados. Bajo el imperio de Napoleón pues, o bajo la Restauración, las tesis republicanas parecían
Ref.: Conductual, 2014, 2, 1, 13-22
ISSN: 2340-0242
15
Conductual, International Journal of Interbehaviorism and Behavior Analysis
Freixa i Baqué, E. y Froján-Parga M.X.
definitivamente enterradas, superadas por un tipo de sistema que, por reciente, se presentaba como un
progreso respecto a lo que le había precedido a pesar de que no se trataba más que de volver a rehabilitar
un régimen ya antiguo (el llamado justamente, Antiguo Régimen) más o menos adaptado a las exigencias,
gustos y modas de la época en cuestión. En terminología política, hoy llamaríamos a esos regímenes
“reaccionarios” (surgidos en reacción contra un régimen anterior, lo que les equipara a un modelo de tipo
pendular) y en ningún caso “progresistas” (lo que les equipararía a un modelo de tipo lineal o de
progreso).
El ejemplo precedente ilustra la dificultad de determinar el fin de un ciclo. Pero como este ciclo
de la historia de Francia sí que puede considerarse actualmente como definitivamente cerrado, quizás se
pueda ver mejor si planteamos un ejemplo de ciclo donde no está tan claro si ya ha terminado o si estamos
aun viviéndolo en directo aunque en uno de esos momentos de “un paso para atrás” que puede abrir hacia
“tres pasos para adelante”.
En efecto, todos conocemos la fecha del inicio de la revolución proletaria (conocida bajo el
nombre de “revolución de octubre” a pesar de que ocurrió en noviembre 3): la toma, por los bolcheviques
dirigidos por Lenin y Trotsky, del Palacio de Invierno, sede del gobierno provisional de Kerenski
constituido después de la llamada “revolución de febrero” (Broué, 1963). Así se abría el ciclo del
comunismo que para la mayoría de nuestros contemporáneos, se cerró con la caída del muro de Berlín el 9
de noviembre de 1989, es decir, 72 años (y 3 días) después. En la actualidad, en pleno 2013, casi todo el
mundo considera que el comunismo fracasó definitivamente y que el capitalismo constituye el marco
ideológico y el sistema económico triunfante, insuperable e insumergible, único horizonte de futuro
concebible. Y si alguien reivindicase el marxismo como herramienta válida de análisis y transformación de
la sociedad (y, por tanto, como opción fidedigna de futuro), lo más probable es que, como mínimo, se
reirían de él tratándolo de nostálgico rezagado.
Sin embargo, no es seguro que no estemos viviendo una época histórica homóloga a la que
evocábamos antes al hablar del Imperio napoleónico y la Restauración del Antiguo Régimen. Quizás el
ciclo del comunismo es mucho más largo y estamos ahora, sencillamente, en una de las fases “atrás” del
peculiar mecanismo de avance que estamos describiendo. Cuando uno constata la gigantesca crisis (similar
a la del 1929) que el sistema capitalista ha engendrado últimamente (y que todos padecemos), el aumento
exponencial de las diferencias entre pobres y ricos, entre países desarrollados y subdesarrollados, le es
difícil a uno comulgar con la idea de que el sistema que engendra tan nefastos efectos sea la panacea. Y
puesto que las derivas del sistema no pueden ser controladas sino que al contrario, cada vez cobran mayor
independencia y autonomía respecto a los gobiernos, instituciones internacionales, etc., cada vez hay más
personas convencidas de que su desenfrenado desarrollo no puede llevarle más que a una crisis total,
definitiva y auto-destructora. El socialismo (con todos los correctivos indispensables respecto a la manera
de cómo se desarrolló en los países del bloque comunista, evidentemente; con la constante
experimentación de nuevas fórmulas no dogmáticas, por supuesto), podría entonces de nuevo aparecer
como el mejor modelo para el desarrollo armonioso y la supervivencia de la humanidad sobre un planeta
cuyos recursos naturales no serían explotados y saqueados en provecho de los beneficios de unos cuantos
accionarios sino al servicio de un bien común solidario y justo.
Las terapias de tercera generación: Modernidad o progreso
Puede parecer que nos hemos alejado del objetivo de este trabajo y derivado hacia temas que no
tienen nada que ver con la psicología; sin embargo consideramos que este procedimiento puede ser útil, si
En efecto, los hechos ocurrieron el 25 de octubre de 1917 según el calendario llamado “juliano”, en vigor en aquella época
(hasta el invierno del 1918), y que corresponde al 7 de noviembre del calendario gregoriano.
3
Ref.: Conductual, 2014, 2, 1, 13-22
ISSN: 2340-0242
16
Conductual, Revista Internacional de Interconductismo y Análisis de Conducta
La falacia del argumento cronológico
no indispensable, para la buena comprensión de la tesis que vamos a plantear. Cuando una persona (o un
animal mínimamente complejo) quiere alcanzar un objeto que se halla perfectamente visible delante de él,
pero detrás de una pared de cristal de varios metros de largo, la conducta adaptada no consiste en
empeñarse en alcanzar el objeto a través del cristal, en ensañarse con la pared transparente, sino en darle la
vuelta, es decir, en consentir alejarse primero para luego volver atrás (pero por el otro lado del cristal) para
alcanzar el objeto. Y precisamente esto es lo que estamos haciendo para abordar las cuestiones
psicológicas que son nuestro objeto de estudio.
Las terapias de tercera generación (enfoque contextual) se consideran la evolución de la
modificación de conducta y supuestamente aparecen como una superación de las terapias cognitivas
(segunda generación, enfoque cognitivo-conductual) que se sumaron (y nunca sustituyeron) a la
modificación de conducta tradicional (primera generación, enfoque conductual) a mediados de los años
70, algo que se denominó en su momento “salto cognitivo” (Mahoney, 1974/1983) o “revolución
cognitiva” (Franks, 1991). Si bien la secuencia descrita puede dar una idea de progresión o desarrollo lineal
en los modelos conductuales, que serían superados por modelos cognitivos, en absoluto ha sido así: cada
cambio no supuso una superación del modelo anterior ni una sustitución del antiguo por el nuevo sino
que todos los modelos terapéuticos nombrados coexisten dentro de la modificación de conducta. Los
años 80 se consideraron de crisis en el ámbito clínico precisamente por esta confusión conceptual que
derivó en un eclecticismo (teórico y técnico) y que parecía ir en contra del pronóstico de Reyna (1964),
quien consideraba que la evolución de la terapia de conducta y su capacidad de solución de los problemas
conductuales se debería a la aplicación más rigurosa de los principios del aprendizaje.
Pero a partir de los años 90 la situación cambia radicalmente y empiezan a surgir voces, cada vez
con más fuerza, reclamando una depuración conceptual y una clarificación metodológica precisamente a
través de la vuelta a los orígenes, esto es, a los planteamientos más puros del conductismo radical y los
aprendizajes asociativos. Hasta entonces, cuando un enfoque se mostraba en principio insuficiente para
explicar un determinado evento, se proponía el cambio de enfoque o la introducción de elementos nuevos
no comprobados experimental o empíricamente, artefactos psicológicos, en vez de profundizar e
investigar dentro del propio enfoque que se pretendía superar. Vamos, a partir de este momento, a señalar
las características de esta salida de la crisis y el surgimiento de las terapias de tercera generación destacando
en cada caso cómo, lo que se llamó progreso significó precisamente, un regreso a cuestiones del pasado
(más antiguas pero más modernas). Y sobre todo, cómo el progreso significó un alejamiento de las
posiciones cognitivistas que supuestamente habían significado un avance sobre las conductistas, obsoletas,
y una reafirmación de los planteamientos del conductismo radical para dar cuenta de los principales
problemas teóricos y aplicados que la psicología se pudiese plantear.
En primer lugar, uno de los adelantos de las terapias de tercera generación fue la recuperación del
interés sobre el estudio de la conducta verbal en la más pura esencia skinneriana. La obra Verbal Behavior
(Skinner 1957) fue el punto de partida para el desarrollo de la psicoterapia analítica funcional (PAF,
Kohlenberg y Tsai, 1987, 1995) y la terapia de aceptación y compromiso (TAC, Hayes y Wilson, 1994;
Hayes, McCurry, Afari y Wilson, 1995; Hayes et al., 1999). Los autores citados, entre otros, consideraron
que en la clínica se hablaba, pero el terapeuta no manejaba el lenguaje como conducta verbal, en el sentido
de Skinner (1957) y Keller y Schoenfeld (1950). Pérez (1996a) afirmaba, siguiendo a Skinner, que en el
campo verbal se encontraba la solución al único problema que el subjetivismo podía plantear a una ciencia
de la conducta. Y por ello, para explicar los acontecimientos privados, se recurrió al análisis operante de la
conducta verbal (Catania, 1968; Kazdin, 1991; Luciano, 1993, 1999; Unturbe, 2004). En esta línea, se
recuperan los trabajos sobre relaciones de equivalencia (Sidman, 1971) alternativa explicativa para el
entendimiento desde un punto de vista conductual de constructos cognitivos tales como creencias,
Ref.: Conductual, 2014, 2, 1, 13-22
ISSN: 2340-0242
17
Conductual, International Journal of Interbehaviorism and Behavior Analysis
Freixa i Baqué, E. y Froján-Parga M.X.
categorías, expectativas y esquemas (Dougher, 1998): la verbalización de emociones o pensamientos no
hay que utilizarla para explorar un supuesto mundo interior sino que tales verbalizaciones son conductas
en sí mismas y hay que estudiarlas especificando las condiciones que las posibilitan y las funciones que
tienen (Skinner, 1957). Quiere esto decir que la salida de la crisis de la terapia psicológica no pasó por la
inclusión de variables cognitivas, esto es, no supuso un proceso de cognitivización sino que por el
contrario, fue la conductualización de las variables consideradas, su análisis a la luz de procesos de
aprendizaje asociativo lo que condujo a la tercera generación. No se niega (como nunca se había negado)
la existencia de variables encubiertas que pueden tener un papel fundamental en la explicación de la
conducta; pero, en la línea de lo expuesto por autores como Ryle (1949), Kantor (1975) o más
recientemente, Freixa i Baqué (2003) o Pérez (2004), el planteamiento más moderno considera que carece de
sentido colocar en la piel la barrera que separaría dos mundos, uno “exterior” y otro “interior”, y que
modificaría sustancialmente la naturaleza de la conducta que tiene lugar dentro y fuera de dicha frontera.
En este sentido, el pensamiento, por ejemplo, no sería otra cosa que habla silenciada pero habla al fin y al
cabo, regida por los mismos principios que gobiernan el comportamiento manifiesto. Esta habla
silenciada, sin embargo, no sería la causa del habla manifiesta ni necesariamente del comportamiento
observable. Se trata de una conducta más, accesible eso sí, a un único observador, la persona que la emite,
pero que se puede estudiar de un modo tan riguroso como se estudia el comportamiento manifiesto.
En segundo lugar, se definió la conducta en términos operantes como una contingencia de tres
términos (estímulo discriminativo, respuesta, estímulo reforzador) con dos condiciones causales iniciales
(los estímulos discriminativos y los reforzadores); pero como el estímulo discriminativo puede estar a su
vez discriminado (discriminación condicional) y ser reforzador, el resultado es una causalidad múltiple.
Esto es, la simplicidad de los tres términos no implica reduccionismo ni limitación para analizar la enorme
complejidad del comportamiento humano (en el mismo sentido que el abecedario español tiene sólo 27
letras pero la literatura española construida con ese abecedario, es inmensamente rica). De nuevo cobran
aquí relevancia las relaciones de equivalencia, consideradas como explicación del mecanismo por el cual se
adquieren diversos trastornos del comportamiento (Friman, Hayes y Wilson, 1998) o como sustrato de la
conducta simbólica (Hayes y Hayes, 1992). Si bien fue en 1971 cuando Sidman empezó a estudiar este
fenómeno, sus bases teóricas y metodológicas se desarrollan unos años más tarde, en un trabajo en el que
se describe el paradigma básico del procedimiento de igualación a la muestra (Sidman y Tailby, 1982). Pues
bien, este viejo procedimiento de análisis operante de la conducta humana constituye el germen de la
innovadora y ultramoderna Teoría del Marco Relacional o Relational Frame Theory piedra angular, a su vez, de la
Terapia de Aceptación y Compromiso (Hayes, 1991; Hayes, Barnes-Holmes y Roche, 2001).
En tercer lugar, se recuperó el concepto de regla, formulado por Skinner en 1969 y definido
entonces como un “estímulo especificador de contingencias” (Skinner 1969). En este sentido, tuvo
especial relevancia para el desarrollo de las terapias de tercera generación la distinción entre “conducta
gobernada por reglas y conducta moldeada por contingencias”, ya presente en Skinner en su obra de 1957
y con unos antecedentes todavía más lejanos (Russell, 1910; Ryle, 1949)
En cuarto lugar, se destacó el papel del moldeamiento de la conducta verbal como una de las más
potentes técnicas de cambio de la conducta (Kohlenberg, Tsai y Dougher, 1993). Este planteamiento fue
defendido por el conjunto de terapias de tercera generación que concibieron el proceso terapéutico como
un proceso dialéctico (Luciano, 1999), en el que la marcha del mismo sería una función de las
contingencias habidas en cada momento en un marco de actuación abierto que permitiría que ciertas
formas de comportamiento del cliente quedasen seleccionadas por las contingencias generadas por el
terapeuta (Ferro, 2006). Desde esta perspectiva, la modificación de conducta se definió como la aplicación
de operaciones conductuales básicas para problemas psicológicos (Hayes, Follete y Follete, 1995; Pérez,
1996a). Se denominan básicas porque son las características del análisis experimental de la conducta, y
Ref.: Conductual, 2014, 2, 1, 13-22
ISSN: 2340-0242
18
Conductual, Revista Internacional de Interconductismo y Análisis de Conducta
La falacia del argumento cronológico
aunque sus autores incorporen planteamientos psicodinámicos, existencialistas y de otras viejas
psicoterapias concebidas sin base empírica (en palabras de Hayes, 1987), afirman que no lo harían de
forma ecléctica, sino en su marco conceptual (el análisis experimental de la conducta). Se puede discutir si
se mantienen o no fieles al análisis experimental o han derivado hacia esos aspectos más criticables de la
psicoterapia tradicional, pero como ya hemos comentado, no es el objetivo de este trabajo hacer un
análisis crítico de las terapias contextuales (tarea, sin embargo, indispensable que diversos autores han
realizado en otros momentos. Véase por ejemplo: Burgos, 2004; Froján, Pardo, Vargas y Linares, 2011;
Tonneau, 2001; 2004) sino señalar que las fortalezas que destacan sus defensores tienen su base en el
conductismo radical y en el estudio operante de la conducta verbal.
Cognitivismo y conductismo
Y nos gustaría dar un paso más allá en este análisis de lo que significa el progreso en psicología,
una vez que hemos tomado como ejemplo el caso de desarrollo más llamativo de las últimas décadas. Y
porque precisamente las terapias de tercera generación defienden el regreso a los planteamientos
epistemológicos del conductismo radical, cabría plantearse qué ocurre con el supuesto avance que
representa el cognitivismo frente al conductismo. Una vez que hemos analizado las diferencias entre
cuestiones cronológicas y de superación o asimilación, es fácil concluir que los defensores del
cognitivismo frente al conductismo caen precisamente en este error: confundir modernidad y progreso. La
noción de modernidad es de orden puramente temporal, cronológico y su carácter relativo no tiene en
absoluto por qué corresponder a otro progreso más que al puramente temporal. En cambio, la noción de
progreso (que incluye forzosamente un aspecto temporal pero sin confundirse con él, como veremos
enseguida) conlleva un juicio de valor (a menudo subjetivo, cierto) que no se reduce a la cronología. Así,
para algunos (que van a ser considerados justamente como progresistas), el cambio en las costumbres
(« liberalización » como suele decirse) en materia de sexualidad constituye un progreso indiscutible
mientras que para otros va a ser considerada como un retroceso hacia la inmoralidad, lo que ilustra el
carácter eminentemente cultural, ideológico y subjetivo de la noción de progreso.
Podemos poner otro ejemplo. Ser viejo, por el solo hecho de acontecer después de ser joven, ¿es
forzosamente un progreso? Difícil de sostener constatando los achaques de nuestro cuerpo. Alguien dijo,
muy acertadamente, que cuando nuestro cuerpo empieza a hablarnos, raramente es para darnos buenas
noticias... Las cosas claras: el único progreso que envejecer constituye es el progreso... hacia la muerte.
Pero es cierto también que envejecer es el mejor remedio que se ha inventado... ¡para no morir joven!
Así pues, podríamos resumir las relaciones entre progreso y cronología diciendo que todo
progreso implica un avance cronológico, pero que todo avance cronológico no implica forzosamente un
progreso.
Los cognitivistas, al proclamar la superioridad de su concepción respecto a la concepción
conductista utilizando el argumento puramente cronológico parecen ignorar esta trivial evidencia. Al igual
que los contemporáneos de Napoleón o de la Restauración, están convencidos de vivir una época que
representa un progreso indiscutible respecto a la inmediatamente anterior, que se han apresurado a
calificar de paréntesis para significar claramente que tuvo un principio pero, sobre todo, que tuvo un final
irreversible. No hay manual cognitivista que no afirme que el conductismo constituye en la actualidad una
etapa definitivamente superada de la historia de la psicología, un paréntesis cerrado, un ciclo terminado.
Términos como “los limites inherentes al enfoque conductista”, “el callejón sin salida del conductismo”,
“el aspecto simplista y reduccionista de la concepción conductista” son verdaderos lugares comunes de la
prosa cognitivista que podemos leer en decenas de publicaciones (Benedetto, 2000; Braunstein y Pewzner,
1999; Doron y Parot, 1991; Lieury, 1990; Nicolas, 2001).
Ref.: Conductual, 2014, 2, 1, 13-22
ISSN: 2340-0242
19
Conductual, International Journal of Interbehaviorism and Behavior Analysis
Freixa i Baqué, E. y Froján-Parga M.X.
Pero, ¿y si en lugar de representar un progreso, un avance, el cognitivismo no fuese más que la
última y desesperada reacción del dualismo (ontológico, epistemológico y metodológico), la resurrección
provisional de Platón, los Padres de la Iglesia y Descartes, el último rebrote del mentalismo más desusado,
el último avatar (¡ni siquiera en 3 dimensiones!) del “fantasma en la máquina” (como decía Ryle en su obra
de 1949), el “paso hacia atrás” antes de continuar la marcha del progreso? ¿Si no fuese más que el
resurgimiento (con disfraz pseudo-científico, para aparentar seriedad) de concepciones que el conductismo
había prácticamente erradicado? ¿Y si resultase que el cognitivismo, hoy aparentemente triunfante en
tantas latitudes, no fuese más que la Restauración (luego forzosamente provisional y efímera) del Antiguo
Régimen? ¿El último y patético intento de “rehacerse” de un mal perdedor? ¿Una empresa
epistemológicamente reaccionaria? En otras palabras: ¿y si fuese él quien estuviese definitivamente pasado
de moda?
Quizás el verdadero progreso esté en la recuperación o reconstrucción, como afirma Pérez
(1996b) del conductismo radical; Skinner defendía la formulación de explicaciones que no rebasaran el
propio campo de las realizaciones experimentales, considerando que añadir cualquier tipo de variable
teórica, ya sea en términos fisiológicos o mentales, no era relevante en el plano donde ocurren las efectivas
relaciones y variables psicológicas (Fuentes, 1989): el plano de las relaciones a distancia (fenoménicas)
entre los focos o situaciones ambientales distantes, esto es, el plano conductual. De acuerdo con la
perspectiva fenoménico-conductual mantenida por Pérez (1996a,b), lo cognoscitivo no es algo ajeno o
diferente de lo conductual, sino que consiste en una propiedad inherente al ejercicio mismo de la
conducta, frente a la perspectiva representacional del enfoque cognitivo que entiende que la conducta nos
sirve para conocer una realidad distinta, la realidad cognitiva (sería un planteamiento dualista).
Esperemos (y obremos para) que en un futuro no muy lejano, más temprano que tarde, el
conductismo, definitivamente despojado de las caricaturas que le cuelgan sus detractores (en la mayoría de
los casos por ignorancia), sea entendido, aceptado, adoptado y considerado como el modelo que
representa el progreso científico en el conocimiento de la conducta de los seres vivos a fin de poder
contribuir eficazmente a mejorar su existencia y a, quizás, ayudarles a alcanzar un poco de esa felicidad a la
que toda persona aspira.
Referencias
Bainville, J. (2007). Histoire de France. Paris: Texto.
Benedetto, P. (2000). Introduction à la psychologie. Paris: Hachette.
Braunstein, J.F. et Pewzner, E. (1999). Histoire de la psychologie. Paris: Armand Colin.
Broué, P. (1963). Le parti bolchevique. Histoire du PC de l’URSS. Paris: Minuit.
Burgos, J. (2004). ¿Es la teoría del marco relacional inteligible? Acta Comportamentalia, 12, 1, 53-73.
Catania, A.C. (1968/1974). Investigación contemporánea en conducta operante. México: Trillas
Doron, R. y Parot, F. (1991). Dictionnaire de psychologie. Paris: Presses Universitaires de France.
Dougher, M. J. (1998). Stimulus equivalence and the untrained acquisition of stimulus functions. Behavior
Therapy, 29, 577-59.
Ferro, R. (2006). La psicoterapia analítica funcional (PAF): estableciendo relaciones terapéuticas, intensas y
curativas. Psicología Conductual, 14, 3, 343-359.
Ref.: Conductual, 2014, 2, 1, 13-22
ISSN: 2340-0242
20
Conductual, Revista Internacional de Interconductismo y Análisis de Conducta
La falacia del argumento cronológico
Feynman, R.P. (2004). Seis piezas fáciles. La física explicada por un genio. Barcelona: Crítica.
Franks, C.M. (1991). Orígenes, historia reciente, cuestiones actuales y estatus futuro de la terapia de
conducta: una revisión conceptual. En V. Caballo, (comp.). Manual de técnicas de modificación y terapia
de conducta (pp. 3-26). Madrid: Siglo XXI.
Freixa i Baqué, E. (2003). ¿Qué es conducta? International Journal of Clinical and Health Psychology, 3, 595-613.
Friman, P.C., Hayes, S.C. y Wilson, K.G. (1998). Why behavior analysts should study emotion: The
example of ansiety. Journal of Applied Behavior Analysis, 31, 137-156.
Froján, M.X., Pardo, R., Vargas, I. y Linares, F. (2011). Análisis de las reglas en el contexto clínico.
Edupsykhé, 10, 1, 135-144.
Fuentes, J.B. (1989). ¿Funciona la psicología empírica, de hecho, como una fenomenología experimental del
comportamiento? Introducción a Brunswik, E., El marco conceptual de la psicología. Madrid: Debate.
Fuentes, J.B. y Quiroga, E. (2004). Los dos principios irrenunciables del análisis funcional de la conducta y
del conductismo radical. Psicothema, 16, 4, 555-562Hayes, S.C. (1987). A contextual approach to therapeutic change. En N. Jacobson (Ed.), Psychotherapist in
clinical practice: Cognitive and behavioral perspectives (pp. 327-387). Nueva York: Guilford Press.
Hayes, S.C. (1991). A relation control theory of stimulus equivalence. En L.J. Hayes y P.N. Chase (Eds.),
Dialogues on verbal behavior. Reno, NV: Context Press.
Hayes, S. C., Barnes-Holmes, D., & Roche, B. (Eds.). (2001). Relational Frame Theory: A Post-Skinnerian
account of human language and cognition. New York: Plenum Press.
Hayes, S..C. & Hayes L.J. (1992) (Eds.). Understanding Verbal Relations. Nevada: Context Press.
Hayes, S.C. y Wilson, K.G. (1994). Acceptance and commiment therapy: Altering the verbal support for
experiential avoidance. The Behavior Analyst, 17, 2, 289-304.
Hayes, S.C., Batter, S., Gifford, E., Wilson, K.G., Afari, N. y McCurry, S.M. (1999). Acceptance and
commitment therapy. Reno, NV: Context Press
Hayes, S.C., Follete, W.C. y Follete, V.M. (1995). Behavior therapy: A contextual approach. En A.S.
Gurman y S.B. Messer (Eds.), Essential psychotherapies. Theorie and practice (pp. 128-181). Nueva
York: Guilford Press.
Hayes, S.C., McCurry, S.M., Afari, N. y Wilson, K.G. (1995). Acceptance and commitment therapy (ACT). A
therapy manual for the treatment of emotional avoidance. Reno, NV: Context Press.
Kantor, J.R. (1975). Psychological Linguistics. Revista Mexicana de Análisis de la Conducta, 1, 2, 249-268.
Kazdin, A.E. (1991). Sobre los aspectos conceptuales y empíricos de la terapia de conducta. En V.
Caballo, (comp.). Manual de técnicas de modificación y terapia de conducta (pp. 27-50). Madrid: Siglo XXI.
Keller, F.S. y Schoenfeld, W.D. (1950/1975). Fundamentos de psicología. Barcelona: Fontanella.
Kohlenberg, R.J. y Tsai, M. (1987). Functional analytic psychotherapy: Two contemporary examples.
Clinical Psychology Review, 13, 579-592.
Ref.: Conductual, 2014, 2, 1, 13-22
ISSN: 2340-0242
21
Conductual, International Journal of Interbehaviorism and Behavior Analysis
Freixa i Baqué, E. y Froján-Parga M.X.
Kohlenberg, R.J. y Tsai, M. (1995). Functional analytic psychotherapy: a behavior approach to intensive
treatment. En W. O’Donohue y L. Krasner (Eds.), Theories of behavior therapy. Exploring behavior
change (pp. 637-658). Washington, DC: APA.r, B. F. (1957/1981).
Kohlenberg, R.J., Tsai, M. y Dougher, M.J. (1993). The dimensions of clinical behavior analysis. The
Behavior Analyst, 16, 2, 271-282.
Lieury, A. (1990). Manuel de Psychologie générale. Paris: Bordas.
Luciano, M.C. (1993). La conducta verbal a la luz de recientes investigaciones. Su papel sobre otras
conductas verbales y no verbales. Psicothema, 5, 2, 351-374.
Luciano, M.C. (1999). Terapia de aceptación y compromiso (ACT) y Psicoterapia analítica funcional
(FAP). Fundamentos, características y precauciones. Análisis y Modificación de Conducta, 25, 102,
497-584.
Mahoney, M.J. (1974/1983). Cognición y modificación de conducta. Bilbao: Desclée de Brouwer.
Nicolas, S. (2001). Histoire de la psychologie. Paris: Dunod.
Pérez, M. (1996a). Tratamientos psicológicos. Madrid: Universitas.
Pérez, M. (1996b). La psicoterapia desde el punto de vista conductista. Madrid: Biblioteca Nueva.
Pérez, M. (2004). Contingencia y drama. La psicología según el conductismo. Madrid: Minerva Ediciones.
Reyna, L.J. (1964). Conditioning therapy, learning theories and research. En J. Wolpe, A. Salter y L.J.
Reyna (dirs.) Conditioning therapies (pp. 8-15). Nueva York: Holt, Rinehart & Winston.
Russell, B. (1910). Knowledge by acquaintance and knowledge by description. Proceedings of the Aristototelian
Society, 11, 108-128.
Ryle, G. (1949/1967). El concepto de lo mental. Buenos Aires: Paidós.
Sidman, M. (1971). Reading and auditory-visual equivalences. Journal of Speech and Hearing Research, 14, 5-13.
Sidman, M. y Tailby, W. (1982). Conditional discrimination vs. matching to sample: An expansion of the
testing paradim. Journal of the Experimental Analysis of Behavior, 37, 5-22.
Skinner, B. F. (1957/1981). Conducta verbal. México: Trillas.
Skinner, B.J. (1969/1979). Contingencias de reforzamiento. Un análisis teórico. México: Trillas.
Tonneau, F. (2001). Equivalence relations: A critical analysis. European Journal of Behavior Analysis, 2, 1-33.
Tonneau, F. (2004). Review of the book Relational frame theory: A post-Skinnerian account of human language and
cognition. British Journal of Psychology, 95, 265-268.
Unturbe, J. (2004). Sobre el análisis funcional del pensamiento irracional: una aportación desde el marco
del conductismo radical. Psicología Conductual, 12, 1, 101-132.
Ref.: Conductual, 2014, 2, 1, 13-22
ISSN: 2340-0242
22
Conductual, Revista Internacional de Interconductismo y Análisis de Conducta
Redes neuronales, procesos cognoscitivos y análisis de conducta
Redes neuronales, procesos cognoscitivos y análisis de la conducta. 1
Rogelio Escobar2
Universidad Nacional Autónoma de México
Resumen
Se analiza la importancia de los modelos de redes neuronales para el entendimiento de los procesos
cognoscitivos en psicología y especialmente en el análisis de la conducta. En el trabajo se describen las
diferencias entre los modelos simbólicos y los modelos conexionistas o de redes para la descripción de los
procesos cognoscitivos. Posteriormente se describen los modelos de redes y se detallan los cálculos
relacionados con la función de activación y el entrenamiento de la red a partir de las reglas de aprendizaje
y la estimación del error. En la última sección se analiza la importancia de integrar los modelos de redes al
análisis de la conducta. Se concluye que los modelos de redes pueden servir como un puente para que las
explicaciones surgidas del análisis de la conducta se extiendan a la explicación de fenómenos típicos de la
psicología cognoscitiva como la representación y la memoria. Un propósito adicional es que este trabajo
sirva como una introducción que permita a los psicólogos y analistas de la conducta entender el
funcionamiento de las redes neuronales artificiales a partir de ejemplos relativamente simples.
Palabras clave: redes neuronales, modelos de redes, modelos simbólicos, procesamiento de la información, análisis de la
conducta
Abstract
This article analyzed the importance of artificial neural network models for understanding cognitive
processes in psychology and especially in behavior analysis. Differences between symbolic and
connectionist or network models in the description of cognitive processes are described. Subsequently,
network models are described and the calculations related to the activation function and network training
using rules of learning and error estimation are detailed. The final section discusses the importance of
integrating network models in behavior analysis. It is concluded that network models can serve as a bridge
to extend the explanations that emerged from behavior analysis into phenomenon like memory and
representation that are typically studied in cognitive psychology. An additional purpose is that this paper
could serve as an introduction allowing psychologists and behavior analysts to understand how artificial
neural networks work using relatively simple examples.
Key words: artificial neural networks, network models, symbolic models, information processing, behavior
analysis.
Dentro del campo de la inteligencia artificial y el aprendizaje de máquinas, se han generado
diversos algoritmos que permiten que un programa pueda modificar su funcionamiento a partir de la
experiencia (Mitchell, 1997). Algunos de estos algoritmos pueden considerarse como simulaciones por
computadora de procesos cognoscitivos en humanos, tales como el aprendizaje y la memoria.
La referencia de este artículo en la Web es: http://conductual.com/content/redes-neuronales-procesos-cognoscitivos-y-analisisde-la-conducta
2 Correspondencia: Rogelio Escobar. Laboratorio de Condicionamiento Operante. Facultad de Psicología, UNAM. Av.
Universidad 3004, Colonia Copilco-Universidad. C.P. 04510. México, D.F. México. Tel. 56222303. Email: [email protected]
1
Ref.: Conductual, 2014, 2, 1, 23-43
ISSN: 2340-0242
23
Conductual, International Journal of Interbehaviorism and Behavior Analysis
Escobar, R.
El aprendizaje de máquinas es importante debido a que permite el diseño de programas que
pueden adaptarse a ambientes cambiantes o en los que no pueden predecirse con precisión las condiciones
en las cuales deberá ejecutarse el programa. Algunas aplicaciones del aprendizaje de máquinas son el
reconocimiento de escritura y voz, y la clasificación de datos. A pesar de que a partir del auge de las teorías
del aprendizaje en psicología y específicamente del desarrollo del análisis de la conducta, y de que durante
décadas se han estudiado las variables que controlan el aprendizaje de patrones conductuales tanto en
humanos como en animales no humanos, la interacción entre el análisis de la conducta y el aprendizaje de
máquinas ha sido mínima (Hutchison, 2012).
Una de las razones para la falta de esta interacción es que dentro del análisis de la conducta la
creación de modelos o simulaciones por computadora son reminiscentes del problema que advirtió
Skinner (1950) de estudiar un sistema nervioso conceptual que, por su carácter especulativo, aportara poco
a nuestro entendimiento del comportamiento. Una crítica similar puede aplicarse al estudio de procesos
hipotéticos que sirvan como mediadores de las relaciones entre el medio ambiente y la conducta (Skinner,
1977). Para algunos autores (e.g., Epstein, 1984), las simulaciones por computadora del aprendizaje
pueden ser incorrectas si parten del supuesto de que los humanos son procesadores de información a
partir de la cual forman reglas para generar conducta compleja.
Existen al menos dos preguntas que habrían de contestarse para determinar la importancia de la
interacción entre el análisis de la conducta y los modelos del aprendizaje de máquinas: 1) ¿qué pueden
ganar los analistas de la conducta al estudiar simulaciones por computadora de procesos tradicionalmente
estudiados en campos como las neurociencias y la psicología cognoscitiva? y 2) ¿los avances en el análisis
de la conducta podrían ser de utilidad para el desarrollo del aprendizaje de máquinas y la inteligencia
artificial?
El presente trabajo trata de dar respuesta a estas preguntas con el ejemplo específico de las redes
neuronales que no sólo han permitido simular procesos de aprendizaje sino que podrían convertirse en
sustitutos de las metáforas del procesamiento de la información o modelos simbólicos tradicionalmente
utilizados en la psicología cognoscitiva. Para poder contestar las preguntas, primero se describen
brevemente las diferencias entre los modelos simbólicos y conexionistas o de redes para el entendimiento
de los procesos cognoscitivos. Posteriormente se describirá el desarrollo de los modelos de redes y se
mostrarán ejemplos del funcionamiento de las redes neuronales que se espera faciliten el entendimiento de
éstas. En la última sección se analizará la importancia de integrar los modelos de redes al análisis de la
conducta y algunos aspectos en los cuales el análisis de la conducta podría contribuir al desarrollo del
aprendizaje de máquinas.
El avance en el desarrollo de las computadoras en las décadas de 1950 y 1960 guiada, al menos
parcialmente, por el modelo conceptual de la máquina de Turing (1936) que permitía que la computadora
leyera símbolos de una tira y ejecutara diferentes acciones, tuvo impacto en la conceptualización de los
procesos cognoscitivos en humanos. La teoría computacional de la mente (e.g., Putnam, 1961/1980) sirvió
para conceptualizar el funcionamiento de los procesos cognoscitivos en términos similares al
funcionamiento de las máquinas de Turing y de las computadoras en general; esto es, en términos del
procesamiento de la información. De acuerdo con Pinker (1997), esta metáfora incluso resolvió el
problema relacionado con el dualismo de usar fenómenos no físicos como las “intenciones” y los
“deseos” como explicación de la conducta observable. Para Pinker la teoría computacional de la mente
permite conceptualizar cómo el mundo se representa por medio de símbolos. En estos términos, las
intenciones y los deseos son representaciones simbólicas del mundo y los símbolos, que surgieron a partir
del contacto de los órganos de los sentidos con el mundo, pueden dar origen a nuevos símbolos que estén
incluso asociados con conducta observable.
Ref.: Conductual, 2014, 2, 1, 23-43
ISSN: 2340-0242
24
Conductual, Revista Internacional de Interconductismo y Análisis de Conducta
Redes neuronales, procesos cognoscitivos y análisis de conducta
Una vez que se utiliza la metáfora del procesamiento de la información hay algunas preguntas que
se vuelven importantes. Por ejemplo, en la psicología cognoscitiva un problema importante ha sido
determinar cómo se “representa” el conocimiento. Una pregunta relacionada es ¿dónde y cómo se
almacenan las representaciones del conocimiento? Si bien estas preguntas son importantes en términos de
la metáfora del procesamiento de la información, desde el punto de vista del análisis de la conducta son
irrelevantes debido a que parten de varios supuestos que podrían ser incorrectos (véase Skinner, 1974).
Por mencionar solamente un ejemplo, una representación es un constructo que se utiliza para identificar
una imagen o un “símbolo” que ocurre de manera “interna” o privada y “sustituye” a la ocurrencia de
eventos observables. Cuando se asume que la representación se utiliza para llevar el “mundo exterior” al
“mundo interior”, se hace una distinción entre dos aspectos del mundo: el privado, hecho de
representaciones, y el observable hecho de aspectos “reales”. Una vez que se hace esta distinción, se cae
en el error conceptual de asumir que el mundo interior no es más que una copia del mundo “real” y se
abren preguntas acerca de si la copia es perfecta o imperfecta. Si se acepta el segundo caso, se tendría que
concluir que nunca podremos saber cómo es el mundo “real” a partir de representaciones imperfectas. En
cambio para el análisis de la conducta, la conducta privada que podría consistir, al menos en parte, de
imaginar eventos, es una parte de la conducta que puede explicarse a partir de la interacción del organismo
con el medio ambiente y, en este sentido, no es diferente de la conducta observable.
Aunque algunos autores han descrito que usar la metáfora del procesamiento de la información
no significa decir que el funcionamiento cognoscitivo pueda equipararse con el de una computadora ni
que el funcionamiento de las computadoras pueda darnos información sobre el funcionamiento
cognoscitivo de las personas, la metáfora significa que, al menos parcialmente, el funcionamiento
cognoscitivo sigue la lógica del procesamiento de la información (Lewis, 1999). Por ejemplo, puede
pensarse que las personas poseen una unidad o un sistema en la cual se almacena la información con un
código particular. Siguiendo con esta lógica, se podría incluso sugerir que la manera como se organiza el
código es la representación y tanto el almacenamiento como la recuperación del código es la memoria.
Estas metáforas han dado como resultado la creación de modelos simbólicos del funcionamiento
cognoscitivo en los que se asume que las personas representan el conocimiento usando un proceso de
manipulación de símbolos.
En los modelos simbólicos, la representación del conocimiento ocurre a partir del uso de
símbolos. Un ejemplo puede ser el siguiente, si un operador introduce un 5 a una computadora (input) y
pide que se añada 5 a ese número, la computadora presentará un 10. Este 10 es una representación
simbólica de un concepto que tiene sentido para el operador humano pero no para la computadora. En la
misma tradición, si alguien menciona que quiere a su perro, una persona entendería que ‘perro’ es una
representación simbólica de un perro, que ‘quiere’ es una representación simbólica de la relación que una
persona puede tener con su perro y que ‘perro’ es también el receptor del “afecto” de esta persona (véase
Kelley, 2003). La representación simbólica del conocimiento ha abierto, entre otros, un debate que
consiste en determinar si los símbolos codifican el conocimiento proposicionalmente (de manera
abstracta) o por medio de imágenes o representaciones pictóricas analógicas (e.g., véase Kosslyn, 1980;
Paivio, 1979; Pylyshyn, 1973).
De acuerdo con algunos psicólogos cognoscitivos y neuropsicólogos la actividad cognoscitiva o
mental es el resultado de la actividad neuronal (Kalat, 2009). En este sentido, si representar y almacenar el
conocimiento son actividades cognoscitivas, éstas deben estar asociadas con cierta activación del sistema
nervioso central. A pesar de la importancia de la relación que existe entre los procesos cognoscitivos y la
actividad neuronal, en la mayoría de los casos, la investigación en las neurociencias cognoscitivas se ha
centrado en mostrar cómo es que áreas específicas del sistema nervioso central correlacionan con ciertas
Ref.: Conductual, 2014, 2, 1, 23-43
ISSN: 2340-0242
25
Conductual, International Journal of Interbehaviorism and Behavior Analysis
Escobar, R.
actividades cognoscitivas (Gazzaniga, 2008). De esta forma, en algunos casos ha tratado de materializarse
la metáfora de la representación y el almacenamiento de la información. Aunque este tipo de investigación
provee información valiosa sobre la organización global del sistema nervioso, en ocasiones parece sugerir
que hay partes específicas del cerebro en las cuales parece “almacenarse” información o “son centros” en
los cuales se originan ciertas actividades cognoscitivas. Un problema con estas metáforas de localización es
que tienden a crear homúnculos (Wegner, 2005) y otro es que debido a su carácter esencialista no ilustran
adecuadamente el funcionamiento conocido de las neuronas y sus conexiones (Palmer & Donahoe, 1992).
Como una alternativa a los modelos simbólicos y a las metáforas de la localización, los modelos
de redes neuronales o conexionistas se alejan de la metáfora de la computadora y describen cómo la
activación neuronal y su interconexión con otras neuronas pueden realizar diferentes funciones tanto en
organismos vivos (redes neuronales biológicas) como en simulaciones por computadora (redes neuronales
artificiales, véase Kehoe, 1989). Las redes neuronales se organizan a partir de la idea, tomada de nuestro
entendimiento de las neuronas reales, de que una neurona es una célula que se especializa en la recepción
de estímulos y en la transmisión de un impulso electroquímico en forma de un potencial de acción. Una
neurona se conecta con otras neuronas a través de sinapsis. Cuando en una neurona se dispara un
potencial de acción éste se extiende por el axón y por medio de la sinapsis el potencial de acción puede
transmitirse o inhibirse en otras neuronas (e.g., Burgos, 2002).
Una red neuronal artificial (en adelante red neuronal) es un modelo por computadora que simula
la interconexión y la actividad de las células neuronales. La tarea básica de una simulación por
computadora de una red neuronal es definir un conjunto de unidades neuronales artificiales o nodos así
como sus potenciales interconexiones y el peso de cada conexión. Después, a partir de una función de
activación se determina si la activación de una neurona pre sináptica produce la activación de la neurona
post sináptica. Posteriormente se añaden reglas bajo las cuales ocurren cambios en los pesos de las
interconexiones bajo las cuales la red “aprende”. Finalmente, la red se entrena y se observa cómo la red
cambia a partir de la experiencia o se adapta al ambiente (Olson & Hergenhahn, 2009).
Las redes neuronales tienen una serie de características generales. Una de las más importantes es
que realizan procesamiento en paralelo. Esto es, que varias unidades neuronales pueden funcionar al
mismo tiempo (véase Rumelhart & McClelland, 1986). Otra característica importante es que la
“representación del conocimiento” e incluso la “memoria” del sistema se encuentran distribuidas entre sus
partes (Hinton, McClelland & Rumelhart 1986). En contraste con los sistemas de representación local, en
una red neuronal no se puede entender una actividad a partir de la activación de cada unidad neuronal sino
sólo a partir de los patrones de funcionamiento de la red (Spratling & Johnson, 2004).
En este sentido, cuando se tratan de entender fenómenos como la memoria, en lugar de pensar en
términos de almacenamiento y recuperación de la información, las redes neuronales nos llevan a
conceptualizar el fenómeno como un cambio en la organización de la red como producto de la
experiencia. Una vez que la red cambia, realiza una función diferente y este cambio es lo que conocemos
como memoria. Cabe señalar que esta conceptualización es congruente con el análisis que Skinner (1974,
véase también 1988) hizo de los procesos de “memoria” al decir que:
Una persona cambia por las contingencias de reforzamiento bajo las cuales se comporta; no
almacena las contingencias. En particular, no almacena copias de los estímulos que han jugado
una parte en las contingencias. No hay “representaciones icónicas” en su mente; no hay
“estructuras de datos almacenadas en su memoria”; no tiene un “mapa cognoscitivo” del mundo
en el que vive. Solamente ha cambiado de tal forma que los estímulos ahora controlan tipos
particulares de conducta perceptual (p. 93, traducción del autor).
Ref.: Conductual, 2014, 2, 1, 23-43
ISSN: 2340-0242
26
Conductual, Revista Internacional de Interconductismo y Análisis de Conducta
Redes neuronales, procesos cognoscitivos y análisis de conducta
Desarrollo histórico
Los modelos de redes neuronales se originaron con el trabajo de McCulloch y Pitts (1943). Estos
autores describieron un modelo que consistió en usar unidades que compartieran características con las
neuronas biológicas. Por ejemplo, una neurona puede recibir una cierta cantidad de entradas excitatorias y
una cierta cantidad de entradas inhibitorias. La actividad de la neurona, que debe mantener un estado
binario (dispara o no dispara), está determinada por la suma de estas entradas. Si la suma de las entradas
excitatorias excede un umbral, Φ, la unidad dispara. Esta función de activación se conoce como función
de transferencia de escalón o de umbral y se describirá en la siguiente sección. En el modelo de McCulloch
y Pitts (MMP), si al menos una entrada inhibitoria tiene un valor de activación de 1, la unidad no dispara.
Otra característica importante de las redes neuronales conforme al MMP fue que la estructura de la red no
cambiaba con el tiempo. En un ejemplo sencillo de este tipo de red, podría suponerse que se requiere que
la red resuelva la función lógica AND. Para realizar esta función se necesitan al menos dos unidades de
entrada y una unidad de salida. Con este ejemplo, únicamente cuando cambie el estado de ambas entradas,
la neurona emite un disparo. Esta función podría ser útil para reconocer y clasificar objetos con base en
dos características. Para realizar esta función se establece el valor de los pesos de la conexiones (w1 y w2)
en un valor arbitrario de 0.5. El valor de activación se calcula al sumar el producto de las entradas x1 y x2
(que puede ser activo +1 o no activo 0) y los pesos de la conexión (x1 w1) + (x2 w2) y este valor de
activación se compara con el valor del umbral (en este ejemplo tendría que ser 1). Si ambas entradas están
activas, el resultado de la suma de los pesos multiplicados por el valor de la entrada es de 1. En este caso
se produce un disparo dado que el valor es igual al valor del umbral. Si sólo una de las entradas estuviera
activa, el valor de la activación sería de 0.5 que es menor que el valor del umbral y no ocurriría el disparo.
Con esta red puede evaluarse fácilmente la función lógica OR si se reduce el valor del umbral, por ejemplo
a 0.5. De esta forma, la activación de una o ambas entradas generaría un disparo.
McCulloch y Pitts (1943) partieron del conocimiento de la época de que las neuronas debían
mantener un estado binario e integraron esta lógica en su modelo. Este concepto ha cambiado y
actualmente no sólo se considera el potencial de acción que puede o no ocurrir sino también la frecuencia
del potencial. Estos cambios se han integrado a los modelos de redes neuronales que, en lugar de
considerar a las neuronas como operadores binarios, actualmente las consideran como análogas a los
convertidores de voltaje a frecuencia o un convertidor analógico a digital (Anderson, 1988).
Un paso importante en el entendimiento del funcionamiento neuronal que eventualmente se
integró en las redes neuronales, consistió en que Hebb (1949) describió el principio que se conoce como la
ley de Hebb y que dice, en términos generales, que cuando una neurona excita a otra neurona, la conexión
entre las dos se vuelve más fuerte. Esta ley se ha parafraseado como “las neuronas que disparan
simultáneamente se conectan”. La ley de Hebb se ha integrado a la literatura sobre redes neuronales y
permite ver que el funcionamiento de la red cambia con la experiencia. En una red neuronal, la conexión
entre dos neuronas se vuelve más fuerte o, en otras palabras, aumenta la probabilidad de que la activación
de una neurona active a la segunda conforme a una regla que se conoce como regla de aprendizaje. Esta
regla de aprendizaje es una característica esencial en las redes neuronales posteriores a la de McCulloch y
Pitts (1943) (e.g., Rosenblatt, 1958).
Durante las décadas de 1950 y 1960 ocurrieron avances importantes en los modelos de redes
neuronales; por ejemplo, el perceptron de Rosenblatt (1958) que permitía discriminar entre dos patrones y
ajustar los pesos de las conexiones a partir del funcionamiento de la red. Otro ejemplo es ADALINE de
Widrow y Hoff (1960) que se aplicó a la reducción del eco en las líneas telefónicas. Sin embargo, para
algunos autores las redes neuronales estuvieron cerca de desaparecer después de que Minsky y Papert
(1969) hicieron evidente que el perceptron, igual que las redes basadas en el MMP, no podía resolver
Ref.: Conductual, 2014, 2, 1, 23-43
ISSN: 2340-0242
27
Conductual, International Journal of Interbehaviorism and Behavior Analysis
Escobar, R.
problemas relativamente simples como evaluar la función lógica de OR exclusivo (XOR) (véase la siguiente
sección para una descripción detallada de este problema). Durante los siguientes años se realizaron
relativamente pocos avances en el estudio de las redes neuronales.
Rumelhart, Hinton, y Williams (1986) sentaron las bases para el desarrollo de las redes neuronales
como se conocen actualmente cuando añadieron una capa de neuronas (oculta) entre las neuronas de
entrada y las neuronas de salida, lo cual permitió solucionar el problema de la función lógica XOR. Otro
aspecto importante fue que definieron claramente el concepto de retro propagación que fue incorporado
en las redes neuronales y que permiten usar reglas de aprendizaje a partir de las derivadas de las funciones
de activación.
Redes neuronales artificiales
Hay algunos conceptos importantes para entender el funcionamiento de una red neuronal. Uno es
el concepto de unidad neuronal de procesamiento que también se conoce como nodo o simplemente
como unidad y simula el funcionamiento de una neurona (aunque incluso una unidad puede estar
compuesta de un conjunto de neuronas). Cada unidad recibe un valor de entrada y genera un valor de
salida. En la Figura 1 se muestran dos redes. En la parte superior de la figura, una unidad de salida está
conectada a dos unidades de entrada. Cada columna en la figura se describe como una capa. En este
ejemplo solamente existe una capa de entrada y una capa de salida. En la parte inferior de la figura se
muestra una red con una capa intermedia u oculta. Estas capas, como se mostrará, son importantes en la
solución de tareas complejas. Las unidades de la capa de entrada no se consideran formalmente como
unidades neuronales de procesamiento debido a que su valor de salida es generado por el programa y no
requieren un valor de entrada.
Figura 1. Redes neuronales artificiales con dos capas (parte superior) y tres capas (parte inferior).
Ref.: Conductual, 2014, 2, 1, 23-43
ISSN: 2340-0242
28
Conductual, Revista Internacional de Interconductismo y Análisis de Conducta
Redes neuronales, procesos cognoscitivos y análisis de conducta
El valor de salida de cada unidad se conoce como valor de activación y simula el disparo de la
neurona. En el modelo de McCulloch y Pitts (1943) la activación podía tener un valor de 0 ó 1. En la
mayoría de las redes posteriores, la activación puede tener diferentes valores pero generalmente los valores
se normalizan. Una característica importante en las redes de pre alimentación (feed forward) como las que se
muestran en los ejemplos es que la estimulación se mueve en una sola dirección; esto es, hacia la capa
siguiente. Una unidad no puede conectarse con otras unidades de la misma capa ni con unidades de la
capa anterior.
Otro concepto importante en las redes neuronales es el peso de las conexiones. El peso simula la
sinapsis y determina junto con la activación de la neurona en la capa anterior el valor de activación de la
neurona receptora. Un supuesto importante de las redes neuronales es que el valor de la activación de la
unidad inicial y el peso se multiplican para generar el valor de activación de la neurona de salida.
En la Figura 2, se muestra un ejemplo simple de una red neuronal con dos neuronas de entrada y
una de salida. El valor de la activación de las unidades de entrada puede ser una combinación de 1 y 0 (a la
manera del modelo de MacCulloch y Pitts, 1943). En este ejemplo el valor de ambas unidades de entrada
se establecerá en 1 (I1 = 1, I2 = 1). El peso de las conexiones se determina inicialmente de manera
arbitraria y posteriormente cambia a partir de una función de aprendizaje que se describirá más adelante.
Para mantener este ejemplo, tan simple como es posible, los pesos de las conexiones entre las neuronas de
entrada y la neurona de salida se establecerán también en 1 (w1 = 1, w2 = 1).
Figura 2. Red neuronal con dos valores de activación y dos pesos en las conexiones.
Por lo tanto, en el ejemplo, el valor de activación de la neurona de salida está determinado por:
En este ejemplo aw = a1w1 + a2w2 = 2. Una vez que se calcula la sumatoria del producto del
valor de activación de entrada y el peso, es necesario usar la función de activación para generar el valor de
activación de salida. Existen diferentes funciones de activación. Por ejemplo, en el modelo de McCulloch
Ref.: Conductual, 2014, 2, 1, 23-43
ISSN: 2340-0242
29
Conductual, International Journal of Interbehaviorism and Behavior Analysis
Escobar, R.
y Pitts (1943) y en el perceptron de Rosenblatt (1958) la función de activación fue de umbral o de
transferencia de escalón y se representa de la siguiente manera:
Donde Φ es el valor del umbral. Si en el ejemplo anterior el umbral se establece en 1, entonces el
valor de activación de entrada de 2 resultaría en un valor de activación de salida de 1. Cabe señalar que el
valor de umbral y los valores de activación son arbitrarios y pueden cambiar en los diferentes ejemplos.
Los valores que se utilizan están determinados por el funcionamiento deseado de la red. En el panel
izquierdo de la Figura 3 se muestra la representación gráfica de la función de activación de escalón.
1
1
0
0
a
a
Figura 3. Representación gráfica de las funciones de activación de escalón (izquierda) y sigmoidal (derecha). En
ambos paneles a representa el valor de la activación de salida y aw representa el producto de la activación de entrada y
el peso de la conexión.
-1
-1
a. w
a. w
En la mayoría de la redes neuronales multicapa, se utiliza la función sigmoidal o logística que
permite que el valor de activación adquiera diferentes valores entre 0 y 1. Esta función de activación se
representa de la siguiente manera:
Una ventaja de la función sigmoidal es que su derivada puede usarse para ajustar los pesos en la
regla de aprendizaje de retro propagación (backpropagation). Las reglas de aprendizaje se describen en la
siguiente sección. En el panel derecho de la Figura 3 se muestra la representación gráfica de la función de
activación sigmoidal. Aunque existen otras funciones de activación (e.g., lineal) estas no se describirán en
el presente trabajo.
Si se usa la función de activación sigmoidal con la red del ejemplo anterior en la que se calculó
que el valor de activación de la entrada fue 2, el valor de activación de salida sería de 0.88. Esto es
Puede establecerse un umbral Φ para transformar este valor en una salida binaria en caso de que
sea necesario. Por ejemplo, si Φ se establece 0.5, un valor de activación de 0.88 cambia el estado de 0 a 1.
Ref.: Conductual, 2014, 2, 1, 23-43
ISSN: 2340-0242
30
Conductual, Revista Internacional de Interconductismo y Análisis de Conducta
Redes neuronales, procesos cognoscitivos y análisis de conducta
La red descrita en el ejemplo con un valor de umbral de 0.5 puede usarse para evaluar la función
lógica OR. La sección izquierda de la Tabla 1 muestra la tabla de verdad de la función lógica OR. Para
evaluar la función lógica OR quisiéramos que la entrada de las dos unidades (I1, I2) produjera en una
unidad de salida el valor descrito en la columna salida en la tabla. En el cálculo anterior la red recibió
entradas con valor de 1 en I1 y 1 en I2. El resultado de la red fue 0.88, que al ser mayor que el umbral de
0.5, se transformó en 1. Ahora si la red recibe 1 en I1 y 0 en I2 o si recibe 0 en I1 y 1 en I2, el valor de
activación con la función sigmoidal resulta en un valor de activación de 0.73, que al ser mayor que el
umbral se transforma en 1. En comparación, si la red recibe 0 en I1 y 0 en I2, el valor de activación con la
función sigmoidal resulta en un valor de activación de 0.5, que al ser igual que el umbral se transforma en
0. De esta forma pueden tomarse decisiones usando los valores de salida de la red conforme a la función
lógica OR. Es decir, que si se recibe un input de cualquiera de las dos unidades se emite una respuesta.
Una forma de cambiar la función lógica a verificar de OR a AND es cambiando el valor del
umbral, por ejemplo, a 0.75. La sección central de la Tabla 1 muestra la tabla de verdad de la función
lógica AND. Al cambiar el valor del umbral únicamente cuando se recibe un valor de activación en las dos
unidades de entrada se produce un cambio de estado de 0 a 1 en la unidad de salida.
Tabla 1: Tablas de verdad de las funciones lógicas OR, AND y XOR.
OR
I1
0
0
1
1
I2
0
1
0
1
AND
Salida
0
1
1
1
I1
0
0
1
1
I2
0
1
0
1
XOR
Salida
0
0
0
1
I1
0
0
1
1
I2
0
1
0
1
Salida
0
1
1
0
Nota. La sección izquierda muestra la tabla de verdad de la función lógica OR, la sección central de la función lógica
AND y la sección derecha de la función lógica XOR. I1se refiere al valor una de las entradas e I2se refiere al valor de
la segunda entrada.
Como se describió en la sección anterior, una crítica que se hizo a las redes neuronales con dos
capas y con unidades binarias como el perceptron de Rosenblatt (1958) es que no podían realizar tareas
simples como verificar la función lógica XOR (Minsky & Papert, 1969). La tabla de verdad de la función
lógica XOR se muestra en la sección derecha de la Tabla 1. Como puede verificar el lector, los cambios en
el valor del umbral no son suficientes para verificar esta función lógica que solamente cambia de estado de
0 a 1 cuando se activa una de las unidades de entrada pero no las dos. Es otras palabras, la red no debe
responder cuando ambas unidades de entradas están en 0 ó cuando ambas unidades de entrada están en 1.
Una forma de solucionar el problema consistió en añadir una capa intermedia u oculta entre las
unidades de entrada y las unidades de salida como se muestra en la Figura 4. En las redes más completas
se añaden también unidades de sesgo en las capas intermedia y de salida, que permiten mantener una
constante en la interacción de las unidades de entrada y de salida.
Con fines didácticos en la Figura 4 los pesos se numeraron del 1 al 9. El valor de activación de las
unidades de entrada I1 e I2, en este primer ejemplo, es 0 y 1, respectivamente. El valor de activación del
sesgo siempre es 1. Los pesos tendrán los valores iniciales descritos en la Tabla 2 con el propósito de
probar la función lógica XOR. El valor inicial de los pesos cambia una vez que se integran las reglas de
aprendizaje. Por el momento, estos pesos se mantendrán constantes en este paso.
Ref.: Conductual, 2014, 2, 1, 23-43
ISSN: 2340-0242
31
Conductual, International Journal of Interbehaviorism and Behavior Analysis
Escobar, R.
Figura 4. Red neuronal con una capa de entrada con dos unidades I 1 e I2, una capa oculta con dos unidades H1 y H2
y una capa de salida con una unidad O1. Las unidades de sesgo se muestran como B1 y B2. Los pesos entre las
conexiones (w) están marcados con flechas y están numerados del 1 al 9. Los valores de activación inicial se
muestran en la parte izquierda del diagrama.
Tabla 2: Valores de los pesos.
w
1
2
3
4
5
6
7
8
9
valor
10
10
-5
5
-6
-3
-6
6
-3
conexión
H 1 - O1
H 2 - O1
B 2 - O1
I1 - H1
I2 - H1
B1 - H1
I1 - H2
I2 - H2
B1 - H2
Nota. Los pesos corresponden a las conexiones descritas en la Figura 4 y están ajustados para probar la función
lógica XOR (los valores fueron tomados de Heaton [2011]).
El primer paso es calcular el valor de activación de la unidad H 1.
Dado que:
El paso se repite para calcular el valor de activación de la unidad H 2.
Para calcular el valor de activación del output se toman ahora los valores de activación de H 1, H2 y
B2.
Ref.: Conductual, 2014, 2, 1, 23-43
ISSN: 2340-0242
32
Conductual, Revista Internacional de Interconductismo y Análisis de Conducta
Redes neuronales, procesos cognoscitivos y análisis de conducta
El valor de activación de la unidad de salida es cercano a 1 y se considera como un cambio de
estado de 0 a 1. Es posible repetir los pasos para calcular el valor de activación de la unidad de salida
cuando el valor de activación de las unidades de entrada varía. En estos casos únicamente se debe
reemplazar el valor de activación de I1 y de I2. Los pesos y el valor de activación del sesgo (1) se mantienen
constantes como se mencionó anteriormente. Con las diferentes combinaciones se producen los
resultados que se muestran en la Tabla 3. Nótese cómo esta tabla muestra que la salida de la red cumple
con los criterios de verificación de la función lógica XOR que no podía verificarse con las redes binarias
de dos capas.
Regla de aprendizaje
Las redes neuronales comúnmente se clasifican en términos de sus algoritmos de entrenamiento y
éstas pueden ser supervisadas o no supervisadas. Las redes supervisadas son las redes más comunes para
resolver problemas. El entrenamiento consiste en generar diferentes pesos asociados con diferentes
valores de activación de las unidades de salida y compararlos con una ejecución ideal (estimación del
error). Conforme a una regla de aprendizaje los pesos se ajustan y se determina nuevamente el error que
trata de disminuirse.
Las redes neuronales no supervisadas consisten en presentar diferentes patrones de entrenamiento
y observar cómo la red cambia a partir de la experiencia pero la ejecución no se compara con una
ejecución ideal. Las aplicaciones de las redes neuronales al modelamiento de procesos de aprendizaje
ejemplifican este tipo de redes a pesar de que estas redes se usan infrecuentemente en otros campos. En
esta sección se mostrará la diferencia entre estos dos tipos de redes.
Una forma común de tratar de disminuir el error en las redes neuronales es usar la técnica
conocida como descenso de gradiente que usa la regla de retro propagación. Aunque existen otras técnicas
(e.g., gradiente conjugado, Levenberg-Marquardt, algoritmos genéticos) éstas no se explicarán en el
presente trabajo.
Para calcular el error deben compararse los valores de activación ideales (i) con los valores
obtenidos (o) que genera la red. Por ejemplo, usando la tabla de verdad de la función lógica XOR se
tienen cuatro resultados ideales (i1 – i4) que resultan de combinar los valores de activación de las dos
unidades de entrada. A partir de las diferencias entre este resultado ideal y el valor de activación obtenido
en la neurona de salida (o1 – o4) se calcula el error (E). Pueden usarse diferentes procedimientos, pero el
procedimiento más común es el cálculo del error cuadrado medio (MSE) que está dado por la fórmula:
El siguiente paso es calcular el gradiente que se refiere al error individual para cada uno de los
pesos en la red neuronal. Este gradiente se calcula con la derivada de la función sigmoidal descrita en la
sección anterior. En la Figura 5 se muestra una red neuronal con la misma estructura que se usó en el
ejemplo anterior pero con diferentes pesos y valores de activación.
En la Figura 5, out significa el valor de activación, sum significa la sumatoria del producto de los
pesos y el valor de activación. Los pesos (w) al inicio del entrenamiento de la red se establecen
arbitrariamente y pueden tener cualquier valor. El gradiente se calcula para cada unidad de manera
Ref.: Conductual, 2014, 2, 1, 23-43
ISSN: 2340-0242
33
Conductual, International Journal of Interbehaviorism and Behavior Analysis
Escobar, R.
individual. En el ejemplo, dada una combinación de inputs de 1 y 0, quisiéramos tener en la neurona de
salida un valor de 1 pero el valor es de 0.75. Es decir, es necesario ajustar el valor de los pesos y para esto
se utiliza la regla delta.
Figura 5. Red neuronal descrita en la Figura 4 con pesos establecidos arbitrariamente (los valores fueron tomados de
Heaton [2011])
El primer paso consiste en calcular el gradiente en la neurona de salida. Primero se calcula el error
por medio de la diferencia entre la salida obtenida y la salida ideal, E = (o1-i1) = -0.25, el valor de delta de
la capa se calcula con:
Donde
= sumatoria del producto de los valores de activación y el peso en cada una de las
conexiones con la unidad. E es igual al error en la salida. La primer derivada de la función sigmoidal de
resulta en delta. La primera derivada de la función sigmoidal es igual a:
Donde x es el valor de activación con la función sigmoidal. Siguiendo con el ejemplo, el valor
delta de la capa estaría dado por:
Si el error alcanza un valor de 0, el valor de delta también sería de 0. En la siguiente capa (oculta)
el valor delta se calcula con:
Donde wk1i se refiere a la sumatoria de los pesos que van de la unidad en la capa oculta a la capa
de salida. δi se refiere al valor delta de la capa anterior. Con este ejemplo puede notarse cómo se realiza la
retro propagación. En el ejemplo sólo hay un peso (w1).
De la misma forma se calcula el valor delta de la siguiente unidad en la capa oculta.
Ref.: Conductual, 2014, 2, 1, 23-43
ISSN: 2340-0242
34
Conductual, Revista Internacional de Interconductismo y Análisis de Conducta
Redes neuronales, procesos cognoscitivos y análisis de conducta
Con los valores de delta puede calcularse fácilmente el gradiente entre pares de unidades con la
derivada parcial del error (e.g., entre H1 y O1).
Donde δi es el valor delta calculado para la capa de salida, OK se refiere al valor de output en H1
en el diagrama. En este caso el gradiente entre H1 y O1 = (0.046) (0.37) = 0.017. El gradiente entre H2 y
O1 = (0.046) (0.74) = 0.034. El gradiente entre I1 y H1 = -0023 y entre I2 y H2 = 0. El número de
gradientes es igual al número de pesos en la red.
La regla de aprendizaje de retro propagación es:
Donde ∆wt se refiere al cambio en el peso t y se utiliza para representar las repeticiones o
iteraciones (t es la iteración actual, t-1 es la iteración anterior). es una constante que se conoce como tasa
de aprendizaje que cumple con 0 < < 1 y determina la magnitud del cambio en los pesos.
es otra
constante que se conoce como momentum y produce un valor mínimo de cambio constante.
Si
= 0.7 y
= 0.3, de acuerdo con el gradiente H1-O1.
Este valor se suma al peso anterior para producir un nuevo peso
Realizar los cálculos para cambiar cada uno de los pesos es una tarea repetitiva para la cual se
utilizan programas de computadora. Estos programas realizan las tareas descritas en este trabajo en un
número determinado de iteraciones. Una vez que el error es = 0, los pesos dejan de ajustarse.
Modelos de redes y aprendizaje
Una vez que se entiende el funcionamiento de las redes neuronales, puede entenderse con relativa
facilidad como algunos modelos de redes han tratado de simular procesos de aprendizaje. En los modelos
de redes de aprendizaje se han utilizado generalmente redes con entrenamiento no supervisado. En este
caso los pesos de la red se ajustan a partir de una regla de aprendizaje pero no se comparan con una
ejecución ideal. Una regla de aprendizaje usada comúnmente se conoce como regla de Hebb y consiste en:
Donde wt+1 se refiere al peso de la conexión en la siguiente iteración, w t se refiere al peso en la
iteración actual y O se refiere al valor de activación. Como puede observarse en la regla de Hebb, el peso
cambia únicamente cuando el valor de activación de dos unidades (i y k) es mayor que 0. Congruente con
la ley de Hebb, cuando dos neuronas disparan juntas se fortalece su conexión (cf. Hebb, 1949).
Ref.: Conductual, 2014, 2, 1, 23-43
ISSN: 2340-0242
35
Conductual, International Journal of Interbehaviorism and Behavior Analysis
Escobar, R.
Caudill y Butler (1992) aplicaron la regla de Hebb en un modelo simple de aprendizaje
respondiente. Por ejemplo, en una red con dos unidades de entrada y una de salida. El peso de una de las
unidades de entrada (I1) puede ser suficiente para que, al combinarse con un valor de activación positivo
resulte en que el valor de activación de la neurona de salida (O) sobrepase el umbral. En cambio el peso de
la otra unidad de entrada (I2) puede especificarse de tal forma que al combinarse con la activación positiva
de esta unidad, el resultado sea insuficiente para que el valor de activación de la neurona de salida alcance
el umbral. Ahora, en un momento dado, debido a que la unidad de entrada I1 produce un valor de
activación alto en O. Este valor de activación de O puede cambiar el peso de su conexión con I 1 siempre
y cuando el valor de activación de I1 sea positivo. En términos psicológicos, la unidad de entrada I 1 es
análoga a un estímulo condicional (EC), la unidad I2 es análoga a un estímulo incondicional (EI), y la
unidad O es análoga a la respuesta que originalmente sólo ocurre cuando se presenta (se activa) el EI y
posteriormente puede ocurrir sólo cuando se presenta el EC.
Una modificación al modelo descrito de Caudill y Butler (1992) permite no sólo simular que la
asociación entre el EC y el EI produce condicionamiento sino también algunos fenómenos del
condicionamiento respondiente como el bloqueo y ensombrecimiento que no pueden modelarse con la
regla de Hebb. Sutton y Barto (1981) describieron una regla de aprendizaje basada en el modelo de
Rescorla y Wagner (1972). De acuerdo con esta regla:
Donde yt es igual al máximo valor de activación de la unidad que simula el EI. ∑ wx t-1 es igual a la
suma de todos los pesos de las conexiones para todas las unidades de entrada x y pesos w en la iteración
previa (t-1). xt-1 permite que se cumpla la regla de Hebb. De acuerdo con el modelo de Sutton y Barto, los
pesos de la unidades que simulan el EC incrementan si la diferencia entre el valor de activación máximo de
la unidad que simula al EI es mayor que 0. Siguiendo con la lógica del modelo de Rescorla y Wagner, el
peso, que tiene un límite superior, se distribuye entre las unidades de entrada que simulan los ECs.
Hutchison (1984), y Hutchison y Stephens (1992) usaron una variación del modelo de Sutton y
Barto (1981) que permite simular algunos elementos del condicionamiento operante. En este modelo la
regla de aprendizaje es:
En este modelo w representa el peso de la conexión entre un estímulo y una respuesta. C v
representa el valor de la consecuencia de una respuesta. Este modelo es reminiscente de la ley del efecto
tal y como la enunciara Thorndike debido a que simula que si el valor de la consecuencia es mayor que el
valor de la respuesta (una forma de establecer el valor reforzante) se fortalece la conexión entre un
estímulo y la respuesta que le sigue.
La estructura de las redes neuronales que contienen tres capas, lógicamente permite simular tanto
el control de estímulos antecedentes a la conducta como el efecto de las consecuencias sobre la misma
conducta. Esta característica la explotaron Donahoe, Burgos, y Palmer (1993) en uno de los modelos más
representativos de la interacción entre los modelos conexionistas y el análisis de la conducta (véase
también, Donahoe & Palmer, 1994; Burgos, 2000, 2001). La parte central del modelo de Donahoe et al. es
que la estructura de la red está inspirada en el conocimiento actual sobre el papel del área ventral
tegmental (vta) que se ha mostrado que está relacionada con el efecto del reforzamiento (Hoebel, 1988) y
las células del hipocampo (ca1) que están relacionadas con la asociación entre la presentación de estímulos
y las respuestas subsecuentes. La estructura del modelo se muestra en la Figura 6.
Ref.: Conductual, 2014, 2, 1, 23-43
ISSN: 2340-0242
36
Conductual, Revista Internacional de Interconductismo y Análisis de Conducta
Redes neuronales, procesos cognoscitivos y análisis de conducta
Figura 6. Red neuronal descrita por Donahoe et al. (2003). En este diagrama R representa una respuesta. RC / RI
representa una respuesta condicional e incondicional, vta representa el área ventral tegmental y ca1 representa a las
células del hipocampo
Entrada
Capas ocultas
Salida
R
Conducta
Ambiente
RC / RI
ca1
S*
vta
En el modelo, S* representa un reforzador. Una función del reforzador es como un EI que
controla las respuestas que le siguen (RC/RI) de manera directa. Cualquier estímulo de entrada que se
active junto con el S* aumentará el peso de la conexión entre dicho estímulo y las respuestas subsecuentes.
El efecto reforzante del S* está mediado por el vta que aumenta el peso de conexiones entre la segunda
capa oculta y las respuestas subsecuentes. El valor que se asigna a las ca1 funciona como el sesgo
convencional que se mencionó en la sección anterior y cambia el peso de las conexiones de la primera
capa oculta con la segunda capa oculta. Una característica importante del modelo es que únicamente
distingue entre condicionamiento respondiente y operante en términos de si el efecto del reforzador se
observa antes o después de la presentación de éste. Este modelo es uno de los que permite mostrar más
claramente que la red neuronal puede servir para modelar procesos de condicionamiento operante y
permite simular el funcionamiento del sistema nervioso central.
Conclusiones
A pesar de que algunos autores dentro de la tradición del análisis de la conducta han criticado las
simulaciones computacionales de la conducta (e.g., Epstein, 1984), estas críticas se han dirigido a los
modelos simbólicos y en especial a su aplicación a la simulación de procesos cognoscitivos. Por ejemplo
Epstein (1999) notó que simular procesos cognoscitivos es incorrecto en varios aspectos. Por un lado, la
topografía de la “conducta” en un modelo está determinada por la salida del modelo y aunque ésta podría
ser similar a la topografía de la conducta humana, la función de la conducta es claramente diferente.
Mientras que la “conducta” de un modelo está basada exclusivamente en reglas que se ajustan a las
instrucciones del operador, la conducta humana está controlada tanto por reglas como por contingencias
de reforzamiento y de castigo. Algunas otras críticas fueron que los modelos simbólicos de procesos
cognoscitivos tienen poco en común con el funcionamiento del cerebro en los procesos cognoscitivos
humanos, que se puede generar un gran número de modelos que produzcan el mismo resultado y que los
Ref.: Conductual, 2014, 2, 1, 23-43
ISSN: 2340-0242
37
Conductual, International Journal of Interbehaviorism and Behavior Analysis
Escobar, R.
modelos de diferentes procesos cognoscitivos (e.g., atención, memoria, imaginería, lenguaje y precepción)
tienen poco en común unos con otros. En contraste, Epstein (1999) aplicó las simulaciones por
computadora de patrones conductuales para clarificar la descripción de su teoría generativa o de
creatividad que describe la ocurrencia de nuevos patrones conductuales a partir de los patrones
observados.
Aún existen relativamente pocos modelos de redes neuronales que integren principios
importantes para el análisis de la conducta como el reforzamiento y el castigo (cf. Donahoe et al. 1993).
Sin embargo, es notable que algunos de los modelos existentes provienen de tradiciones diferentes al
análisis de la conducta. Por ejemplo, Enquist y Ghirlanda (2005), siguiendo un enfoque evolutivo,
describieron como conceptos como motivación, entendida como un estado interno o externo al
organismo, reforzamiento y castigo (descrito como reforzamiento negativo) pueden integrarse a los
modelos de redes neuronales para simular conducta animal. En un ejemplo simple descrito por los
autores, la motivación puede considerarse como un estado que interactúa con la disponibilidad de
recursos. En este caso, la “motivación para comer” (privación de comida) puede ser alta o nula (valores de
activación en la capa de entrada del modelo de 1 y 0 respectivamente). Al mismo tiempo el alimento puede
estar disponible o no disponible (valor de activación de 1 y 0, respectivamente). Con estos valores, y
siguiendo la lógica de modelos como el perceptron, podría simularse la ocurrencia de conducta de
alimentación sólo si los valores de activación de ambos nodos en la capa de entrada son iguales a 1. Para
Enquist y Ghirlanda, el reforzamiento es parte integral de los modelos de redes con aprendizaje
supervisado pero, de acuerdo con los autores, únicamente cuando el valor de activación de la capa de
salida se compara con un nivel de umbral que permita determinar si ocurrió o no una “respuesta”. El
ajuste de los pesos, en este caso, podría verse como análogo al efecto del reforzamiento. Aunque este
modelo es uno de los más simples descritos por Enquist y Ghirlanda, es útil para mostrar cómo pueden
integrarse conceptos importantes para el análisis de la conducta en los modelos de redes neuronales. En
este ejemplo en particular sería importante determinar cómo podría sustituirse el concepto de motivación,
entendida como estado, por el concepto de operación motivacional, de establecimiento o de abolición, y
modular los efectos del reforzamiento y el castigo (e.g., Michael, 2004).
Las redes neuronales pueden ofrecer una aproximación para simular algunos fenómenos
conductuales pero no son la única opción. En el área conocida como aprendizaje por reforzamiento
dentro del campo del aprendizaje de máquinas, se ha usado el principio de reforzamiento para entrenar
diferentes funciones en modelos por computadora. En algunas aplicaciones aisladas del uso de aprendizaje
por reforzamiento, algunos investigadores han usado algunos principios del condicionamiento operante en
el diseño de modelos usados en robótica. Por ejemplo, Touretzky y Saksida (1997) integraron el fenómeno
de la formación de cadenas conductuales para moldear nuevas respuestas en robots llamados Skinnerbots.
Hutchison (2012) ha desarrollado algunos algoritmos que permiten el establecimiento de nuevas
conductas en robots que no fueron entrenadas directamente (véase también Maki & Abunawass, 1991).
Es notable que en el campo del aprendizaje por reforzamiento los autores se refieren al efecto de
las consecuencias como recompensas positivas y recompensas negativas (e.g., Sutton & Barto, 1988) en
lugar de los conceptos del análisis de la conducta de reforzamiento positivo y castigo positivo. Desde
luego que la distinción entre contingencias positivas y negativas no es siquiera considerada. Esto
ejemplifica el poco contacto que tiene el análisis de la conducta con el campo del aprendizaje por
reforzamiento. Aunque es probable que los analistas de la conducta puedan hacer contribuciones
importantes al desarrollo de las redes neuronales y el aprendizaje por reforzamiento, este tipo de
interacción entre los dos campos es limitada. Por ejemplo, uno de los problemas centrales en este campo
es la asignación de crédito que se refiere a que es difícil determinar cuál y cómo una respuesta se asocia
con una consecuencia que puede estar demorada. En el campo del aprendizaje por reforzamiento se han
Ref.: Conductual, 2014, 2, 1, 23-43
ISSN: 2340-0242
38
Conductual, Revista Internacional de Interconductismo y Análisis de Conducta
Redes neuronales, procesos cognoscitivos y análisis de conducta
usado modelos de decisión Markovianos para solucionar este problema (Sutton & Barto). Una solución
aparentemente más simple fue la propuesta por Touretzky y Saksida (1997) que consiste en integrar el
concepto del encadenamiento y que, de hecho, está basada en hallazgos en análisis de la conducta.
A pesar de que el concepto de red neuronal tiene más de 70 años, su aplicación en psicología y,
particularmente, en el análisis de la conducta sigue siendo escasa. Este año se habrán cumplido 21 años de
la publicación del modelo de Donahoe et al. (1993) que prometía la expansión del desarrollo de modelos
de redes neuronales en el análisis de la conducta. En el año 2000 un número especial dedicado a los
avances en el tema de las redes neuronales en análisis de la conducta fue publicado en la Revista Mexicana de
Análisis de la Conducta. En dicho número los trabajos de Burgos (2000) y de Potter y Wilson (2000)
describieron algunos modelos desarrollados en el análisis de la conducta y en el campo del aprendizaje
asociativo basados en redes neuronales. A pesar de que, como Potter y Wilson notaron, los avances en las
computadoras parecían favorecer el desarrollo de nuevos modelos de redes neuronales, éstos no han
generado las contribuciones esperadas. Una explicación es que aunque existen numerosos manuales sobre
el funcionamiento de las redes neuronales, éstos están dirigidos a especialistas en programación o en
ingeniería y no a especialistas en comportamiento. Se espera que esta introducción a las redes neuronales
más comunes que usan funciones de activación sigmoidales y reglas de aprendizaje de retro propagación
sirva para estimular la aplicación de las redes a diferentes problemas en análisis de la conducta y en
psicología en general. Por ejemplo, además de la simulación de procesos conductuales, otra posible
aplicación de las redes neuronales puede ser el diseñar procedimientos para moldear conducta de un
manera similar a como Platt (1973) y Galbicka (1994) han descrito la aplicación de programas de
percentiles. Las redes neuronales bien podrían usarse para reconocer la respuesta a reforzar y hacer más
restrictivo el criterio en las iteraciones siguientes.
Los modelos de redes neuronales pueden clasificarse dentro de lo que Skinner (1974) describió
como el análisis de lo que ocurre dentro del organismo y que puede ayudarnos a “llenar los espacios” en
las relaciones funcionales entre el ambiente y la conducta. De acuerdo con Skinner, los descubrimientos en
fisiología no invalidan las leyes de la ciencia de la conducta sino que eventualmente nos permitirán tener
una descripción más completa de la conducta. Aunque aún queda por resolverse el problema de si los
modelos de redes neuronales realmente simulan la actividad del sistema nervioso o si son descripciones
puramente conceptuales, la noción de los modelos conexionistas puede ayudar a entender fenómenos que
tradicionalmente se estudian en la psicología cognoscitiva (Donahoe & Palmer, 1994). El ejemplo más
directo es el caso de la “memoria” que conforme a los modelos de redes puede entenderse únicamente
como el resultado del funcionamiento completo de la red, lo cual es incongruente con la metáfora del
almacenamiento y la recuperación de la información que ha dominado en la psicología cognoscitiva. Es
notable que Skinner (1974; véase también Epstein, 1984) ya había descrito que la metáfora del
almacenamiento y la recuperación podría reemplazarse con la noción de que los organismos son
cambiados por las contingencias. Epstein hizo claro este argumento en la siguiente descripción:
Un estudiante expuesto a una fotografía en un experimento de imaginería el lunes, se comportará
de manera diferente a fotografías similares el martes. ¿Cómo podemos explicar tal cambio sin
apelar a las metáforas de la representación y el almacenamiento? … Digamos que cuando una
neurona (o grupo de neuronas…) en el cerebro de una rata (o de un estudiante) está en un cierto
estado –llamémoslo estado activo-, la rata tiende a flexionar la pata cuando se expone a una luz
roja. Digamos también que el estado de la célula es normalmente inactivo pero lo cambiamos a
activo al parear la luz roja con la aplicación de un choque eléctrico en la pata de la rata… con esta
operación hemos cambiado a la rata de tal forma que en el futuro cuando se exponga a una luz
roja, flexionará la pata. Nótese que cuando la rata cambia no contiene una regla acerca de la nueva
relación… las células activas [neuronas o grupos de neuronas] no son análogas a una instrucción
Ref.: Conductual, 2014, 2, 1, 23-43
ISSN: 2340-0242
39
Conductual, International Journal of Interbehaviorism and Behavior Analysis
Escobar, R.
en una computadora; en el mejor de los casos, podrían realizar una función similar una marca en
la memoria de la computadora (p. 52-53, traducción del autor).
El funcionamiento de las redes neuronales ofrece apoyo a la noción de Skinner (1974) y de
Epstein (1984) y provee un modelo que podría ser útil para integrar la conceptualización de los procesos
cognoscitivos en análisis de la conducta con hallazgos en las neurociencias. La integración de los
principios del análisis de la conducta con disciplinas como el aprendizaje de máquinas y con las
neurociencias cognoscitivas podría no sólo ayudar a aumentar la visibilidad y las contribuciones del análisis
de la conducta sino que, como sugirió Skinner, podría incluso ayudarnos a hacer más completa la
descripción de la conducta.
Referencias
Anderson, J. A. (1988). General Introduction (pp. xiii-xxi). En J. A. Anderson and E. Rosenfeld (Eds.).
Neurocomputing, Foundations of Research. Cambridge, MA: MIT Press.
Burgos, J. E. (2000). Superstition in artificial neural networks: A case study for selectionists approaches to
reinforcement. Revista Mexicana de Análisis de la Conducta, 26, 159-190.
Burgos, J. E. (2001). A neural-network interpretation of selection in learning and behavior. Behavioral and
Brain Sciences, 24, 531-532.
Burgos, J. E. (2002). Herencia genética, sistema nervioso y conducta. En E. Ribes (Ed.), Psicología del
Aprendizaje (pp. 43-78). México: Manual Moderno
Caudill, M., & Butler, B. (1992). Understanding neural networks. Cambridge, MA: MIT Press.
Donahoe, J. W., Burgos, J. E., & Palmer, D. C. (1993). A selectionist approach to reinforcement. Journal of
the Experimental Analysis of Behavior, 60, 17–40.
Donahoe, J. W., & Palmer, D. C. (1994). Learning and complex behavior: Boston, MA: Allyn & Bacon.
Enquist, M., & Ghirlanda, S. Neural networks and animal behavior. Princeton, NJ: Princeton University Press.
Epstein, R. (1984). Simulation research in the analysis of behavior. Behaviorism, 12, 41-59.
Epstein, R. (1999). Generativity theory. En M. Runco (Ed.). Encyclopedia of creativity (pp.759-766). New
York: Academic Press.
Galbicka G. (1994). Shaping in the 21st century: Moving percentile schedules into applied settings. Journal
of Applied Behavior Analysis, 27, 739–760.
Gazzaniga, M. S. (2008). Human: The science behind what makes us unique. New York: Harper Collins.
Heaton, J. (2011). Introduction to the math of neural networks. Chesterfield MO: Heaton Research.
Hebb, D. O. (1949). The organization of behavior. New York: Wiley.
Hinton, G. E., J. L. McClelland, and D. E. Rumelhart. (1986). Distributed representations. En D. E.
Rumelhart and J. L. McClelland (Eds.). Parallel Distributed Processing: Explorations in the Microstructure
of Cognition (pp. 77-109). Cambridge, MA: MIT Press,
Ref.: Conductual, 2014, 2, 1, 23-43
ISSN: 2340-0242
40
Conductual, Revista Internacional de Interconductismo y Análisis de Conducta
Redes neuronales, procesos cognoscitivos y análisis de conducta
Hoebel, B. G. (1988). Neuroscience and motivation: Pathways and peptides that define motivational
systems. En R. C. Atkinson, R. J. Herrnstein, G. Lindzey, & R. D. Luce (Eds.). Stevens' handbook of
experimental psychology: Vol. 1. Perception and motivation (pp. 547-625). New York: Wiley.
Hutchison, W. R. (1984, December). Cognitive vs. behavioral approaches to artificial intelligence.
Newsletter for the Behavioral Artificial Intelligence Network, 1, 5-20.
Hutchison, W. R. (2012). The Central Role for Behavior Analysis in Modern Robotics, and Vice Versa.
The Behavior Analyst, 35, 29–35.
Hutchison, W. R., & Stephens, K. R. (1992). Behavioral Personal Digital Assistants: The Seventh
Generation of Computing. The Behavior Analyst, 10, 149-156.
Kehoe, E. J. (1989). Connectionist models of conditioning: A tutorial. Journal of the Experimental Analysis of
Behavior, 52, 427-440.
Kelley, T. D. (2003). Symbolic and sub-symbolic representations in computational models of human
cognition: What can be learned from biology? Theory & Psychology, 13, 847–860
Kosslyn, S. M. (1980). Image and Mind. Cambridge, MA: Harvard University Press.
Lewis, R. L. (1999). Cognitive modeling, symbolic. En Wilson, R. and Keil, F. (Eds.). The MIT Encyclopedia
of the Cognitive Sciences. Cambridge, MA: MIT Press.
Maki, W. S., & Abunawass, A. M. (1991). A connectionist approach to conditional discriminations:
Learning, short-term memory, and attention. En M. L. Commons, S. Grossberg, J. E. R. and
Staddon. (Eds.). Neural Network Models of Conditioning and Action (pp. 241-278). Hillsdale, NJ:
Lawrence Erlbaum Associates.
McCulloch, W. S., & Pitts, W. (1943). A logical calculus of the ideas immanent in nervous activity. Bulletin
of Mathematical Biophysics, 5, 115–133.
Michael, J. L. (2004). Concepts and principles of behavior analysis. Kalamazoo: MI: Association for Behavior
Analysis International.
Minsky, M. L., & Papert, S. (1969). Perceptrons: An introduction to computational geometry. Cambridge, MA: MIT
Press.
Mitchell, T. M. (1997). Machine Learning. New York: McGraw Hill.
Olson, M. H., & Hergenhahn, B. R. (2009). An introduction to theories of learning (8a Ed.). Upper Saddle River,
NJ: Pearson.
Paivio, A. (1979). Imagery and Verbal Processes. Hillsdale, NJ: Lawrence Erlbaum Associates.
Palmer, D. C., & Donahoe, J. W. (1992). Essentialism and selection in cognitive science and behavior
analysis. American Psychologist, 47, 1344-1358.
Pinker, S. (1997). How the mind works. New York, NY: Norton & company.
Potter, B., & Wilson, M. (2000). Behavior analysis and artificial neural networks. Revista Mexicana de
Análisis de la Conducta, 26, 141-158.
Ref.: Conductual, 2014, 2, 1, 23-43
ISSN: 2340-0242
41
Conductual, International Journal of Interbehaviorism and Behavior Analysis
Escobar, R.
Platt, J. R. (1973). Percentile reinforcement: Paradigms for experimental analysis of response shaping. En:
G. H. Bower. (Editor). The psychology of learning and motivation: Vol. 7. Advances in theory and research
(pp. 271-296). New York: Academic Press.
Putnam, H. (1961, December). Brains and behavior. Trabajo presentado en la American Association for
the Advancement of Science. Reimpreso en N. Block (Ed.). (1980). Readings in philosophy of
psychology (pp. 24-36). Cambridge, MA: Harvard University Press.
Pylyshyn, Z. W. (1973). What the Mind's Eye Tells the Mind's Brain: A Critique of Mental Imagery.
Psychological Bulletin, 80, 1–25.
Rescorla, R. A. & Wagner, A. R. (1972). A theory of Pavlovian conditioning: Variations in the
effectiveness of reinforcement and nonreinforcement. En A. H. Black & W. F. Prokasy (Eds.),
Classical conditioning II: Current research and theory (pp. 64-99). New York: Appleton-Century-Crofts.
Rosenblatt, F. (1958). The perceptron: A probabilistic method for information storage and organization in
the brain. Psychological Review, 65, 386–408.
Rumelhart, D. E., & McClelland, J. L. (1986). Parallel distributed processing: Explorations in the microstructure of
cognition: Vol. 1. Foundations. Cambridge, MA: MIT Press.
Rumelhart, D. E., Hinton, G. E., & Williams, R.J. (1986). Learning internal representations by error
propagation. En D. E. Rumelhart, J. L. McClelland and The PDP Research Group, Parallel
distributed processing: Explorations in the microstructure of cognition. Volume1: Foundations (pp. 318–362).
Cambridge, MA: MIT Press.
Skinner, B. F. (1950). Are theories of learning necessary? Psychological Review, 57, 193–216.
Skinner, B. F. (1974). About behaviorism. New York: Knopf.
Skinner, B. F. (1977). Why I am not a cognitive psychologist. Behaviorism, 5, 1–10.
Skinner, B. F. (1988). Responses to commentaries. En A. C. Catania & S. Harnad (Eds.), The Selection of
Behavior: The Operant Behaviorism of B. F. Skinner. New York: Cambridge University Press.
Spratling, M. W., & Johnson, M. H. (2004) .Neural Coding Strategies and Mechanisms of Competition.
Cognitive Systems Research, 5, 93–117.
Sutton, R. S., & Barto, A. G. (1981). Toward a modern theory of adaptive networks: Expectation and
prediction. Psychological Review, 88, 135-171.
Sutton, R. S., & Barto, A. G. (1988). Reinforcement Learning: An Introduction. Cambridge, MA: MIT Press.
Touretzky, D.S., & Saksida, L. M. (1997) Operant conditioning in Skinnerbots. Adaptive Behavior 5, 219247.
Turing, A. (1936). On Computable Numbers, with an Application to the Entscheidungsproblem.
Proceedings of the London Mathematical Society 42, 230-265.
Wegner, D. (2005). Who is the controller of controlled processes? En R.R. Hassin, J. S Uleman, J A.
Bargh (Eds.). The new unconscious (pp. 19-36). New York: Oxford University Press.
Ref.: Conductual, 2014, 2, 1, 23-43
ISSN: 2340-0242
42
Conductual, Revista Internacional de Interconductismo y Análisis de Conducta
Redes neuronales, procesos cognoscitivos y análisis de conducta
Widrow, B., & Hoff, M. E. (1960). Adaptive switching circuits. 1960 IRE WESCON Convention Record,
New York IRE, 4, pp. 96–104.
Ref.: Conductual, 2014, 2, 1, 23-43
ISSN: 2340-0242
43
Conductual, International Journal of Interbehaviorism and Behavior Analysis
Alonso-Orozco, I., Martínez-Sánchez, H. y Bachá-Méndez, G.
Adquisición y extinción de respuestas discretas vs secuencias de respuestas. 1, 2
Ixel Alonso Orozco3
Héctor Martínez Sánchez
Instituto de Neurociencias.
Universidad de Guadalajara. México
Gustavo Bachá Méndez
Facultad de Psicología
Universidad Nacional Autónoma de México
Resumen
El estudio evaluó las diferencias en las curvas de adquisición y de extinción en ratas. Los animales fueron
entrenados para obtener alimento mediante una respuesta discreta en una palanca o la ejecución de una
secuencia de dos respuestas. Un grupo de cuatro ratas trabajó en un programa de razón fija dos (RF2) y
otro grupo de seis animales realizando una secuencia de dos respuestas a dos operandos. Las secuencias
tenían una estructura heterogénea (alternar entre los dos operandos, izquierda-derecha o derechaizquierda) o bien, una estructura homogénea (repetir dos respuestas sobre un operando, izquierdaizquierda o derecha-derecha). En la fase de adquisición, los animales del grupo con secuencias debieron
ejecutar una de las cuatro posibles secuencias para obtener el reforzador. En el otro grupo, las ratas
obtenían el reforzador trabajando bajo un programa de RF2. Cuando un animal obtenía mil reforzadores,
independientemente del grupo al que perteneciera se programó una condición de extinción que se
mantuvo durante 20 sesiones. Los resultados mostraron diferencias en las curvas de adquisición entre los
grupos. Las curvas de adquisición de los animales que ejecutaron secuencias heterogéneas presentaron una
asíntota menor que la ejecución de secuencias homogéneas y de aquellas del grupo RF2. Durante la fase
de extinción se observó que para el grupo RF2, la frecuencia de la respuesta llegó a niveles cercanos a cero
en menos de 10 sesiones. En esta misma fase, los grupos que ejecutaron algún tipo de secuencias,
mantuvieron una frecuencia de 20 secuencias por sesión durante las 20 sesiones que duró esta fase. Un
análisis de las secuencias no reforzadas revela algunos efectos de inducción. Los resultados son discutidos
en el contexto del uso de una unidad conductual distinta a la operante discreta utilizada de manera
tradicional y de las implicaciones de esto en el papel de la unidad conductual elegida.
Palabras clave: unidades conductuales, adquisición, extinción, secuencias de respuesta, presionar palanca, ratas
Abstract
The study evaluated the differences in acquisition and extinction´s curves in rats. A group of four animals
was trained to obtain food using a traditional response to a lever on a fixed ratio reinforcement schedule
(FR2). Another group of six rats learned to respond to a sequence of two responses using two levers. The
sequences had a heterogeneous structure (switching between the two levers left-right or right-left) or a
homogeneous (repeating two responses on the same lever left-left or right-right). In the acquisition phase,
the subjects in the sequences had to complete one of four possible sequences to obtain a reinforcer. In the
La referencia de este artículo en la Web es: http://conductual.com/content/adquisicion-y-extincion-de-respuestas-discretas-vssecuencias-de-respuestas
2 Agradecimientos: La primera parte del estudio se realizó con el apoyo de una beca para estudios de maestría otorgada por
CONACyT. La preparación final del escrito se terminó con el apoyo del proyecto PAPIIT IN-303811.
3 Correspondencia: Ixel Alonso Orozco. Calzada de Guadalupe #120 edificio 1 departamento 303 cp. 14300, colonia Tlalpan,
delegación Tlalpan. Distrito Federal, Ciudad de México. Email: [email protected]
1
Ref.: Conductual, 2014, 2, 1, 44-56
ISSN: 2340-0242
44
Conductual, Revista Internacional de Interconductismo y Análisis de Conducta
Adquisición y extinción de respuestas discretas vs secuencias de respuestas
other group, reinforcers were delivered on FR2 schedule. When an animal obtained available reinforcers
(1000 pellets), regardless of which group they belonged to, the extinction phase was introduced. This
phase lasted 20 sessions. Results showed that the acquisition curve in the group of heterogeneous
sequences produced a smaller asymptote than the homogeneous sequences group and the FR2 group.
During the extinction phase, the frequency of the response in the FR2 group reached near zero levels in
less than 10 sessions. In groups working under a sequence (either homogeneous or heterogeneous), the
response rate remained at a level close to 20 sequences per session during this phase. An analysis of
unreinforced sequences revealed induction effects, which are discussed in the context of using a
behavioral unit, different from the traditional operant response. We discuss the results and their
implications on the study of the organization of behavior.
Key words: behavioral units, acquisition, extinction, response sequences, lever pressing, rats
Cuando Skinner (1935) definió la operante como una relación de triple contingencia entre
estímulos, respuestas y consecuencias, definió a la unidad de respuesta como una clase funcional de
eventos controlados por estímulos reforzantes. Para facilitar un registro confiable de esta unidad
conductual se eligió una respuesta discreta, operacionalmente definida como el cierre de un microswitch,
como se observa en las respuestas de presionar una palanca o picar una tecla. Esta unidad de respuesta ha
sido utilizada de forma extensa, analizando el cómo se moldea, cómo cambia su frecuencia de ocurrencia,
cómo cae bajo el control de diversos estímulos y cómo se comporta bajo programas de reforzamiento y
otros arreglos experimentales (Skinner, 1938; Fester & Skinner, 1957). Sin embargo, existe la posibilidad
de definir otras unidades conductuales. Zeiler (1977) identificó tres clases de unidades conductuales: (a)
unidades formales; (b) unidades condicionables; y, (c) unidades teóricas. El primer tipo de unidad se
refiere a la clase de conducta que el experimentador establece como prerrequisito para la presentación del
reforzador, es decir, es la definición operacional de la respuesta medida en un experimento. La unidad
condicionable es lo que Skinner (1938) definió como operante. Si una conducta es la condición necesaria
para la presentación del reforzador y el reforzamiento incrementa la probabilidad de ocurrencia de esa
conducta, entonces es una unidad de respuesta condicionable. Finalmente, la unidad teórica se refiere a
unidades condicionables que nos ayudan a responder qué papel juega el reforzamiento en la organización
de la conducta y a identificar que conducta es fortalecida. Estas unidades son un poco más difíciles de
establecer ya que son inferidas como producto de la observación de la conducta más que por la
observación directa de ésta. Por ejemplo, Shimp (1979) demostró que es posible definir los Tiempos Entre
Respuestas (TERs) como una unidad que obedece a los mismos principios básicos observados con una
respuesta dirigida a un operando.
De la propuesta de Zeiler se desprende entonces que para validar la existencia y utilidad de una
unidad teórica es necesario definirla de manera formal y además demostrar empíricamente que es una
unidad condicionable. En el caso de proponer una secuencia de respuestas como la unidad conductual
(unidad teórica) se debe entonces definir de manera formal, precisando operacionalmente el orden de los
elementos (por ejemplo, presionar la palanca izquierda y luego la derecha) que será necesario para obtener
el reforzador; y de manera posterior mostrar que es una unidad condicionable. Esto último se puede
comprobar al observar cambios ordenados en su frecuencia de ocurrencia debidos a cambios
concomitantes en las contingencias programadas. Grayson y Wasserman (1979) entrenaron durante 20
días a palomas para que ejecutaran secuencias de dos respuestas a dos teclas.
Durante la primera fase, las palomas tenían que alternar sus respuestas entre dos operandos en un
orden particular, es decir, una secuencia heterogénea producía el reforzador. Al término de esta fase se
Ref.: Conductual, 2014, 2, 1, 44-56
ISSN: 2340-0242
45
Conductual, International Journal of Interbehaviorism and Behavior Analysis
Alonso-Orozco, I., Martínez-Sánchez, H. y Bachá-Méndez, G.
reforzó una secuencia diferente. Para unos sujetos la nueva secuencia continuó siendo heterogénea,
mientras que para otros cambió a una secuencia homogénea (responder dos veces consecutivas a un
mismo operando) la que producía el reforzador. Los resultados generales mostraron que en cada fase
experimental, la secuencia reforzada se ejecutó con la mayor frecuencia si era comparada con las
secuencias no reforzadas, las cuales disminuyeron su frecuencia conforme pasaron las sesiones. Otros
autores han mostrado que tales secuencias caen bajo el control de estímulos discriminativos (Wasserman,
Deich, & Cox, 1983; Reid, Chadwick, Dunham, & Millar, 2001; Reid, Nill, & Getz, 2010). Además, se ha
observado que la tasa relativa de la secuencia es igual a igual a la tasa relativa del reforzamiento asignado a
ella (Fetterman & Stubbs, 1982; Schneider & Morris, 1992; Schneider 2008; Bachá & Alonso, 2011).
Con la evidencia de que una secuencia de respuestas (como unidad teórica) es definible de manera
formal y entonces demostrar de manera empírica que es condicionable, es posible preguntarse si existe
alguna ganancia específica en el uso de una secuencia de respuestas en lugar de utilizar una sola respuesta
discreta como la de muchos de los estudios en Análisis Experimental de la Conducta. Si al comparar la
conducta de los animales ejecutando respuestas discretas versus secuencias, no se encuentran diferencias la
decisión debería ser la de utilizar la unidad más simple. Por el contrario, si la comparación resultara en
diferencias importantes, entonces el análisis de esas diferencias y su posible explicación justificaría el uso
de la nueva unidad.
Una prueba simple pero importante para realizar esta comparación sería someter a ambas
unidades a una fase de adquisición, posteriormente a una de extinción y entonces evaluar las semejanzas y
diferencias en los resultados. Existen dos trabajos colateralmente relacionados con esta prueba. Uno es el
de Schwartz (1980) y el otro es un estudio realizado por Neuringer, Kornell y Olufs (2001). En ambos
trabajos los autores reforzaron no una, sino un grupo de secuencias en una primera fase, y una vez que los
sujetos mantuvieron una frecuencia relativamente constante de respuestas introdujeron una fase de
extinción. Sin embargo, en ninguno de los dos trabajos se especificó el efecto sobre una secuencia
particular y tampoco se realizó una comparación directa con respuestas discretas. El presente trabajo tuvo
como objetivo comparar las curvas de adquisición y de extinción generadas por un grupo de animales
entrenados para responder en un programa tradicional de RF2 (respuestas discretas) con las curvas de un
segundo grupo que aprendió a ejecutar una secuencia de dos respuestas a dos operandos para obtener el
reforzador. En este último grupo, además, se registró la frecuencia de las secuencias ejecutadas pero que
no fueron reforzadas.
Método
Sujetos
Dieciséis ratas hembras de la cepa Wistar del bioterio de la Universidad de Guadalajara, con tres
meses de edad al inicio del experimento y sin experiencia en procedimientos experimentales sirvieron
como sujetos experimentales. El bioterio se mantuvo con una temperatura de 21°C +/- 1 y un ciclo de
luz/oscuridad de 12:12 horas. Todo el experimento se llevó a cabo bajo la Norma Oficial Mexicana
(NOM-062) para el cuidado y uso de los animales de laboratorio. Todos los sujetos se mantuvieron al 85%
de su peso ad libitum, dando una porción de alimento al final de cada sesión y manteniendo libre el acceso
al agua fuera de las cajas experimentales. Las condiciones experimentales fueron aprobadas por el Comité
de Ética del Instituto de Neurociencias.
Aparatos
Se utilizaron dos cámaras experimentales de condicionamiento operante para ratas Lafayette
Instrument Modelo 80003NS. En el panel frontal de las cajas a una altura de 13 cm desde el piso, se
Ref.: Conductual, 2014, 2, 1, 44-56
ISSN: 2340-0242
46
Conductual, Revista Internacional de Interconductismo y Análisis de Conducta
Adquisición y extinción de respuestas discretas vs secuencias de respuestas
encontraban dos palancas con una distancia horizontal entre ellas de 7 cm sobre cada una de las palancas
se encontraba un foco de 28 v. En la parte central del panel frontal y situado a una altura de 2 cm entre
cada una de las palancas se encontraba una abertura cuadrada de 5.5 cm por lado que funcionó como
receptáculo de pellets. Se utilizaron como reforzadores pellets de 45mg de la compañía Bioserv (Fórmula
F). Las cajas estaban conectadas a una interface (ABET modelo 81401 y 81402) y ésta a una computadora.
Con un programa elaborado en ABET Software, se controlaron las sesiones experimentales y se registraron
las respuestas en tiempo real. Cada cámara se colocó dentro de una caja sono-amortiguadora de 70 x 46 x
50 cm. En el panel posterior de la caja amortiguadora se encontraba un foco de 28 v que funcionó como
luz general.
Procedimiento
Se dividió a los sujetos en tres grupos, dos de ellos se integraron con seis sujetos cada uno y
obtenían reforzadores por ejecutar una secuencia, ya sea homogénea (HOM) o una heterogénea (HET). El
tercer grupo (RF2) estuvo compuesto por cuatro sujetos que recibieron alimento por responder a una sola
palanca en un programa de razón fija 2. Las fases experimentales por las que pasaron los animales se
muestran en la Tabla 1.
Entrenamiento de los grupos HOM y HET
En la primera sesión se moldeó la respuesta de presionar la palanca en los 12 sujetos. En las
siguientes cuatro sesiones, cada vez que los animales ejecutaban dos respuestas a cualquiera de las
palancas, se apagaban las luces sobre las palancas y la luz general, además sonaba un tono durante un
segundo y en el comedero se entregaba un pellet de 45mg (el cual funcionó como reforzador). Con la
entrega de cada reforzador se iniciaba un nuevo ensayo. Durante las siguientes ocho sesiones el reforzador
fue contingente a la alternación de las respuestas entre las palancas en cualquier dirección ya sea izquierdaderecha (ID) o derecha-izquierda (DI). Al cumplir con cualquiera de las dos combinaciones se apagaban
las luces sobre las palancas y la luz general, sonaba un tono durante un segundo y se entregaba el
reforzador. Si los animales respondían a las palancas repitiendo dos respuestas sobre alguna de ellas (por
ej., II o DD) se apagaban las luces sobre las palancas y la luz general durante diez segundos (blackout de 10
s); transcurrido este tiempo se encendían de nuevo las luces iniciándose un nuevo ensayo. Todas las
sesiones finalizaron cuando los animales cumplieron con 50 ensayos o bien cuando transcurrieron 30
minutos. Una vez que los sujetos cumplieron con los requisitos del entrenamiento, fueron asignados a uno
de dos grupos de seis sujetos cada uno.
Fase I (Adquisición)
En la Fase I a tres ratas del grupo HOM se les reforzó por ejecutar la secuencia homogénea II y a
las otras tres la secuencia homogénea DD. A tres ratas del grupo HET se les reforzaron secuencias
heterogéneas ID y a las otras tres ratas la secuencia heterogénea DI. Cada vez que las ratas ejecutaban la
secuencia de la cual era dependiente el reforzador se oscurecía totalmente la cámara experimental, sonaba
un tono durante 1 segundo y simultáneamente se entregaba el reforzador. Al pasar tres segundos se
encendían de nuevo las luces iniciando un nuevo ensayo. Si los animales emitían otra secuencia que no era
la reforzada había un blackout de 10 s, al término de este tiempo se encendían las luces e iniciaba un nuevo
ensayo. El cambio de fase se llevaba a cabo cuando los animales obtenían 1000 reforzadores.
Fase II (Extinción)
Los sujetos de ambos grupos fueron expuestos durante veinte días a condiciones de extinción. En
esta fase cada vez que los sujetos ejecutaban dos respuestas a cualquiera de los dos operandos se apagaban
Ref.: Conductual, 2014, 2, 1, 44-56
ISSN: 2340-0242
47
Conductual, International Journal of Interbehaviorism and Behavior Analysis
Alonso-Orozco, I., Martínez-Sánchez, H. y Bachá-Méndez, G.
las luces durante seis segundos e iniciaba un nuevo ensayo; ninguna combinación de respuestas fue
seguida de reforzador. Las sesiones terminaban cuando los sujetos completaban 50 ensayos o cuando
transcurrían 30 minutos.
Entrenamiento del Grupo RF2
A todos los sujetos se les moldeó la respuesta de oprimir cualquiera de las dos palancas en un
programa de razón fija uno (RF1). Durante los siguientes tres días, cada vez que las ratas respondían a una
de las palancas sonaba un tono y se apagaban, las luces sobre las palancas y la luz general, durante dos
segundos y en el comedero se entregó un pellet de 45mg. Al final de este primer entrenamiento, a dos de
los sujetos se les reforzó sólo por responder sobre la palanca izquierda y a los otros dos por responder
sobre la palanca derecha durante otros tres días. Las sesiones terminaron cuando transcurrían 30 minutos
o cuando los animales obtenían 30 reforzadores.
Fase I (Adquisición)
En esta fase se utilizó un programa RF2 para la entrega del reforzador y para finalizar la sesión se
mantuvieron los criterios de la fase de entrenamiento. Estas condiciones se conservaron hasta que cada
animal obtuvo 1000 reforzadores.
Fase II (Extinción)
Una vez cumplido el requisito de la Fase 1, durante 10 sesiones se programó una condición de
extinción en la que ninguna respuesta fue seguida de comida. Las luces sobre las palancas y la luz general
se mantuvieron encendidas durante toda la sesión. Las sesiones terminaban cuando los animales
ejecutaban 100 respuestas o después de transcurridos 30 minutos.
Tabla 1. Diseño experimental: la Fase I concluía cuando los animales obtenían 1000 reforzadores. La Fase II tuvo
una duración de 15 días para los grupos HOM y HET y 10 días para los sujetos del grupo RF2.
Grupos
Sujetos
Fase I
Adquisición
Fase II
Extinción
Homogéneas
HOM
3
3
II
DD
Heterogéneas
HET
3
3
RF2
2
2
ID
DI
EXT
RF2
D
I
Resultados
La Figura 1 muestra las curvas de adquisición (columna izquierda) y las curvas de extinción
(columna derecha) de la secuencia reforzada (grupos HOM y HET) y de la respuesta al operando
reforzado en el grupo RF2. Los datos se muestran en bloques de cinco sesiones. Las gráficas superiores
muestran el promedio de los seis sujetos a los que se les reforzó la emisión de secuencias homogéneas. En
la adquisición hubo un incremento en la secuencia a partir del segundo bloque llegando a valores cercanos
a 50 reforzadores, manteniendo este nivel los tres últimos bloques. En la fase de extinción desde las
primeras sesiones hubo un decremento de la frecuencia de la secuencia de 40 respuestas hasta llegar a un
nivel de 25 respuestas. Las gráficas intermedias muestran el promedio de los sujetos a los que se les
Ref.: Conductual, 2014, 2, 1, 44-56
ISSN: 2340-0242
48
Conductual, Revista Internacional de Interconductismo y Análisis de Conducta
Adquisición y extinción de respuestas discretas vs secuencias de respuestas
reforzó la ejecución de secuencias heterogéneas. En la fase de adquisición la ejecución incrementó hasta
un nivel de 30 respuestas y se mantuvo durante los últimos cuatro bloques. Al introducir la condición de
extinción se produjo un decremento de la frecuencia de la secuencia alcanzando un nivel cercano a 20
respuestas manteniéndose durante los 20 días de la fase. Las gráficas inferiores muestran el promedio de
los cuatro sujetos que estuvieron bajo un programa de RF2. También hubo un incremento de las
respuestas a partir del segundo bloque manteniendo una ejecución óptima durante el resto de la fase. Al
introducir las condiciones de extinción se obtuvo el típico decremento gradual de la respuesta hasta llegar
a un nivel cercano a cero.
Figura 1. Promedio y desviación estándar de la frecuencia de la secuencia o de la respuesta reforzada para cada
grupo. En la columna de la izquierda se encuentra la fase de adquisición y en la derecha la fase de extinción.
En la Figura 2 se presentan los datos de cada secuencia en bloques de cinco sesiones para el grupo
HOM. Los datos de la secuencia izquierda-izquierda (II) aparecen representados por los cuadros negros,
los de la secuencia derecha-derecha (DD) por cuadros blancos, los de la secuencia izquierda-derecha (ID)
por círculos blancos, y finalmente los datos de la secuencia heterogénea derecha-izquierda (DI) aparecen
Ref.: Conductual, 2014, 2, 1, 44-56
ISSN: 2340-0242
49
Conductual, International Journal of Interbehaviorism and Behavior Analysis
Alonso-Orozco, I., Martínez-Sánchez, H. y Bachá-Méndez, G.
con círculos negros. En la columna de la izquierda se encuentran los sujetos a los que se les reforzó la
ejecución de la secuencia II y en la columna derecha los sujetos reforzados por la emisión de la secuencia
DD. En la parte izquierda de cada una de las gráficas se muestra la fase de adquisición y en la parte
derecha la fase de extinción.
Para los seis sujetos la emisión de la secuencia homogénea reforzada incrementó durante el primer
y segundo bloque de la fase de adquisición hasta alcanzar un nivel asintótico de 50 respuestas. En esta fase
la frecuencia de las otras tres secuencias fueron disminuyendo a partir del primer bloque hasta llegar a
tener una frecuencia cercana a cero hacia el final de la fase. El criterio de condicionabilidad (obtener 1000
reforzadores), que se estableció para el cambio de fase, se alcanzó para los seis sujetos en un promedio de
24 días. La duración de la sesiones fue en promedio de cuatro minutos para todos los sujetos.
Figura 2. Frecuencia para cada secuencia en bloques de cinco sesiones para los sujetos a los que se les reforzaron
secuencias homogéneas. En la columna de la izquierda están cada uno de los sujetos a los que se reforzó la secuencia
izquierda-izquierda y en la derecha a los que se reforzó la secuencia derecha-derecha
Al introducir la fase de extinción la frecuencia de la secuencia antes reforzada fue disminuyendo a
partir del primer bloque. Sin embargo, esta frecuencia se mantuvo entre 20 y 30 respuestas en promedio a
lo largo de la fase. Para todos los sujetos, la ejecución de las otras tres secuencias incrementó desde un
nivel muy cercano a cero durante la primera fase a un promedio de 10 secuencias por sesión. Durante la
Ref.: Conductual, 2014, 2, 1, 44-56
ISSN: 2340-0242
50
Conductual, Revista Internacional de Interconductismo y Análisis de Conducta
Adquisición y extinción de respuestas discretas vs secuencias de respuestas
fase de extinción la duración de la sesión fue de 15 minutos aproximadamente, en general todos los
sujetos siempre terminaron la sesión por número de ensayos (50).
Para el grupo HET, la frecuencia promedio de la secuencias se muestra en la Figura 3 en función
de bloques de cinco sesiones. La secuencia heterogénea ID aparece representada por círculos blancos, los
datos de la secuencia DI aparecen con círculos negros, los datos de la secuencia II por cuadros negros y
los cuadros blancos representan a la secuencia DD. En la columna de la izquierda se encuentran los
sujetos a los que se les reforzó la ejecución de la secuencia ID y en la columna de la derecha están los
sujetos a los que se les reforzó la emisión de la secuencia DI.
Figura 3. Frecuencia secuencia en bloques de cinco sesiones para los sujetos a los que se les reforzaron secuencias
heterogéneas. En la columna de la izquierda están los sujetos a los que se reforzó la secuencia izquierda-derecha y en
la derecha los sujetos a los que se reforzó la secuencia derecha-izquierda
Al inicio de la fase de adquisición, para cinco de los sujetos la emisión de la frecuencia de las dos
secuencias heterogéneas ID y DI fueron similares, oscilando alrededor de 20 respuestas. A partir del
segundo bloque la frecuencia de la secuencia heterogénea reforzada incrementó, alcanzando al final de la
Ref.: Conductual, 2014, 2, 1, 44-56
ISSN: 2340-0242
51
Conductual, International Journal of Interbehaviorism and Behavior Analysis
Alonso-Orozco, I., Martínez-Sánchez, H. y Bachá-Méndez, G.
fase un promedio de 35 secuencias para todos los sujetos salvo el sujeto X13 que sus respuestas fueron 25
en promedio. En general para todos los sujetos la secuencia heterogénea a la cual se le asignó el reforzador
se ejecutó con una mayor frecuencia con respecto a la emisión de las secuencias no reforzadas. La
frecuencia de la otra secuencia heterogénea fue disminuyendo a lo largo de la fase; para cuatro de los
sujetos esta frecuencia disminuyó hasta un promedio de 10 respuestas y para los sujetos X12 y X14, el
nivel fue cercano a cero. La secuencia homogénea formada con la repetición de la respuesta más cercana
al reforzador tuvo una frecuencia promedio de 8 secuencias por sesión para cinco de los sujetos (X6, X7,
X9, X12 y X14) a lo largo de la fase. La secuencia homogénea compuesta con la repetición de la respuesta
más alejada al reforzador se mantuvo en un nivel de dos respuestas por sesión hasta el final de la fase de
adquisición.
Figura 4. Promedio de la frecuencia de las secuencias ejecutadas en la fase de extinción para los grupos (HOM y
HET). La gráfica superior muestra los sujetos reforzados por ejecutar homogéneas y la gráfica inferior los sujetos
reforzados por realizar secuencias heterogéneas
Al introducir las condiciones de extinción, la frecuencia de la secuencia antes reforzada para los
sujetos X6, X7, X9 y X14 disminuyó entre 20 y 30 respuestas y este nivel se sostuvo a lo largo de la fase.
Ref.: Conductual, 2014, 2, 1, 44-56
ISSN: 2340-0242
52
Conductual, Revista Internacional de Interconductismo y Análisis de Conducta
Adquisición y extinción de respuestas discretas vs secuencias de respuestas
Para los sujetos X12 y X13 las secuencias fueron disminuyendo hasta un promedio de cinco respuestas
hacia el final de la fase de extinción. Tanto la emisión de la frecuencia de la secuencia heterogénea no
reforzada como de la secuencia homogénea que había sido la más cercana al reforzador se mantuvieron
entre 5 y 10 respuestas a lo largo de la fase para los seis sujetos. Finalmente, para todos los sujetos la
secuencia homogénea de tener un nivel cercano a cero en la fase de adquisición incrementó su frecuencia
desde el primer bloque a un promedio de entre 15 y 20 manteniéndose en este nivel a lo largo de la fase.
La duración de la sesiones en la fase de adquisición fue en promedio de ocho minutos para los seis sujetos.
Al introducir el procedimiento de extinción el tiempo de la sesión incrementó a 20 minutos.
La Figura 4 muestra el promedio de las secuencias para los grupos HOM y HET durante los 20
días de extinción. La gráfica superior muestra los sujetos a los que se les reforzó por ejecutar alguna
secuencia homogénea. Se produjo un decremento en la frecuencia de la secuencia previamente reforzada y
un incremento en la frecuencia de las otras secuencias con respecto a la fase de adquisición, la secuencia
previamente reforzada mantuvo una frecuencia constante de alrededor de 20 respuestas. La gráfica inferior
muestra los sujetos que fueron reforzados por la emisión de secuencias heterogéneas. La ejecución de la
secuencia heterogénea previamente reforzada al inicio de la fase de extinción tuvo un decremento de
alrededor del 40% manteniendo este nivel de ejecución durante toda la fase. Se observó un incremento de
la frecuencia de la secuencia homogénea no asociada con el reforzador.
Discusión
El propósito del trabajo fue comparar la ejecución de las curvas de adquisición y extinción en
sujetos entrenados para responder en un programa de RF2, versus sujetos que tuvieron que ejecutar una
secuencia homogénea o una secuencia heterogénea. En la fase de adquisición, al cotejar las curvas de los
grupos RF2 y HOM no se encontraron diferencias en su desarrollo ni en su asíntota. Esta ausencia de
diferencias sugiere que aunque el requerimiento conductual es el mismo, responder dos veces a la misma
palanca, no resultó en un comportamiento diferenciable a pesar de haber tenido un entrenamiento disímil
para lograr la obtención del reforzador. En contraste, al comparar las mismas curvas entre los grupos de
secuencias HOM y HET, se detectó una clara diferencia en su desarrollo y en el valor máximo de las
mismas. Esta diferencia se produjo a pesar de que estos dos grupos recibieron el mismo entrenamiento.
Por lo tanto, esta discrepancia puede ser atribuida a las características de los elementos que integran estas
secuencias. Bachá et al. (2007) encontraron que la estructura particular de las secuencias influye en la
frecuencia máxima y en el número de sesiones necesarias para alcanzar el criterio de su fase de adquisición.
Estas diferencias pueden atribuirse al hecho de que durante la fase de adquisición de una secuencia
homogénea, es suficiente con discriminar en cuál de los dos operandos hay que responder dos veces para
obtener el reforzador; mientras que para secuencias heterogéneas es necesario discriminar en dónde
responder primero, y luego responder en la otra palanca.
Durante la fase de extinción, al comparar las curvas del grupo RF2 y del grupo HOM, se encontró
una diferencia importante en su desarrollo y su asíntota. Para el grupo RF2 apareció el patrón de extinción
reportado regularmente en la literatura (Fester & Skinner, 1957; Reynolds, 1973), consistente en un
incremento de la respuesta al inicio de la sesión, durante los primeros días de la fase y un posterior
decremento en el número de respuestas hasta niveles cercanos a cero. En el grupo HOM la frecuencia se
mantuvo en niveles superiores a 20 secuencias por sesión. Esta frecuencia se mantuvo estable a lo largo de
las sesiones y fue consistente para los seis sujetos del grupo. No es claro qué variable es la responsable de
este efecto, pero al comparar los resultados del grupo HOM con los del RF2, se podría sugerir que las
diferencias existentes durante el entrenamiento inicial, o las condiciones de mantenimiento (señales
diferenciales para secuencias reforzadas y no reforzadas) o ambos factores podrían estar jugando un papel
en el resultado observado. Es conveniente además, recordar que existió una diferencia de procedimiento
Ref.: Conductual, 2014, 2, 1, 44-56
ISSN: 2340-0242
53
Conductual, International Journal of Interbehaviorism and Behavior Analysis
Alonso-Orozco, I., Martínez-Sánchez, H. y Bachá-Méndez, G.
en la fase de extinción; mientras que para el grupo RF2, las respuestas no producían ningún cambio en la
iluminación de la caja, para los grupos de secuencias HOM y HET, cada dos respuestas (sin importar su
combinación) fueron seguidas de un apagón de luces de seis segundos. Aun cuando esta manipulación
representa una diferencia sustancial entre los grupos, el hecho de que la frecuencia de la secuencia se
mantuviera alrededor del 35% de su frecuencia original por 20 sesiones no es fácil de explicar. De acuerdo
con Timberlake (1984), otra posibilidad es que el nivel de respuesta observado se mantenga porque al final
de la sesión se alimentó inmediatamente a los animales en su caja habitación. Sin embargo, esto último no
podría explicar la diferencia observada entre el grupo RF2 y los grupos HOM y HET, ya que todos los
grupos recibieron el alimento de la misma forma.
Por otro lado, si se considera el total de respuestas registradas durante la operación del programa
RF, es interesante notar que el promedio de respuestas obtenido durante la fase de extinción, fue muy
similar para los tres grupos: 23.3 para el grupo HET; 25.0 para HOM y 22.8 para RF2. Sólo si se considera
que cada dos respuestas en el programa RF2 son una unidad, semejante a una secuencia HOM, entonces
el promedio para el grupo RF2 sería 11.4 por sesión. Sin embargo, debido a que los valores promedio son
influidos por valores extremos, parece más apropiado comparar la forma de las curvas. La pendiente y la
asíntota son claramente diferentes entre el grupo RF2 y los grupos HOM y HET. Estas diferencias
sugieren que existe un proceso distinto al ejecutar “respuestas discretas” (RF2) en comparación con la
ejecución de secuencias de dos respuestas a dos operandos.
El registro de ciertos cambios ordenados en la frecuencia de secuencias que no fueron reforzadas
obliga a la consideración de la participación de algún proceso de reforzamiento secundario o de inducción,
(Baum, 2012). Un ejemplo de esto, fue la confirmación de lo reportado por Bachá et al. (2007) sobre la
frecuencia de ocurrencia de una secuencia homogénea que no es reforzada y que parece depender del
reforzamiento de una secuencia heterogénea específica. Por ejemplo, cuando la secuencia reforzada era
ID, en el siguiente ensayo frecuentemente ocurrió la secuencia DD, generando así una alta frecuencia de
DD sin ser reforzada. Este efecto ha sido atribuido a la contigüidad entre la última respuesta ejecutada y la
entrega del reforzador (Grayson & Wasserman, 1979).
El estudio permitió la posibilidad de confirmar y cuantificar el incremento en la variabilidad
producida por el cambio a una condición de extinción. En este caso se observó un incremento en la
frecuencia de las secuencias que nunca fueron reforzadas. Estos datos concuerdan con los de Neuringer et
al. (2001) quienes utilizando seis ratas y reforzando secuencias de tres respuestas a tres operandos en la
fase de adquisición, reportaron un cambio en la frecuencia de las secuencias no reforzadas al introducir
condiciones de extinción.
Por último, como un dato novedoso, se encontró que después de reforzar la ejecución de una de
las secuencias heterogéneas, fue posible observar durante la fase de extinción un inusual incremento en la
frecuencia de la secuencia homogénea cuya ejecución se había mantenido con niveles cercanos a cero
durante la primera fase. Esta frecuencia se mantuvo constante durante los 20 días para todos los sujetos.
Hasta el momento no se ha encontrado en la literatura un efecto como el que aquí se reporta. Una posible
explicación podría surgir del proceso de decisión que han propuesto Bachá et al. (2007). En cada ensayo,
el animal enfrenta dos momentos o puntos de decisión, el primero ocurre al realizar la respuesta que inicia
la secuencia: o se presiona la palanca izquierda o la derecha. En el segundo momento se decide si se repite
o se cambia de palanca. Si cada punto de decisión ofrece información, entonces durante la fase de
extinción después de haber sido reforzada la secuencia ID, cuando el animal responde a la palanca
izquierda en el primer punto de decisión, enfrenta en el segundo punto la siguiente situación: si responde a
la palanca derecha (como en la fase con reforzamiento) el resultado, una y otra vez será no reforzamiento;
Ref.: Conductual, 2014, 2, 1, 44-56
ISSN: 2340-0242
54
Conductual, Revista Internacional de Interconductismo y Análisis de Conducta
Adquisición y extinción de respuestas discretas vs secuencias de respuestas
por lo tanto es más probable que varíe su respuesta y entonces se obtenga un incremento en la frecuencia
de la secuencia izquierda- izquierda.
Finalmente, es posible concluir que los resultados sugieren que aunque los principios básicos
operan de manera muy similar para respuestas discretas (representadas por las respuestas en un RF2) y
para secuencias de dos respuestas a dos operandos, se detectaron claras diferencias que parecen depender
de la composición de la secuencia, esto es, del uso de una unidad conductual diferente. Siguiendo el
argumento de Zeiler, se propuso una secuencia de respuestas (teórica) como una unidad diferente, después
se definió formalmente, es decir operacionalmente y se demostró su condicionabilidad, con lo que se avala
su validez como unidad conductual. Además se reportan aquí algunos resultados que parecen particulares
del uso de secuencias. Por ejemplo, se mostró que el reforzador dependiente de la secuencia apropiada
tiene un efecto extendido sobre las secuencias que no son reforzadas. Este efecto fue evidente durante la
extinción en donde las secuencias no reforzadas incrementaron su frecuencia. La observación de este
efecto es el resultado del registro de la emisión de todas las secuencias ejecutadas por el sujeto. No
disponemos aún de una interpretación sobre el proceso operante involucrado en el establecimiento de las
diferencias encontradas. Seguramente la replicación de estos resultados podrían sentar las bases empíricas
para identificar las variables y su función contribuyendo a la elaboración de una interpretación de la
ejecución de secuencias en términos de la unidad conductual apropiada.
Referencias
Bachá, G., Reid, A., y Mendoza, A. (2007), Resurgence of integrated behavioral units. Journal of the
Experimental Analysis of Behavior. 87, 5-24.
Bachá G. & Alonso I. (2011). Reforzamiento concurrente de secuencias de respuestas. Acta Psicológica. 1, 1,
108-120.
Baum, W. (2012). Rethinking reinforcement: allocation, induction, and contingency. Journal of
Experimental Analysis of Behavior, 97, 101-124.
the
Fester, C. & Skinner, B. F. (1957). Schedules of reinforcement. New York: Appleton-Century-Crofts.
Fetterman, G. & Stubbs, A. (1982). Matching, maximizing ant the behavioral unit: Concurrent
reinforcement of response sequences. Journal of the Experimental Analysis of Behavior, 37, 97-114.
Grayson, R. J., & Wasserman, E. A. (1979). Conditioning of two-response patterns of key pecking in
pigeons. Journal of the Experimental Analysis of Behavior, 31, 1, 23-29.
Neuringer, A., Kornell, N. & Olufs M. (2001). Stability and variability in extinction. Journal of Experimental
Psychology: Animal Behavior Processes, 27, 79-49.
Reid, A. K., Chadwick, C. Z., Dunham, M., & Miller, A. (2001). The development of functional response
units: The role of demarcating stimuli. Journal of the Experimental Analysis of Behavior, 76, 303-320.
Reid, A. K., Nill, C. A., & Getz, B. R. (2010). Changes in stimulus control during guided skill learning in
rats. Behavioural Processes, 84, 511-515.
Reynolds, G. S. (1973). Compendio de condicionamiento operante. México. Editorial Ciencias de la Conducta.
Schneider, S. M. (2008). A two-stage model for concurrent sequences. Behavioral Processes, 78, 429-441.
Ref.: Conductual, 2014, 2, 1, 44-56
ISSN: 2340-0242
55
Conductual, International Journal of Interbehaviorism and Behavior Analysis
Alonso-Orozco, I., Martínez-Sánchez, H. y Bachá-Méndez, G.
Schneider, S. M., & Morris, E. K. (1992). Sequences of spaced responses: Behavioral units and the role of
contiguity. Journal of the Experimental Analysis of Behavior, 58, 537-555.
Schwartz, B. (1980). Development of complex, stereotype behavior in pigeons. Journal of the Experimental
Analysis of Behavior, 33, 153-166.
Shimp, C. P. (1979). The local organization of behaviour: Method and theory. En M. D. Zeiler & P.
Harzem. (Eds.), Advances in analysis of behavior: Vol. 1. Reinforcement and the organization of behavior (pp.
261–298). New York: Wiley.
Skinner, B. F. (1935). The generic nature of the concepts of stimulus and response. Journal of general
psychology. 12, 40-65.
Skinner, B.F. (1938). Behavior of organisms: An experimental analysis. New York: Appleton-Century.
Timberlake, W. (1984). A temporal limit on the effect of future food on concurrent performance in an
analogue of foraging and welfare. Journal of the Experimental Analysis of Behavior, 41, 117-124.
Wasserman, E. A., Deich, J. D., & Cox, K. E. (1983). The learning and memory of response
sequences. In M. L. Commons, R. J. Herrnstein, & A. R. Wagner (Eds.), Quantitative analyses of
behavior: Vol. IV, Discrimination processes. (pp. 99-113) New York: Ballinger..
Zeiler, M. D. (1977). Schedules of reinforcement. En W. K. Honig & J. E. R. Staddon (Eds.), Handbook of
operant behavior. (pp. 201-232). Englewood Cliffs, NJ: Prentice-Hall.
Ref.: Conductual, 2014, 2, 1, 44-56
ISSN: 2340-0242
56
Conductual, Revista Internacional de Interconductismo y Análisis de Conducta
Descuento social: una comparación por género y edad
Descuento social: una comparación por género y edad. 1, 2
Raúl Ávila Santibáñez3
Aldo C. Toledo Razo
Facultad de Psicología
Universidad Nacional Autónoma de México
Resumen
El descuento social se refiere a la disminución del valor subjetivo de una recompensa en función
de la distancia social entre una persona que recibe la recompensa y alguien más con quien podría
compartirla. En el presente estudio se averiguó si el descuento social de recompensas monetarias
hipotéticas varía conforme al género y la edad de los participantes. Los participantes fueron 200 personas
que se clasificaron como hombres jóvenes, hombres adultos, mujeres jóvenes y mujeres adultas. Se
empleó una versión traducida del cuestionario de descuento social reportado por Jones y Rachlin (2006).
Parte de la traducción implicó adaptar las cantidades de dinero hipotéticas de dólares a pesos mexicanos.
Se encontró que tanto hombres como mujeres, jóvenes y adultos, descontaron la cantidad de dinero que
compartirían con otra persona en función de su distancia social con ella. La comparación por edad mostró
tasas de descuento social más pronunciadas en jóvenes que en adultos. En contraste, no se encontró una
contribución significativa del factor género. Los resultados sugirieron que los jóvenes son más “egoístas”
que los adultos. Se concluyó que la edad es un factor que debe considerarse en el estudio del descuento
social como métrica del altruismo y fenómenos sociales relacionados.
Palabras clave: descuento social, edad, género, recompensas monetarias hipotéticas, humanos
Abstract
Social discounting refers to the decrease of the subjective value of a reward depending on the social
distance between an individual receiving the reward and anyone else with whom the individual could share
the reward. In the present study, it was investigated if social discounting of hypothetical monetary rewards
varies according to age and gender of participants. Participants were 200 people classified as young men,
adult men, young women and adult women. A translated version of the social discounting questionnaire
reported by Jones and Rachlin (2006) was used. Part of the translation involved adapting the hypothetical
amounts of money from dollars to Mexican currency. It was found that all individuals, whether they were
men or women, young or adult, decreased the amount of money they would share with another person
depending on their social distance from him/her. Comparison by age showed social discounting rates
more pronounced in young than in adults. By contrast, a significant contribution of gender was not found.
The results suggested that young people are more "selfish" than adults. It was concluded that age is a
factor to be considered in the study of social discounting as a metric of altruism and related social
phenomena.
Key words: social discounting, age, gender, hypothetical monetary rewards, humans
1 La referencia de este artículo en la Web es: http://conductual.com/content/descuento-social-una-comparacion-por-genero-yedad
2 Esta investigación se realizó con apoyo del proyecto PAPIIT (proyecto PAPIIT No. IN303213) otorgado al primer autor por la
DGAPA de la Universidad Nacional Autónoma de México.
3 Correspondencia, Raúl Ávila S., Facultad de Psicología, Universidad Nacional Autónoma de México. Av. Universidad 3004, Cd.
Universitaria, México, D.F. 04510, México, DF. 04510, México. Email: [email protected].
Ref.: Conductual, 2014, 2, 1, 57-68
ISSN: 2340-0242
57
Conductual, International Journal of Interbehaviorism and Behavior Analysis
Ávila-Santibáñez, R. y Toledo-Razo, A.C.
En el análisis experimental de la conducta, específicamente en el área sobre conducta de elección,
se ha reportado que los animales y humanos eligen entre recompensas dependiendo de la magnitud y
demora de entrega de las mismas. Por ejemplo, en los programas de reforzamiento concurrentes
encadenados se expone a ratas o palomas a la elección entre pares de recompensas de diferente magnitud
y demora de entrega (e.g., Chung & Herrnstein, 1967; Mazur, 1987). La conducta de elección que se
observa en estos procedimientos se ha denominado como impulsiva cuando se elige una recompensa
pequeña e inmediata; la elección de una recompensa grande y demorada se identifica como conducta
autocontrolada (cf. Logue, 1988; Rachlin, 1995). El razonamiento subyacente a estas definiciones es que
en un periodo de tiempo dado, un sujeto muestra conducta autocontrolada si elige la recompensa grande y
demorada dado que resulta en una magnitud de reforzamiento mayor que elegir la otra recompensa (cf.
Rachlin, 2000).
En el caso de la conducta humana se ha estudiado la conducta autocontrolada tanto con
procedimientos de laboratorio funcionalmente similares a los que se emplean con animales (e.g., Reynolds
& Schiffbauer, 2004), como con cuestionarios en los cuales se pide a los participantes que elijan entre
pares de recompensas hipotéticas que varían en demora y en magnitud (Green & Myerson, 2004; Smith &
Hantula, 2008). Específicamente, se emplean procedimientos en los cuales los participantes deben
comparar el valor subjetivo de pares de recompensas monetarias hipotéticas y escoger entre una pequeña e
inmediata y otra grande pero demorada (cf. Smith & Hantula, 2008). Igual que con los experimentos con
animales, en estos estudios se asume que es óptimo para los participantes escoger la recompensa grande
pero demorada porque a la larga la magnitud global de reforzamiento será mayor que en el caso contrario
y, por lo tanto, mostrarían conducta autocontrolada (Locey, Jones & Rachlin, 2013; Green & Myerson,
2004). Como lo han aclarado los teóricos de la conducta, la palabra “subjetivo” sólo se refiere a un juicio
psicofísico de igualdad o diferencia entre pares de estímulos, y de ninguna manera a alguna representación
interna del sujeto (Rachlin, Raineri & Cross, 1991).
La elección de una u otra recompensa depende de la magnitud y demora de entrega de las mismas.
La estimación psicofísica del valor real de las recompensas es el valor subjetivo que los sujetos asignan a
las mismas. Los teóricos de la conducta han sugerido que el valor subjetivo de las recompensas disminuye
gradualmente conforme aumenta la demora entre la elección y la entrega de la recompensa (ver Rachlin,
2006; Berns, Laibson y Loewenstein, 2007; Madden y Bickel, 2010 para una revisión). La ecuación que
describe la disminución del valor subjetivo de las recompensas es hiperbólica y la función obtenida se
conoce como función de descuento temporal (Mazur, 1987; Berns, et al., 2007). La ecuación es la
siguiente:
v = V/(1 + kD)
Donde v es el valor subjetivo estimado de la recompensa, V es el valor real de la recompensa, D
es la demora y el parámetro k representa la tasa de descuento del valor subjetivo de la recompensa
conforme aumenta su demora de entrega. Una tasa de descuento relativamente grande indica mayor
pérdida o descuento del valor de la recompensa demorada y, por lo tanto, una tendencia a elegir la
recompensa pequeña e inmediata; esto es, conducta impulsiva. Por lo contrario, una tasa de descuento
pequeña indica menor pérdida del valor de la recompensa demorada y, por lo tanto, una tendencia a elegir
la recompensa demorada; en otras palabras, conducta autocontrolada. El procedimiento de descuento
temporal se ha empleado para estudiar diversos problemas de interés social, como el consumo de
sustancias adictivas (Petry, 2001; Odum & Rainaud, 2003; Odum & Baumann, 2007), el juego patológico y
la conducta de elección bajo riesgo (Bickel & Johnson, 2003), los desórdenes alimenticios (Manwaring,
Green, Myerson, Strube, & Wilfley, 2011), etc.
Ref.: Conductual, 2014, 2, 1, 57-68
ISSN: 2340-0242
58
Conductual, Revista Internacional de Interconductismo y Análisis de Conducta
Descuento social: una comparación por género y edad
Aunque el descuento temporal del valor de las recompensas es un fenómeno que ocurre
consistentemente, se han encontrado diferencias en las tasas de descuento conforme varía la edad de las
personas. Por ejemplo, Green, Fry y Myerson (1994) reportaron que las tasas de descuento del valor de las
recompensas demoradas disminuyen conforme aumenta la edad de las personas y, por lo tanto, la
conducta impulsiva también disminuye (ver también Mischel, Soda y Rodríguez, 1989). El hallazgo previo
es consistente entre hombres y mujeres (cf. Silverman, 2003).
El economista Julian Simon sugiere que además de estudiar la conducta de elección del individuo
de recompensas presentes y futuras (descuento temporal), también se debe tomar en cuenta al individuo
como parte de un grupo social (cf. Rachlin & Locey, 2011; Locey, Safin & Rachlin, 2013). Una variación
del procedimiento de descuento del valor de las recompensas, que incorpora la propuesta de Simon,
sugiere que los individuos descuentan el valor de una recompensa que están dispuestos a compartir con
otra persona conforme aumenta la distancia social que mantienen con ella (e.g., Rachlin & Raineri, 1992).
Es más probable que un individuo comparta una cantidad mayor de una recompensa con alguien que
percibe socialmente cercano a él que con alguien con quien percibe menos cercanía social. Rachlin (2002)
definió este ejemplo de conducta de elección como descuento social y sugirió que podría ser una métrica
viable para estudiar la conducta egoísta y la conducta altruista.
Rachlin y Raineri (1992) sugirieron que el descuento social se podía describir con una variación de
la ecuación de descuento hiperbólico de la recompensa, que es la siguiente:
v = V/(1 + sN)
Donde v y V representan el valor descontado y el valor real de la recompensa, respectivamente; N
es una medida de distancia social y s es la tasa con la que se descuenta el valor subjetivo de la recompensa
que el participante comparte con otras personas conforme aumenta la distancia social entre ellas y el
participante. En esta ecuación, una tasa de descuento relativamente grande refleja más descuento de la
recompensa compartida; esto es, mayor conducta egoísta. Un valor de s relativamente pequeño refleja un
menor descuento de la recompensa compartida o mayor conducta altruista.
Jones y Rachlin (2006) pidieron a estudiantes de licenciatura que respondieran un cuestionario de
descuento social que consistió en lo siguiente. Primero, se les pedía que imaginaran una lista de las 100
personas más cercanas a ellos ordenada desde la más cercana, como un familiar o amigo, hasta la más
alejada, como un simple conocido. Posteriormente, tenían que elegir entre pares de recompensas
monetarias hipotéticas, una cantidad de dinero sólo para el participante (e.g., $155; i. e. conducta egoísta) o
$75 para el participante y $75 para alguna persona de su lista imaginaria (i. e. conducta altruista). Las
cantidades de dinero de la opción egoísta cambiaban secuencialmente de $75 a $155 en intervalos de $10,
por lo que el participante realizó nueve elecciones para cada persona de su lista imaginaria por las que se le
preguntó. La opción altruista permanecía fija en todas las elecciones en $75 para el participante y $75 para
la persona de su lista imaginaria. Se pidió a los participantes que eligieran entre compartir o no la cantidad
de dinero con las personas 1, 2, 5, 10, 20, 50 y 100 de su lista imaginaria. Los autores escogieron estas
distancias sociales ya que esperaban encontrar mayor cambio en el valor subjetivo de la recompensa
compartida en los valores pequeños de distancia social que en los valores grandes, tal como ocurre en el
descuento temporal (Rachlin, Raineri & Cross, 1991). Por cada persona que se les preguntó a los
participantes hubo un punto en que cambiaron su elección entre la opción altruista y la egoísta, el cual se
denomina punto de indiferencia. El punto de indiferencia se define como la cantidad de dinero con la que
el participante es indiferente entre recibirla sólo para sí mismo o compartirla con otra persona, y se usa
como una medida del valor subjetivo de la recompensa compartida. Jones y Rachlin (2006) encontraron
que los participantes descontaron el valor subjetivo de la recompensa compartida conforme aumentó la
Ref.: Conductual, 2014, 2, 1, 57-68
ISSN: 2340-0242
59
Conductual, International Journal of Interbehaviorism and Behavior Analysis
Ávila-Santibáñez, R. y Toledo-Razo, A.C.
distancia social entre ellos y las personas de la lista conforme a la ecuación de descuento social propuesta
por Rachlin y Raineri (1992).
En estudios posteriores se exploró la relación entre el descuento social y la toma de decisiones
altruistas y egoístas (Jones, 2007), se averiguó la correlación entre el descuento social y el descuento
temporal (Jones y Rachlin, 2009), se determinó su valor predictivo en la conducta cooperativa (Locey,
Safin & Rachlin, 2013), y aún más, se reportó que los adolescentes con problemas de conducta antisocial
presentaban tasas de descuento social más altas que los adolescentes sin estos problemas (Sharp et al.,
2011).
A pesar de la generalidad del procedimiento de descuento social se desconoce si las variables
demográficas como la edad y el género de los participantes influyen en el mismo. Esta última clase de
evidencia es importante si se considera que en el caso del descuento temporal se conoce la contribución al
menos de la edad a la ocurrencia del fenómeno (e.g., Green, Fry & Myerson, 1994; Mischel, Soda &
Rodríguez, 1989). Así, en el presente estudio se realizó una replicación sistemática de la investigación
desarrollada por Jones y Rachlin (2006), esta vez con una muestra de mujeres jóvenes, mujeres adultas,
hombres jóvenes y hombres adultos con el propósito de averiguar si los factores edad y género
contribuyen al estudio del descuento social.
Método
Participantes
Participaron 200 personas de una unidad habitacional de la Ciudad de México con las que el
primer autor mantiene contacto. Los participantes fueron seleccionados conforme a los siguientes criterios
de género y edad: 50 hombres de 15 a 20 años, 50 hombres de 45 a 50 años, 50 mujeres de 15 a 20 años y
50 mujeres de 45 a 50 años. Todos los participantes cumplían con educación secundaria como mínimo al
momento de la presente investigación.
Instrumentos
Se utilizó el cuestionario de descuento social empleado por Jones y Rachlin (2006), el cual se
tradujo y se adaptaron las cantidades de dinero de dólares a pesos mexicanos. El cuestionario estuvo
formado por ocho páginas. En la primera página se recolectaron los datos socio demográficos de género y
edad de los participantes, y se presentaron las instrucciones generales. En cada una de las siguientes siete
páginas se escribió un resumen de las instrucciones seguido por nueve pares de elecciones entre una
cantidad de dinero sólo para el participante, indicada con la letra A (columna izquierda), y una cantidad de
dinero compartida entre el participante y otra persona, indicada con la letra B (columna derecha).
La cantidad de dinero sólo para el participante cambió sucesivamente entre cada par de
elecciones. Hubo dos versiones del cuestionario, una en que la cantidad de dinero sólo para el participante
cambió de forma ascendente y otra en que cambió de forma descendente. La cantidad de dinero
compartida entre el participante y otra persona se mantuvo fija entre cada par de elecciones en ambas
versiones del cuestionario.
Procedimiento
Se contactó directamente a cada participante en su casa llamando de puerta en puerta y se les
entregó el cuestionario. Se pidió a los participantes que lo contestaran de acuerdo a las instrucciones que
estaban impresas en él. Se acordó que el primer autor iría por los cuestionarios entre el primer y el quinto
día posteriores a la entrega de los mismos. Si el participante se negaba a contestar el cuestionario o no lo
Ref.: Conductual, 2014, 2, 1, 57-68
ISSN: 2340-0242
60
Conductual, Revista Internacional de Interconductismo y Análisis de Conducta
Descuento social: una comparación por género y edad
entregaba en el tiempo establecido, se buscaba otro participante, hasta que se completó la muestra
requerida para el estudio. El participante no recibió más instrucciones que las que estaban impresas en la
primera hoja del cuestionario, y fueron las siguientes:
Imagine que hizo una lista de las 100 personas más cercanas a usted y la ordenó
desde su más querido amigo, amiga o pariente en la posición #1 hasta un simple
conocido en la posición #100. La persona #1 sería alguien que usted conoce bien
y es su más cercano amigo, amiga o pariente. La persona #100 puede ser alguien
que usted reconoce y puede encontrarla casualmente pero es posible que usted ni
siquiera conozca su nombre.
Usted no tiene que hacer la lista físicamente, sólo imagine que ya la hizo.
A continuación se le pedirá que haga una serie de juicios basado en sus
preferencias. En cada afirmación se le preguntará si usted prefiere recibir una
cantidad de dinero sólo para usted o una cantidad de dinero para usted y para la
persona indicada en la lista. Por favor encierre en un círculo la letra A o B para
cada elección.
La cantidad de dinero sólo para el participante se presentó en la columna izquierda (columna A)
de cada hoja y varió gradualmente entre $750 y $1550 en intervalos de $100 pesos. Para la mitad de los
participantes de cada grupo esta cantidad cambió de forma ascendente. Para la otra mitad de los
participantes la cantidad cambió de forma descendente. La columna izquierda (A) del cuestionario fue
idéntica en todas las hojas del mismo. La cantidad de dinero compartida se presentó en la columna
derecha (B) y se mantuvo fija en $750 para el participante y $750 para alguna persona de su lista
imaginaria. Para cada participante, la distancia social (#N) de la columna derecha fue la misma en las
nueve elecciones que se presentaron en una página dada, pero difirió entre las páginas. Se usaron las
distancias sociales número 1, 2, 5, 10, 20, 50 y 100 de la lista imaginaria. Estas distancias sociales se
distribuyeron al azar entre las últimas siete hojas del cuestionario.
Resultados
En la versión ascendente del cuestionario, en cada una de las páginas, los participantes
comenzaron escogiendo la opción altruista, y hubo un punto en que cambiaron su preferencia por la
opción egoísta a medida que la cantidad sólo para ellos aumentaba. En la versión descendente, los
participantes comenzaron escogiendo la opción egoísta, y hubo un punto en que cambiaron su preferencia
por la opción altruista a medida que la cantidad sólo para ellos disminuía. Se promediaron las dos
cantidades de la opción A en que el participante cambió su preferencia entre las columnas A y B y así se
obtuvo un punto de indiferencia por cada distancia social. Por ejemplo, si en la versión descendente del
cuestionario un participante eligió la opción egoísta cuando A: $1550 y también en A: $1450, pero cambió
su preferencia hacia la opción altruista cuando A: $1350, el punto de indiferencia se calculó como $1400
(i.e., 1400=(1450+1350)/2). Sin embargo, hubo ocasiones en que los participantes nunca cambiaron su
preferencia, por lo que no hubo dos cantidades que promediar. De acuerdo a Jones y Rachlin (2006),
cuando un participante siempre escogió la opción altruista (opción B), el punto de indiferencia fue $1600,
dado el siguiente supuesto. Si el límite superior de la opción egoísta fuera $1650, se esperaría que por
comparación, el sujeto escogiera esta opción porque la ganancia sería notablemente mayor que escoger la
opción altruista. Cuando un participante siempre escogió la opción egoísta (opción A), el punto de
indiferencia fue $700, porque si el límite inferior de la opción egoísta fuera $650, se esperaría que en
comparación con esta cantidad, el sujeto cambiara a la opción altruista. La resta de cada punto de
Ref.: Conductual, 2014, 2, 1, 57-68
ISSN: 2340-0242
61
Conductual, International Journal of Interbehaviorism and Behavior Analysis
Ávila-Santibáñez, R. y Toledo-Razo, A.C.
indiferencia menos $750 fue la máxima cantidad de dinero que un participante estuvo dispuesto a
renunciar para dar $750 a la persona #N de su lista. Siguiendo con el ejemplo anterior en el que el punto
de indiferencia fue $1400, la cantidad a la que ese participante estuvo dispuesto a renunciar por dar $750 a
otra persona fue $650, ya que al escoger la opción “$750 para usted y $750 para la persona N de su lista”
renunció a $650 de los $1400 iniciales para dar $750 a la persona de su lista.
La variable dependiente fue la cantidad máxima de dinero que el participante estuvo dispuesto a
renunciar para dar $750 a una persona dada de su lista, lo cual muestra el valor subjetivo de la recompensa
que el participante estuvo dispuesto a compartir. La variable independiente fue la distancia social entre el
participante y las personas de su lista imaginaria. Los datos se analizaron con el programa SigmaPlot 12.0
con análisis de regresión no lineal, a partir del cual se obtuvieron los ajustes de los datos conforme a la
función hiperbólica y los parámetros de la misma.
En la Figura 1 se muestra la cantidad máxima de dinero que todos los participantes, sin importar
la versión del cuestionario que contestaron, estuvieron dispuestos a renunciar para dar $750 a cada
persona de su lista imaginaria. La línea continua muestra el ajuste hiperbólico de los datos conforme a la
ecuación de descuento social. Los datos son el promedio de los puntos de indiferencia de todos los
participantes de cada grupo definido por edad y género.
Figura 1. Ajuste hiperbólico de los puntos de indiferencia de todos los participantes
Hubo dos parámetros libres: el valor no descontado de la recompensa (V) y la tasa de descuento
(s). En el ajuste global de los datos el valor no descontado (V) fue de 769.08. Este parámetro determina la
altura de la función y no afecta su forma. El valor subjetivo de la cantidad de dinero por compartir
disminuyó con una tasa de 0.039 conforme aumentó la distancia social entre el participante y las personas
de su lista. Como muestra el coeficiente de determinación (R2=0.978) de la función hiperbólica, los datos
se ajustaron de acuerdo a la función de descuento hiperbólico como en otros estudios de descuento social
(e.g., Jones & Rachlin, 2006; Jones & Rachlin, 2009).
En la Figura 2 se muestran los ajustes hiperbólicos de las mujeres jóvenes, las mujeres adultas, los
hombres jóvenes y los hombres adultos. Como muestran los coeficientes de determinación (R2), el
Ref.: Conductual, 2014, 2, 1, 57-68
ISSN: 2340-0242
62
Conductual, Revista Internacional de Interconductismo y Análisis de Conducta
Descuento social: una comparación por género y edad
descuento del valor subjetivo de la cantidad de dinero por compartir de todos los grupos se ajustó
conforme a la función de descuento hiperbólico. En general, en esta figura se observan tasas de descuento
más grandes en las mujeres jóvenes y en los hombres jóvenes que en las mujeres adultas y en los hombres
adultos.
Figura 2. Ajustes hiperbólicos de los puntos de indiferencia de los participantes agrupados de acuerdo a los factores
de género y edad en conjunto.
En la Figura 3 se muestran los ajustes hiperbólicos de las mujeres, los hombres, los jóvenes y los
adultos, tomando en cuenta a los factores género y edad por separado. Los coeficientes de determinación
(R2) de estos cuatro grupos muestran nuevamente que los participantes descontaron el valor subjetivo de
las recompensas compartidas de acuerdo a la ecuación de descuento social. En el panel superior de la
figura se comparan las funciones de descuento de hombres y mujeres, en las cuales parece no haber
diferencia. En el panel inferior se muestra una comparación de las funciones de descuento de jóvenes y
adultos y se observa un descuento de la recompensa compartida más pronunciado por parte de los
jóvenes. Por lo tanto, la tasa de descuento social de los jóvenes es mayor que la de los adultos.
Aun cuando el descuento del valor subjetivo de la recompensa compartida de cada grupo se
comportó de acuerdo a la ecuación de descuento social, no todos los ajustes de los datos individuales
fueron significativos. Dada esta limitación de la descripción de los datos individuales con la función
hiperbólica, fue imposible comparar las tasas de descuento entre los participantes con estadística
paramétrica conforme a las variables de género y edad. Por esta razón, como se sugiere en la literatura
(e.g., Myerson, Green & Warusawitharana, 2001), se empleó el área bajo la curva como un dato análogo de
la tasa de descuento social. El área bajo la curva es un valor que varía entre cero y uno; un valor cercano a
cero indica mayor descuento, mientras que un valor cercano a uno indica menor descuento de la
Ref.: Conductual, 2014, 2, 1, 57-68
ISSN: 2340-0242
63
Conductual, International Journal of Interbehaviorism and Behavior Analysis
Ávila-Santibáñez, R. y Toledo-Razo, A.C.
recompensa compartida. Dado que el área bajo la curva presenta un límite inferior y un límite superior, es
más probable obtener una distribución normal de esta variable dependiente, por lo que es un dato
apropiado para realizar análisis estadísticos paramétricos (Myerson, Green & Warusawhitharana, 2001;
Smith & Hantula, 2008). Se calculó el área bajo la curva para los datos de cada grupo, tomando en cuenta
a los factores género y edad, en conjunto y por separado, y para los datos individuales de cada
participante. Se encontró un área bajo la curva global de 0.40. Para los participantes agrupados conforme a
los factores de género y edad en conjunto se encontraron áreas bajo la curva de 0.35, 0.48, 0.34, 0.42, para
las mujeres jóvenes, las mujeres adultas, los hombres jóvenes y los hombres adultos, respectivamente. Para
los participantes agrupados conforme a los factores género y edad por separado se encontraron áreas bajo
la curva de 0.42, 0.40, 0.36, 0.45, para las mujeres, los hombres, los jóvenes y los adultos, respectivamente.
Figura 3. Ajustes hiperbólicos de los puntos de indiferencia de los participantes agrupados de
acuerdo a los factores género y edad por separado.
Para verificar los resultados encontrados en las Figuras 2 y 3, se realizó un análisis de varianza de
dos factores (género: mujeres, hombres; edad: jóvenes, adultos) a partir del método de comparaciones
planeadas con los datos de área bajo la curva de cada participante. Se encontró que sólo el efecto principal
de la variable edad fue significativo: los adultos obtuvieron una media de área bajo la curva
significativamente mayor que los jóvenes, t(3,196)=2.57, p=0.01, mientras que el efecto principal de la
Ref.: Conductual, 2014, 2, 1, 57-68
ISSN: 2340-0242
64
Conductual, Revista Internacional de Interconductismo y Análisis de Conducta
Descuento social: una comparación por género y edad
variable género, t(3,196)=0.85, p=0.395, y la interacción de ambas variables, t(3,196)=0.66, p=0.5, no
mostraron diferencias significativas.
Discusión
Un primer hallazgo del estudio fue que el valor subjetivo de una recompensa que los participantes
compartirían con otra persona disminuyó conforme aumentó la distancia social entre ella y el participante.
Esta función tomó la forma de una hipérbola que se describió con la ecuación de descuento social. Fue
más probable que los participantes compartieran una recompensa con alguien que perciben socialmente
cercano que con alguien con quien perciben menor cercanía social. Además de reproducir los datos
reportados por Jones y Rachlin (2006), también se encontró que la ecuación de descuento social describió
el descuento de los participantes agrupados por edad y género.
En este estudio también se encontró que los jóvenes descontaron más la recompensa por
compartir que los adultos. Este hallazgo confirmó la suposición de Rachlin y Raineri (1992), respecto de
que la tasa de descuento social podría covariar con la edad. Este descuento de la recompensa compartida
más pronunciado por parte de los jóvenes podría explicarse en términos del parámetro de sensibilidad con
el que explican Green et. al. (1994) sus resultados de descuento temporal. Los resultados del presente
estudio sugieren una mayor sensibilidad a distancias sociales cortas por parte de los jóvenes, y una mayor
sensibilidad a distancias sociales largas por parte de los adultos, esto es, los jóvenes están dispuestos a
compartir únicamente con personas cercanas a ellos, mientras que los adultos están más dispuestos a
compartir incluso con personas socialmente distantes. Se propone que en futuras investigaciones de
descuento social en que se compare a la muestra de acuerdo a su edad, se tome en cuenta el parámetro de
sensibilidad a la variable independiente contemplado por Green et. al. (1994) con el fin de clarificar esta
explicación. Por otro lado, la tasa de descuento fue muy parecida entre hombres y mujeres, lo cual es
congruente con los datos reportados por Jones y Rachlin (2006).
En términos de la teoría del altruismo versus egoísmo de Rachlin (2002), la comparación por edad
encontrada en el presente estudio sugiere que los jóvenes son más “egoístas” que los adultos, pero no hay
una contribución significativa del factor de género. Estos resultados sugieren tomar en cuenta al factor de
edad en los estudios sobre descuento social como métrica del altruismo y fenómenos sociales relacionados
(Jones & Rachlin, 2006; Jones, 2007; Sharp et al., 2011; Locey, Safin & Rachlin, 2013).
Los resultados de esta investigación sugieren que la conducta altruista se adquiere conforme
avanza la edad de las personas. Locey, Jones & Rachlin (2013) mencionan que la conducta altruista no es
innata, sino que se desarrolla a lo largo de la vida de las personas en respuesta a las contingencias
ambientales. De esta forma, una persona puede aprender a elegir un acto altruista ya que forma parte de
un patrón de conducta al que se le asigna mayor valor que a un acto egoísta en aislado (Locey et al., 2013;
Rachlin, 2002).
Los hallazgos del presente estudio son similares a los resultados reportados en las investigaciones
sobre descuento temporal, en las que la edad es un factor que influye sobre la tasa de descuento (Green,
Fry & Myerson, 1994; Mischel, Soda & Rodríguez, 1989), mientras que no hay una contribución
concluyente del género (Silverman, 2003). Esta similitud entre el descuento temporal y el social sugiere
que la edad es un factor común entre ambos tipos de descuento. Este hallazgo es congruente con la
correlación entre estos dos tipos de descuento reportada por Jones y Rachlin (2009), y con la teoría de
Rachlin y Locey (2011), que propone que ambos tipos de descuento podrían pertenecer a un proceso
común de descuento de recompensas. Como lo sugiere Rachlin (2002), estos resultados muestran que la
conducta de autocontrol y la conducta altruista comparten aspectos en común, así como sus respectivos
Ref.: Conductual, 2014, 2, 1, 57-68
ISSN: 2340-0242
65
Conductual, International Journal of Interbehaviorism and Behavior Analysis
Ávila-Santibáñez, R. y Toledo-Razo, A.C.
antónimos, las conductas impulsiva y egoísta. Por ejemplo, como lo sugieren Rachlin y Locey (2011), la
conducta autocontrolada puede conceptualizarse como una extensión de la conducta altruista, dado que
elegir una recompensa relativamente grande pero demorada puede verse como conducta altruista para el
mismo sujeto después de que transcurrió la demora. En contraste, la conducta impulsiva podría verse
como una forma de egoísmo dado que el sujeto sólo recibiría una recompensa pequeña inmediatamente a
expensas de una recompensa de mayor valor. Harris y Madden (2002) sugirieron otra explicación respecto
de la relación entre la conducta altruista y la autocontrolada, la cual destacó el hecho de que la conducta
altruista es una forma de autocontrol, dado que cooperar con otras personas resulta en una magnitud
mayor de una recompensa a largo plazo.
En resumen, los datos sugieren que la edad es un factor que afecta de forma significativa la tasa de
descuento de recompensas demoradas y compartidas: la disminución del valor de las recompensas es
menos pronunciada conforme aumenta la edad de las personas.
Una limitación de la presente investigación es la falta de una comparación directa con una muestra
de niños. Sharp et. al. (2011) encontraron que los niños de 10 años y menores mostraron patrones atípicos
de respuesta en el cuestionario de descuento social, por lo que proponen adaptar el cuestionario para esta
muestra. También encontraron una relación entre las tasas de descuento social altas y los problemas de
conducta antisocial en adolescentes. Una comparación de los datos del presente estudio con una muestra
infantil clarificaría la contribución de la variable edad sobre las tasas de descuento social, sobre la presencia
de la conducta altruista o egoísta, y sobre las problemáticas sociales con las que se relacionan.
Referencias
Berns, G., Laibson, D. & Loewenstein, G. (2007). Intertemporal choice – toward an integrative
framework. Trends in Cognitive Sciences, 11, 11, 482-488.
Bickel, W. K. & Johnson, M. W. (2003). Junk time: Pathological behavior as the interaction of
evolutionary and cultural forces. In R. E. Vuchinich & N. Heather, (Eds.). Choice, behavioral
economics and addiction. (pp. 249-271). London: Pergamon.
Chung, S. & Herrnstein, R. J. (1967). Choice and delay of reinforcement. Journal of the Experimental Analysis
of Behavior, 10, 1, 67-74.
Green, L., Fry, A. F., & Myerson, J. (1994). Discounting of delayed rewards: A life-span comparison.
Psychological Science, 5, 33-36.
Green, L. & Myerson, J. (2004). A discounting framework for choice with delayed and probabilistic
rewards. Psychological Bulletin, 130, 5, 769-792.
Harris, A. C. & Madden, G. J. (2002) Delay discounting and performance on the prisoner’s dilemma game.
The Psychological Record, 52, 429-440.
Jones, B. A. (2007). Social distance and altruistic choice. USA: Stony Brook University.
Jones, B. A. & Rachlin, H. (2006). Social Discounting. Psychological Science, 17, 283-286.
Jones B. A. & Rachlin. H. (2009). Delay, probability, and social discounting in a public goods game. Journal
of the Experimental Analysis of Behavior, 91, 1, 61-73.
Ref.: Conductual, 2014, 2, 1, 57-68
ISSN: 2340-0242
66
Conductual, Revista Internacional de Interconductismo y Análisis de Conducta
Descuento social: una comparación por género y edad
Locey, M. L., Jones, B. A. & Rachlin, H. (2013). Self-control and altruism. In G. J. Madden, W. V. Dube,
T. D. Hackenberg, G. P. Hanley & K. A. Lattal (Eds.). APA handbook of behavior analysis, Vol. 1:
Methods and principles. (pp.463-481). Washington, DC: American Psychological Association.
Locey, M. L., Safin, V. & Rachlin, H. (2013). Social discounting and the prisoner’s dilemma game. Journal
of the Experimental Analysis of Behavior, 99, 1, 85-97.
Logue, A. W. (1988). Research on self-control: An integrating framework. Behavioral and Brain Sciences, 11,
665-709.
Madden, G. J. & Bickel, W. K. (2010). Impulsivity: The Behavioral and Neurological Science of Discounting.
Washington, DC: American Psychological Association.
Manwaring, J. L., Green, L., Myerson, J., Strube, M. J. & Wilfley, D. E. (2011). Discounting of various
types of rewards by women with and without Binge Eating Disorder: evidence for general rather
than specific differences. The Psychological Record, 61, 561-582.
Mazur, J. E. (1987). An adjusting procedure for studying delayed reinforcement. In M. L. Commons, J. E.
Mazur, J. A. Nevin, y H. Rachlin (Eds.). Quantitative analysis of behavior: Vol 5. The effect of delay and of
intervening events on reinforcement value (pp.55-73). Hillsdale, NJ: Erlbaum.
Mischel, W., Soda, Y. & Rodríguez, M. (1989). Delay of gratification in children. Science, 244, 933-93.
Myerson, J., Green, L. & Warusawitharana, M. (2001). Area under the curve as a measure of discounting.
Journal of the Experimental Analysis of Behavior, 76, 2, 235-243.
Odum, A. L. & Baumann, A. A. L. (2007). Cigarette smokers show steeper discounting of both food and
cigarettes than money. Drug Alcohol Depend, 91, 293-296.
Odum, A. L. & Rainaud, C. P. (2003). Discounting of delayed alcohol, food and money. Behavioral Processes,
64, 305-313.
Petry, N. M. (2001). Delay discounting of money and alcohol in actively using alcoholics, currently
abstinent alcoholics, and controls. Psychopharmacology, 154, 3, 243-50.
Rachlin, H. (1995). Self-control: Beyond commitment. Behavioral and Brain Sciences, 18, 109-159.
Rachlin, H. (2000). The science of self-control. USA: Harvard University.
Rachlin, H. (2002). Altruism and selfishness. Behavior and Brain Sciences, 25, 239-296.
Rachlin, H. (2006). Notes on discounting. Journal of The Experimental Analysis of Behavior, 85, 425-435.
Rachlin, H. & Locey, M. L. (2011). A behavioral analysis of altruism. Behavioural Processes, 87, 25-33.
Rachlin, H. & Raineri, A. (1992). Irrationality, impulsiveness, and selfishness as discount reversal effects.
In G. F. Loewenstein & J. Elder (Eds.). Choice over time. (pp. 93-118). New York: Russell Sage
Foundation.
Rachlin, H., Raineri, A. & Cross, D. (1991). Subjective probability and delay. Journal of the Experimental
Analysis of Behavior, 55, 233-244.
Ref.: Conductual, 2014, 2, 1, 57-68
ISSN: 2340-0242
67
Conductual, International Journal of Interbehaviorism and Behavior Analysis
Ávila-Santibáñez, R. y Toledo-Razo, A.C.
Reynolds, B. & Schiffbauer, R. (2004). Measuring state changes in human delay discounting: an
experiential discounting task. Behavioural Processes, 67, 343-356.
Sharp, C., Barr, G., Ross, D., Bhimani, R., Ha, C. & Vuchinich, R. (2011). Social discounting and
externalizing behavior problems in boys. Journal of Behavioral Decision Making, 25, 3, 239-247.
Silverman, I. W. (2003). Gender differences in delay of gratification: A meta-analysis. Sex Roles, 49, 451463.
Smith, C. L. & Hantula, D. A. (2008). Methodological considerations in the study of delay discounting in
intertemporal choice: A comparison of tasks and modes. Behavior Research Methods, 40, 4, 940-953.
Ref.: Conductual, 2014, 2, 1, 57-68
ISSN: 2340-0242
68