Download sistemas multiagente en ingeniería de organización

Document related concepts

Economía de la información wikipedia , lookup

Teoría de la complejidad y organizaciones wikipedia , lookup

Agente racional wikipedia , lookup

Racionalidad wikipedia , lookup

Mercado libre wikipedia , lookup

Transcript
III Jornadas de Ingeniería de Organización
Barcelona, 16-17 de septiembre de 1999
SISTEMAS MULTIAGENTE EN INGENIERÍA DE
ORGANIZACIÓN
Hernández, C.; López, A.
Departamento de Organización y Gestión de Empresas
Universidad de Valladolid
emails: [email protected]; [email protected]
RESUMEN
AIt is evident that the rational thing to do is to be irrational
and work with simpler rules@. (F. Knight, 1921)
Los Sistemas Multiagentes y la Inteligencia Artificial Distribuida, son áreas de activa investigación, con
aplicaciones muy satisfactorias en la ingeniería y en las ciencias sociales. Ambas tratan de dotar de inteligencia y
capacidad decisoria a los A0bjetos@ convirtiéndolos en AAgentes@ y desdibujando así la barrera entre sistemas
físicos y sociales. De aquí su importancia como metodología común al amplio campo de Ingeniería de
Organización: el arte de acoplar eficientemente Ingeniería y Organización. En este trabajo mostramos cómo los
MAS pueden ser utilizados para resolver y simular el comportamiento de instituciones de mercado,
acomodando agentes con racionalidad limitada y con interacciones complejas. Mejorando nuestro conocimiento
de las Instituciones de Mercado podremos sentar las bases de una Economía de la Organización más realista.
PALABRAS CLAVE: Simulación de Instituciones de Mercado. Sistemas Multiagente. Economía de la
Organización. Racionalidad Limitada y Complejidad.
INTRODUCCIÓN.
El propósito de esta comunicación, es ilustrar la aplicabilidad de los Sistemas
Multiagentes [MAS] en el modelado y simulación de Instituciones de Mercado, dando
satisfactoria respuesta a la necesidad de reconocer la racionalidad limitada de los
agentes participantes y la complejidad del velo institucional. Mejorar nuestro
conocimiento de las instituciones de intercambio para entender la Economía de las
Organizaciones [E.O.] (Simon, 1991).
Desde los años setenta, las aplicaciones de la Teoría del Control Optimo y la Teoría
de Juegos han permitido avances muy significativos en el Modelado Econométrico y
en la Economía Industrial [E.I.]. Desde esas aproximaciones se ha tratado de
prolongar la potencia del modelo del Aagente racional@ económico. Causalidad y
cointegración, la revolución de las expectativas racionales y la nueva economía
institucional, son algunos de estos logros. Pero de todos modos, para un observador
imparcial, resulta patente que los métodos económicos son incapaces de alcanzar la
propia evolución de la realidad económica e institucional.
Pensemos en las teorías explicativas del crecimiento económico. El residuo de Solow
supone un hueco demasiado ancho entre el crecimiento real y el explicable. Ciclos de
vida cada vez mas cortos, ganancias de flexibilidad y externalidades están presentes
en todas las actividades económicas y exigen modelos altamente no lineales. De modo
que sería más apropiado considerar el residuo de Solow como una medida de
nuestra ignorancia en la explicación del crecimiento.
Alan Greenspan desde el Fed, advierte intermitentemente de un posible repunte de la
inflación y del final del ciclo expansivo de la economía americana. Pero los hechos no
parecen discurrir así. Mas bien ocurre que aquellas externalidades y flexibilidad están
originando tremendas ganancias en valor añadido, de forma que la OA se mueve a la
derecha, ocultando el intercambio entre inflación y desempleo.
Menos éxito tiene aun, la Teoría Económica de la Organización en su explicación del
funcionamiento de las instituciones de mercado, bajo el supuesto de individuos
maximizadores y algún tipo de restricción forzada que asegure el ajuste (clearing) del
mercado. Las extensiones de la Economía Institucional desde los costes de transacción
vuelven a caer en el mismo reduccionismo-minimización de un hipotético coste de
oportunidad. Tal vez sea ya oportuno abrir la Acaja de Pandora@ y reconocer que la
pobreza explicativa de los modelos económicos proviene de la racionalidad limitada
de los agentes y sobre todo de la complejidad de sus relaciones sociales, como
señalara F.Knight (op. cit.).
Estas dos dimensiones de la Economía: racionalidad limitada y complejidad social
demandan una aproximación científica alternativa a la actual Teoría Económica, que
tal vez podríamos describir como La Nueva Economía Radical (NER):
i) La Economía debe referirse a lo que los individuos hacen. No queremos señalar
como irrelevantes niveles agregados de análisis, pero este debe incorporar el
comportamiento individual y la singularidad de cada agente. ii) Los individuos son
egoístas y oportunistas. iii) Son inteligentes: no dejan escapar oportunidades de
satisfacer su propio interés. iv) Tienen racionalidad limitada: capacidades limitadas
para procesar la información en el tiempo de deliberación de que disponen y utilizan
Areglas de pulgar@, por lo demás bien acreditadas desde la experiencia. v) La esencia
de la Economía, el intercambio, supone la existencia de interacciones entre los
agentes. vi) El velo institucional introduce información imperfecta e incluso
contradictoria, verdadera incertidumbre. vii) Finalmente los individuos tienen y
manifiestan emociones, la dimensión mas olvidada por la Teoría Económica.
A continuación argumentaremos que es posible acomodar esas dimensiones en el
modelado económico, lo que además constituye una investigación fascinante.
BOUNDED RATIONALITY AND EXPERIMENTAL ECONOMICS.
La aproximación ortodoxa dentro de la teoría económica ha evitado el asunto central
de las limitadas capacidades cognitivas del individuo, introduciendo costes de
transacción y la hipótesis de información imperfecta, institucionalistas o aprendizajes
heurísticos, normas y otras ideas importadas de disciplinas relacionadas: economía
evolucionista. De este modo se trata de extender el modelo bajo la óptica positiva del
Acomo si@. Amplia evidencia experimental, Kahneman et al. (1998), indica que los
agentes son proclives a errores sistemáticos poco compatibles con la teoría de la
utilidad esperada. Estos errores tienen su origen en costes de deliberación, incentivos,
emociones y experiencia en el aprendizaje.
Alentados por esta evidencia ha surgido una literatura muy significativa agrupada bajo
el nombre de Economía Experimental [E.E.] que trata de desentrañar y recuperar
desde la simulación con agentes reales, pautas estables de comportamiento económico.
)Por qué no un paso más y sustituir los agentes reales por artificiales, en los
experimentos correspondientes?
Utilizaremos el término racionalidad limitada, para designar la elección consistente
que tiene en cuenta las limitaciones cognitivas del decisor: limitaciones del
conocimiento, conocimiento parcial de las decisiones de los demás agentes y limitada
capacidad de proceso. En vez de asumir un conjunto fijo de alternativas entre las que
elegir, postulamos un proceso de generación de esas alternativas. En vez de asumir
loterías para los resultados, proponemos alternativas para acomodar la incertidumbre
que no suponen la definición de un espacio de probabilidad. Satisfacción de los
agentes, sustituye a maximización. La búsqueda de soluciones o pautas estables se
hace desde protocolos de agenda y no desde Aoptimizaciones@ de menú. Este último
extremo supone dotar al agente del doble mecanismo de aprendizaje:
procedural(sustantivo) y declarativo que se reconoce como característico en las
arquitecturas cognitivas.
El siguiente ejemplo, que utilizamos en clase, Pindyck et al. (1995) aclara la
distinción propuesta desde hace tiempo por Simon. Tres tiradores A, B y C disparan
en orden aleatorio a alguno de sendos globos A, B y C. Si un globo es alcanzado, el
correspondiente tirador queda eliminado. Gana el globo que queda sin romper. Las
probabilidades de dar a un globo son: 1 para A; 0.9 para B y 0.8 para C. )Que globo
tiene mas posibilidades de quedar sin romper o equivalentemente a qué tirador
apostaría usted?. Si sólo se les deja 15 minutos para contestar, la mayoría de los
alumnos contestan que el A y sólo algunos correctamente que el C. El argumento
intuitivo de estos (eficiente en términos cognitivos sustantivos) es que Acomo en la
vida misma el hecho observado es que los mediocres son los que triunfan@. En este
caso, por supuesto, el conocimiento declarativo conduciría a la misma respuesta
correcta calculando las probabilidades correspondientes (con el tiempo suficiente).
Una cuestión final relevante es si la E.E. y por tanto la aproximación MAS, puede
considerarse una metodología econométrica. Mantenemos desde hace tiempo,
Hernández et al. (1981), que si la teoría necesita la experimentación como Marshack
señalase, la experimentación necesita de teoría (respuesta de Frisch en el debate de
los inicios de la Cowles Commission). Esa interacción constituye el círculo virtuoso
del progreso científico. La aproximación MAS intenta dejar que los datos del
experimento revelen pautas estables, después de precisar los protocolos de
comunicación y las dimensiones de los agentes. La riqueza experimental desde MAS
complementa los datos reales, con costes despreciables, cuando estos están
disponibles y resulta imprescindible como campo experimental cuando no se dispone
de aquellos, caso frecuente en decisiones estratégicas de Economía Industrial.
AGENTES INTELIGENTES PARA INGENIERIA DE ORGANIZACION.
Antes de presentar nuestro modelo concreto de mercado y el software utilizado,
conviene hacer algunas precisiones, que permitan entender sus limitaciones y
posibilidades. Qué entendemos por agente inteligente? Qué tipo de arquitectura utiliza
nuestra plataforma? Qué tipo de lenguaje? Qué características tiene nuestro agente?.
Ver López et al. (1998).
Agentes y objetos son diferentes conceptos y consecuentemente lenguajes orientados
a objetos son insuficientes para nuestro propósito. i) En el caso de objetos, la decisión
reside en el objeto que invoca el método. En el agente, la decisión reside en el agente
que recibe la petición de otro. En términos gráficos: Aobjects do it for free; agents
for money@. ii)Los agentes deben estar dotados de capacidad de comportamiento:
reactivo, proactivo y social. iii) El agente es inherentemente dependiente de los
protocolos institucionales y tiene control sobre al menos parte de esa norma social.
Metáforas de control: menú o agenda. Esta es una distinción de capital importancia
para apreciar las posibilidades de nuestra aproximación en el modelado de sistemas
complejos y por tanto en Ingeniería de Organización, y en general la aportación de las
técnicas de aprendizaje y decisión en I.A. Hacemos un resumen heroico de Moss
(1995). La optimización (y consecuentemente la inferencia estadística) y decisión
económica tienen como base común un menú. Se explicitan unos invariantes canónicos
para fijar ese menú (sea regresión de una variable, dimensión del filtro de Kalman,
etc) y unas variables exógenas de antemano (etapa de identificación). Si el menú no es
el apropiado la elección será errónea. Optimizamos con respecto a algún menú. Todo
el aprendizaje bajo la hipótesis de expectativas racionales es de tipo menú.
Por el contrario los modelos basados en agenda crean tareas, generan un orden y
protocolo para realizar las tareas y eliminar de la agenda las que se han completado.
En el contexto del análisis económico, se vienen utilizando dos tipos de algoritmos de
agenda: algoritmos genéticos y sistemas de producción por reglas definidos
inicialmente por Newell y Simon (1972). Reglas con conjuntos de condiciones y
acciones. Cuando se satisfacen las condiciones, se materializan las decisiones. Las
condiciones se satisfacen cuando se encuentran Astatements@ en la base de datos que
cumplen con todos los elementos del conjunto de condiciones. Las acciones envían y
extraen statements de la base. Los cambios en la base implican cambios en el entorno
(institucional) y por tanto en el conjunto de reglas con condiciones que pueden ser
satisfechas.
Los sistemas de producción con base en agenda, sustituyen con ventaja al modelado
econométrico y la optmización con restricciones en presencia de complejidad en la
interrelación sistémica de los agentes. En vez de suponer que los agentes eligen la
mejor decisión posible de un menú apropiado, se supone que el agente tiene un
conjunto de reglas que determinan su comportamiento en circunstancias alternativas.
Un ejemplo ilustrativo sería la curva de reacción de un duopolista a la Bertrand
(Moss, op. cit.): Pi (t) = 0.5 + 0.25 Pj (t-1). Su representación por una regla sería:
Antecedentes
a) date ?today
b) greater ?today 0
c) difference ?yesterday ?today 1
d) firmName ?thisFirm
e) productOf ?ownProduct ?thisFirm
f) productOf ?otherProduct ?otherFirm
g) not equal ?otherFirm ?thisFirm
h) price ?otherProduct ?yesterday ?lastOtherPrice
i) multiply ?uninterceptedNewPrice 0.25 ?lastOtherPrice
j) sum ?newPrice 0.5 ?uninterceptedNewPrice
Consecuentes
decideFor. >?ownProduct=
decisionVariable: #price
setNewValueTo: ?newPrice
Por supuesto es una forma más prolija de simular ese comportamiento, que en Fortran,
Pascal u otro lenguaje procedural, pero compite si hay suficiente número de agentes
distintos con interacciones complejas.
Tipo de arquitectura. La arquitectura de nuestros agentes es híbrida, con capas
reactivas y capas deliberativas. De esta forma se acomoda el modelo cognitivo de
Anserson (1993) ACT-R, quien establece como fundamental la distinción declarativo
vs procedural. La lógica empleada en SDML (Strictly Declarative Modelling
Language) para el disparo de reglas permite desarrollar modelos consistentes y
fuertemente fundados mediante la extensión de la lógica KD45 (lógica autoepistémica,
no monotónica).
El programa permite definir en un sistema MAS, agentes con las siguientes
características:
Incertidumbre (información imperfecta sobre el entorno y las instituciones);
Limitada capacidad cognoscitiva (no puede evaluar todas las alternativas);
Tiempo (debe decidir sobre qué razonar, cuando y por cuanto tiempo);
Memoria finita (existe un factor de olvido, como procesador de información);
Aprendizaje (procedural y declarativo);
Canales de comunicación y protocolos (el velo institucional);
Comportamiento social (emociones; es solitario, parásito, egoísta o altruista).
ILUSTRACIÓN: MERCADO TIPO POSTED OFFER.
Tratamos de simular el comportamiento de un mercado tipo Aposted offer@(piénsese
en la compra de billetes de avión por particulares dos semanas antes del vuelo). Los
compradores, 300, compran secuencialmente, enviando sus peticiones a un único
vendedor. No hay mas comunicación entre el comprador y el vendedor que la petición
y respuesta. No hay negociación. Las ofertas son enviadas simultáneamente. Los
vendedores responden y esperan por las peticiones o el compromiso de compra. Los
vendedores procesan las peticiones según su disponibilidad.
Hemos simulado dos situaciones: experimento 1 (e-1) y experimento 2 (e-2). En el e-1
no hay reputación de los vendedores ni emociones de los compradores. El precio de
reserva de los vendedores se adjudica aleatoriamente. Idem las preferencias iniciales
(calidad). Buscan el mejor precio para un nivel de calidad. La estrategia de compra
es, compra cuanto antes. La búsqueda de precios es ciega. Tienen limitado acceso a
los vendedores (costes de tiempo de búsqueda). El número de peticiones por día
varia aleatoriamente entre compradores. Se simula el comportamiento durante dos
semanas de compra(diez días) por ronda. Total de rondas 30. En cada ronda pueden
comprar hasta 300 compradores, de 15 vendedores. La unidad es el día.
Los vendedores fijan tres precios de acuerdo con un criterio de Amark-up@, y en
función de la calidad. Con el mas bajo cubren costes fijos, con el intermedio la
rentabilidad requerida (elegida aleatoriamente), y con el alto, una rentabilidad
superior. La capacidad total también se fija aleatoriamente. Seleccionan así cantidades
y precios en cada categoría. Estos valores permanecen constantes.
En el e-2 se permite que los compradores de cada ronda hereden la información sobre
los vendedores de los anteriores compradores: reputación. Esta información se refiere
a precios, ventas totales y excelencia de la compañía. La elección inicial de los
compradores depende de sus precios de reserva, la calidad y su nivel emocional
inicial. Este depende del tiempo que queda para terminar la ronda (ansiedad) de la
calidad y del precio (satisfacción por la compra). El resto es como en el e-1.
PRINCIPALES RESULTADOS Y CONCLUSIONES.
Los métodos basados en MAS son muy apropiados para la resolución de situaciones
complejas, particularmente cuando existen problemas de información, incertidumbre
no probabilizable y necesidad de coordinación. Por ello serán muy útiles en el amplio
campo de Ingeniería de Organización, el arte de unir Ingeniería (sistemas físicos) y
Organización (sistemas sociales).
El SDML trabaja con producción por reglas, por agenda, como alternativa a la
aproximación matemática a la optimización, que lo hace desde menús. De este modo
se mitiga el problema de identificación (especificación) agudo en los métodos
econométricos. En MAS se trata de que los datos revelen pautas estables, que a modo
de bootstrap pueden reutilizarse para rediseñar el modelo: algo parecido al análisis
bayesiano, pero sin necesidad de reducir la complejidad a información probabilista a
la Kolmogorov.
Los límites de la E.O., incluidas las extensiones evolucionistas, institucionalistas y de
teoría de juegos, están en la hipótesis controvertida de la racionalidad de los agentes y
en la complejidad de sus interacciones. Los sistemas MAS están diseñados
precisamente para acomodar esas dos características: racionalidad limitada y
complejidad de las interacciones. No es aventurado afirmar que la E.O. de la próxima
década estará fuertemente basada en sistemas MAS, salvo arquetipos elementales y
supone una formalización radicalmente distinta de la actual E.I.
El ejemplo ilustrativo, siendo la mas simple de las instituciones de mercado, ha sido
enriquecido mucho mas allá de los modelos que encontramos en E.I., para recoger la
dimensión emocional y la complejidad de los protocolos de intercambio. Los
resultados de la simulación exhiben pautas estables de comportamiento y son acordes
con lo observado, en E.E.
En el mercado e-1, se realizan menos transacciones. Las compras son muy uniformes,
en los diferentes días. Incluso los peores vendedores venden, aunque menores
cantidades. La longitud del conjunto de precios va de 16 a 25.
En el mercado e-2, aumenta el número de transacciones por día, es decir la reputación
e información mejoran la eficiencia del mercado. Las compras diarias tienden a
concentrarse al principio del período de cinco días, y para no quedarse sin comprar,
se vuelven a acumular las compras el último día. Se produce así un ciclo emocional.
Los vendedores menos eficientes no realizan transacciones y en este modelo sin
negociación se quedan fuera del mercado. Los precios están mas agrupados.
AGRADECIMIENTOS.
Nuestro sincero agradecimiento a los miembros del Centre for Policy Modelling de la
Manchester Metropolitan University: S.Moss, B. Edmonds y S. Wallis, por su ayuda y
estímulo y por habernos facilitado el SDML.
REFERENCIAS
ANDERSON, J.R. (1993). Rules of the Mind. Lawrence Erlbaum Associates.
HERNÁNDEZ, C. Y HERNÁNDEZ, F. (1981). Causality and the Independence
Phenomenon: The Case of the Demand for Money. Journal of Econometrics, Vol 15.
KAHNEMAN, D., SLOVIC, P. y TVERSKY, A. (1998). Judgement under
Uncertainty: Heuristics and biases. Cambridge U.P.
KNIGHT, F.H. (1921). Risk, uncertainty and profit. Boston.
LÓPEZ, A. Y OLMO, R. DEL (1998). The Social Dimension of Economics.
Proceedings Socially Situated Intelligence. Fifth International Conference on
Simulation of Adaptive Behaviour. Zürich.
MOSS, S. (1995). Control Metaphors in the Modelling of Economic Learning and
Decision-Making Behaviour. Computational Economics, vol 8, n1 4.
MOSS, S., H. GAYLARD, S. WALLIS Y B. EDMONDS (1998). SDML: A MultiAgent Language for Organizational Modelling. Computational and Mathematical
Organization Theory. (http://www.cpm.mmu.ac.uk/cpmrep.html)
PINDYCK, R. & D. L. RUBINFELD (1995), Microeconomics. Prentice Hall.
SIMON, H.A. (1991).- Organizations and Markets. Journal of Economic
Perspectives. Vol5,n12.pag 25-44.
FIGURAS
Number of transactions per round
Daily average transactions
200
70
150
60
100
50
market 1
market 2
50
40
time
25
22
19
16
13
10
7
4
0
1
30
20
10
0
market 1
market 2