Download Presentación Formal Tesis I
Document related concepts
no text concepts found
Transcript
SERGEN: Servidor General para la Biblioteca Digital de la Universidad de las Américas Puebla Héctor Cocoletzi Moreno Asesor: Dr. Alfredo Sánchez Índice • Introducción – Esquema de la Biblioteca Digital • Problema • Objetivos Generales • Servicios – Búsqueda y Recuperación de Información – Navegación Taxonómica – Otros Servicios Introducción • Construcción de un acervo digital por parte de la Biblioteca de la UDLA-P • Desarrollo de aplicaciones y/o ambientes que dependen del acervo digital – – – – Sistemas de Recomendación Reserva Digital Ambientes Personalizados Agentes Móviles Esquema de la Biblioteca Digital Problema • Existen diversas aplicaciones a desarrollar cuya operación depende del acervo digital • Cada aplicación requiere de protocolos de comunicación con el acervo • Las aplicaciones tienen en común algunas funcionalidades – Mecanismos de Búsqueda y Recuperación de información • Espacios Vectoriales • Búsqueda Booleana Extendida Objetivos Generales • Establecer un protocolo de intercomunicación entre aplicaciones (KQML, JINI o CORBA) • Diseñar e implementar un servidor general que provea servicios comunes, robustos y confiables a aplicaciones y/o ambientes que hagan uso de la Biblioteca Digital de la UDLA-P Objetivos Específicos • Diseñar e implementar el protocolo de comunicación interagentes en una Biblioteca Digital (MICK) [Barceinas, 1998] • Implementar técnicas de búsqueda y recuperación de información como Espacios Vectoriales y Búsqueda Booleana Extendida [Pérez, 1998]. Búsquedas y Recuperación de Información • Espacios Vectoriales – Documentos representados en una matriz bidimensional • Renglones -> documentos • columnas -> términos contenidos en documentos – Entrada: vector de términos de consulta – Salida: términos de la base de datos más pegados a los de consulta – Criterio: ángulo de diferencia entre términos de consulta y términos de las base de datos Búsquedas y Recuperación de Información... • Búsqueda Boolena Extendida – Técnica aplicada a consultas con conectivos lógicos “and” y/o “or” – Les asigna peso a los operaciones lógicas realizadas – Hace uso de criterios matemáticos para determinar el grado de similitud entre términos Navegación Taxonómica • Problema: – existen diversas taxonomías o clasificaciones en la Biblioteca Digital: Biblioteca del Congreso (UDLA), Dewey, personales, etc. • Las clasificaciones son jerárquicas y están representadas como tuplas en la Base de Datos. • Objetivo: – encontrar una forma de recorrer las diversas taxonomías sin problemas Otros Servicios • Visualización aplicada a recuperación de documentos de texto • Indización Semántica aplicada a documentos • Otras técnicas de Búsqueda y Recuperación de información – Búsqueda Booleana – Método Probabilístico • Reconocimento de Caracteres en Paralelo • Mecanismos de Consulta a Imágenes • Traducción automática de descripciones de libros Calendario de Actividades Para más información • Página personal – http://ict.udlap.mx/people/hector Bibliografía • Barceinas, A. 1998. MICK: Un Marco de Comunicación Interagentes en una Biblioteca Digital. Laboratorio de Tecnologías Interactivas y Cooperativas, Universidad de las Américas – Puebla. Cholula, Pue. 72820, México • Cabrera, J. 1997. Integración de Servicios y Agentes de Usuario en la Recuperación de Información en una Biblioteca Digital. Tech. Rep. No. ICT-97-2. Laboratorio de Tecnologías Interactivas y Cooperativas, Universidad de las Américas-Puebla, Cholula, Pue. 72820, Mexico • Emmerich, W. 1997. An Introduction to OMG / CORBA Proceedings of the 1997 international conference on Software engineering. 641–642 • Pérez, C. V. 1998. Agentes móviles en bibliotecas digitales. Tech. Rep. No. ICT-98-8. Laboratorio de Tecnologías Interactivas y Cooperativas, Universidad de las Américas-Puebla, Cholula, Pue. 72820, Mexico. (Disponible en http://ict.udlap.mx/pubs). • Waldo, J. 1999. The Jini architecture for network-centric computing. Communications of the ACM. Vol. 42 No. 7, 76-82, julio Conceptos Básicos • Definición de Biblioteca Digital – Grandes depósitos de grandes colecciones hetereogéneas (multimedios, diferentes formatos y tamaños de datos) [Sánchez, 1999] – “Es un ensamblaje de cómputo digital, mecanismos de comunicación y software necesario para reproducir, emular y extender los servicios provistos por bibliotecas convencionales como son la colección, catalogación, búsqueda y diseminación de la información”. Gladney citado en [Pérez, 1998] Conceptos Básicos... • KQML (Knowledge Query Manipulation Language) – lenguaje de comunicaciónbasado en la teoría de actos del habla, usada en sistemas multiagentes para construir una capa lingüística y formalizar las acciones lingüísticas de los agentes – sus mensajes además de comunicar oraciones, comunican una actitud acerca del contenido (por ejemplo, afirmación, solicitud, pregunta) – se divide en tres capas: contenido, mensaje y comunicación Conceptos Básicos... • CORBA (Common Object Request Broker Architecture) – se crea con el objetivo de simplificar el desarrollo de aplicaciones distribuidas y de proveer bases flexibles para servicios de más alto nivel. – es una especificación para una arquitectura estándar orientada a objetos para aplicaciones – utliza a los objetos como una metáfora de unificación para lograr poner todas las aplicaciones existentes dentro de un mismo canal y así permitir una interoperatividad Conceptos Básicos... • JINI – arquitectura que provee una infraestructura para definir, propagar y encontrar servicios en una red – diseñada para soportar actualizaciones incrementales de componentes de red (hardware y software) – reemplaza la noción de periféricos y aplicaciones con la de servicios en red y clientes que usan esos servicios – definida en términos del lenguaje Java JINI y CORBA: algunas características • JINI – facilitala integración de aplicaciones de tipo distribuido – requiere que el cliente y el servidor estén implementados en Java – conserva las características de Java • CORBA – facilita la integración de aplicaciones de tipo heterogéneo y distribuido – permite la independencia de plataforma, sistema operativo y lenguaje de programación entre el cliente y el servidor JINI y CORBA: algunas características... • JINI – fomenta el “plug and play” para los servicios en red – sus componentes pueden verse como una extensión de Java – promueve una arquitectura basada en servicios • CORBA – facilita la reusabilidad y portabilidad de componentes de las aplicaciones – soporta diversos lenguajes de programación orientada a objetos con sus características