Download Clase 7
Document related concepts
Transcript
BASES DE DATOS AVANZADAS Facultad de Estadística e Informática Clase 7 ▪Clase anterior. ▪Tema 2. Bases de Datos Distribuidas (BDD). Procesamiento en sitios múltiples y datos en sitios múltiples. ❖Características de las BDD (Ventajas, Desventajas) ❖Características de Transparencia en los Sistemas Manejadores de Bases de Datos Distribuidos (SMBDD) ❖Transparencia de Distribución ❖Transparencia de Transacción Facultad de Estadística e Informática Clase 7 ▪Tema 2. Bases de Datos Distribuidas (BDD). ▪Características de Transparencia en los Sistemas Manejadores de Bases de Datos Distribuidos (SMBDD) ❖Transparencia de replicación. ❖Transparencia de falla. ❖Transparencia de desempeño. ❖Transparencia de heterogeneidad. Facultad de Estadística e Informática Bases de Datos Distribuidas Bibliografía Bell, David (1992). Distributed database systems. Wokingham, Eng. : Addison-Wesley. Connolly, Thomas M. (2005). Sistemas de bases de datos: un enfoque práctico para diseño, implementacion y gestión. (4ta ed.). Madrid : Pearson Educación Limited. Date, C. J. (2001). Introducción a los sistemas de bases de datos. (7ma ed.). México: Pearson Educación: Addison Wesley. Marqués, M. (2001). Apuntes de ficheros y bases de datos. Universitat Jaume I, Campus de Riu Sec. España. consultado el 13 de noviembre de 2007, en: http://www3.uji.es/~mmarques/f47/apun/apun.html Si no encuentras el documento, pulsa aquí. Rob, Peter (2004). Sistemas de bases de datos: diseño, implementación y administración. (5ta ed.). México, D.F.: Thomson. Facultad de Estadística e Informática Bases de Datos Distribuidas Niveles de transparencia de una base de datos distribuida ❖Transparencia de distribución. ❖Transparencia de transacción. ❖Transparencia de replicación. ❖Transparencia de falla. ❖Transparencia de desempeño. ❖Transparencia de heterogeneidad. Facultad de Estadística e Informática Bases de Datos Distribuidas Niveles de transparencia de una base de datos distribuida ❖Transparencia de replicación. La transparencia de replicación de datos se refiere a que, si existen copias de objetos de la base de datos, su existencia debe ser controlada por el sistema no por el usuario. Se debe tener en cuenta que cuando el usuario se encarga de manejar las réplicas en un sistema, el trabajo de éste es mínimo por lo que se puede obtener una eficiencia mayor. Sin embargo, el usuario puede olvidarse de mantener la consistencia de las réplicas teniendo así datos diferentes. Facultad de Estadística e Informática Bases de Datos Distribuidas Niveles de transparencia de una base de datos distribuida ❖Transparencia de falla. La transparencia de falla permite que el sistema continúe operando en el caso de una falla de nodo. Las funciones que se perdieron a causa de la falla serán recobradas por otro nodo de la red. Facultad de Estadística e Informática Bases de Datos Distribuidas Niveles de transparencia de una base de datos distribuida ❖Transparencia de falla y replicación. Facultad de Estadística e Informática Bases de Datos Distribuidas Niveles de transparencia de una base de datos distribuida ❖Transparencia de distribución. ❖Transparencia de transacción. ❖Transparencia de replicación. ❖Transparencia de falla. ❖Transparencia de desempeño. ❖Transparencia de heterogeneidad. Facultad de Estadística e Informática Bases de Datos Distribuidas Niveles de transparencia de una base de datos distribuida ❖Transparencia de desempeño. La transparencia de desempeño permite que cuando los objetos de la base de datos están fragmentados, el sistema maneja la conversión de consultas de usuario definidas sobre relaciones globales a consultas definidas sobre fragmentos. Así también, mezcla las respuestas a consultas fragmentadas para obtener una sola respuesta a una consulta global. Facultad de Estadística e Informática Bases de Datos Distribuidas Niveles de transparencia de una base de datos distribuida. Transparencia de desempeño. ❖Optimización de consultas Reducir al mínimo el costo total asociado con la ejecución de una solicitud. Facultad de Estadística e Informática Bases de Datos DistribuidasNiveles de transparencia de una base de datos distribuida. Transparencia de desempeño. ❖Optimización de consultas ¿Qué costo se desea reducir? Facultad de Estadística e Informática Bases de Datos DistribuidasNiveles de transparencia de una base de datos distribuida. Transparencia de desempeño. ❖Optimización de consultas Los costos asociados con una solicitud son una función (Rob, 2004): ▪Del costo del tiempo de acceso (E/S) implicado al acceder los datos físicos guardados en disco. ▪Del costo de comunicación asociado con la transmisión de datos entre nodos en sistemas de base de datos distribuidos. ▪Del costo de tiempo de CPU asociado con la sobrecarga de procesamiento de manejar transacciones distribuidas. Facultad de Estadística e Informática Bases de Datos DistribuidasNiveles de transparencia de una base de datos distribuida. Transparencia de desempeño. ❖Optimización de consultas La mayoría de los algoritmos propuestos para una optimización de consultas se basan en dos principios: ▪La selección del orden de ejecución óptimo. ▪La selección de los sitios a ser accedidos para reducir al mínimo los costos de comunicación. Facultad de Estadística e Informática Bases de Datos DistribuidasNiveles de transparencia de una base de datos distribuida. Transparencia de desempeño. ❖Optimización de consultas ¿Cómo se evalúan los algoritmos de optimización? Facultad de Estadística e Informática Bases de Datos DistribuidasNiveles de transparencia de una base de datos distribuida. Transparencia de desempeño. ❖Optimización de consultas Un algoritmo de optimización de consulta puede ser evaluado con base en su modo de operación o en la temporización de su optimización Facultad de Estadística e Informática Bases de Datos DistribuidasNiveles de transparencia de una base de datos distribuida. Transparencia de desempeño. ❖Optimización de consultas Los modos de operación se clasifican como manuales o automáticos. ▪Optimización de consulta automática: el DDBMS localiza la ruta de acceso más barata sin la intervención del usuario. ▪Optimización de consulta manual: requiere que la optimización sea seleccionada y programada por el usuario o programador. Facultad de Estadística e Informática Bases de Datos DistribuidasNiveles de transparencia de una base de datos distribuida. Transparencia de desempeño. ❖Optimización de consultas Los algoritmos de optimización de consultas también se clasifican de acuerdo con el momento en el que se realiza la optimización: ◦Estáticos ◦Dinámicos Facultad de Estadística e Informática Bases de Datos DistribuidasNiveles de transparencia de una base de datos distribuida. Transparencia de desempeño. ❖Optimización de consultas ▪En la optimización de consulta estática, la mejor estrategia de optimización se selecciona cuando la consulta es compilada por el DBMS. ▪Cuando el programa se somete para su compilación, crea el plan necesario para acceder a la base de datos. Cuando se ejecuta el programa, el DBMS utiliza ese plan para acceder a la base de datos. Facultad de Estadística e Informática Bases de Datos DistribuidasNiveles de transparencia de una base de datos distribuida. Transparencia de desempeño. ❖Optimización de consultas ▪La optimización de consulta dinámica ocurre en tiempo de ejecución. ▪La estrategia de acceso a la base de datos se define cuando se ejecuta el programa. ▪Es eficiente, su costo se mide por sobrecarga de procesamiento en tiempo de ejecución. Facultad de Estadística e Informática Bases de Datos DistribuidasNiveles de transparencia de una base de datos distribuida. Transparencia de desempeño. ❖Optimización de consultas ¿Cómo se optimizan las consultas? Facultad de Estadística e Informática Bases de Datos DistribuidasNiveles de transparencia de una base de datos distribuida. Transparencia de desempeño. ❖Optimización de consultas ▪ Las técnicas de optimización de consultas se clasifican de acuerdo con el tipo de información emitida para optimizar la consulta ▪Basado en estadísticas ▪Basado en reglas Facultad de Estadística e Informática Bases de Datos DistribuidasNiveles de transparencia de una base de datos distribuida. Transparencia de desempeño. ❖Optimización de consultas ▪Basado en estadísticas. Las estadísticas proporcionan información sobre características de la base de datos tales como tamaño, número de registros, tiempo de acceso promedio, número de solicitudes atendidas, número de usuarios con derechos de acceso, etc. Posteriormente estas estadísticas son utilizadas por el DBMS para determinar la mejor estrategia de acceso. Facultad de Estadística e Informática Bases de Datos DistribuidasNiveles de transparencia de una base de datos distribuida. Transparencia de desempeño. ❖Optimización de consultas ▪Basado en reglas. Se basa en un conjunto de reglas definidas por el usuario para determinar la mejor estrategia de acceso a la consulta. Las reglas son ingresadas por el usuario o el administrador de la base de datos, y casi siempre son de naturaleza muy general. Facultad de Estadística e Informática Bases de Datos Distribuidas Niveles de transparencia de una base de datos distribuida ❖Transparencia de distribución. ❖Transparencia de transacción. ❖Transparencia de replicación. ❖Transparencia de falla. ❖Transparencia de desempeño. ❖Transparencia de heterogeneidad. Facultad de Estadística e Informática Bases de Datos Distribuidas Niveles de transparencia de una base de datos distribuida ❖Transparencia de heterogeneidad. La transparencia de heterogeneidad permite la integración de varios sistemas de administración de bases de datos locales diferentes (relacional, de red, jerárquicos, multimedia, etc.) conforme un esquema global común. Facultad de Estadística e Informática Bases de Datos Distribuidas Niveles de transparencia de una base de datos distribuida ❖Transparencia de heterogeneidad. Facultad de Estadística e Informática