Download Clase 7

Document related concepts

Base de datos wikipedia , lookup

Base de datos distribuida wikipedia , lookup

OLTP wikipedia , lookup

NoSQL wikipedia , lookup

Microsoft SQL Server wikipedia , lookup

Transcript
BASES DE DATOS
AVANZADAS
Facultad de Estadística e Informática
Clase 7
▪Clase anterior.
▪Tema 2. Bases de Datos Distribuidas (BDD).
Procesamiento en sitios múltiples y datos en sitios
múltiples.
❖Características de las BDD (Ventajas, Desventajas)
❖Características de Transparencia en los Sistemas
Manejadores de Bases de Datos Distribuidos (SMBDD)
❖Transparencia de Distribución
❖Transparencia de Transacción
Facultad de Estadística e Informática
Clase 7
▪Tema 2. Bases de Datos Distribuidas (BDD).
▪Características de Transparencia en los Sistemas
Manejadores de Bases de Datos Distribuidos
(SMBDD)
❖Transparencia de replicación.
❖Transparencia de falla.
❖Transparencia de desempeño.
❖Transparencia de heterogeneidad.
Facultad de Estadística e Informática
Bases de Datos Distribuidas
Bibliografía
Bell, David (1992). Distributed database systems. Wokingham, Eng. : Addison-Wesley.
Connolly, Thomas M. (2005). Sistemas de bases de datos: un enfoque práctico para diseño,
implementacion y gestión. (4ta ed.). Madrid : Pearson Educación Limited.
Date, C. J. (2001). Introducción a los sistemas de bases de datos. (7ma ed.). México: Pearson Educación:
Addison Wesley.
Marqués, M. (2001). Apuntes de ficheros y bases de datos. Universitat Jaume I, Campus de Riu Sec.
España. consultado el 13 de noviembre de 2007, en:
http://www3.uji.es/~mmarques/f47/apun/apun.html Si no encuentras el documento, pulsa aquí.
Rob, Peter (2004). Sistemas de bases de datos: diseño, implementación y administración. (5ta ed.).
México, D.F.: Thomson.
Facultad de Estadística e Informática
Bases de Datos Distribuidas
Niveles de transparencia de una base de datos
distribuida
❖Transparencia de distribución.
❖Transparencia de transacción.
❖Transparencia de replicación.
❖Transparencia de falla.
❖Transparencia de desempeño.
❖Transparencia de heterogeneidad.
Facultad de Estadística e Informática
Bases de Datos Distribuidas
Niveles de transparencia de una base de datos
distribuida
❖Transparencia de replicación.
La transparencia de replicación de datos se refiere a que, si existen copias de
objetos de la base de datos, su existencia debe ser controlada por el sistema
no por el usuario.
Se debe tener en cuenta que cuando el usuario se encarga de manejar las réplicas
en un sistema, el trabajo de éste es mínimo por lo que se puede obtener una
eficiencia mayor. Sin embargo, el usuario puede olvidarse de mantener la
consistencia de las réplicas teniendo así datos diferentes.
Facultad de Estadística e Informática
Bases de Datos Distribuidas
Niveles de transparencia de una base de datos
distribuida
❖Transparencia de falla.
La transparencia de falla permite que el sistema continúe
operando en el caso de una falla de nodo. Las funciones que
se perdieron a causa de la falla serán recobradas por otro
nodo de la red.
Facultad de Estadística e Informática
Bases de Datos Distribuidas
Niveles de transparencia de una base de datos
distribuida
❖Transparencia
de falla y
replicación.
Facultad de Estadística e Informática
Bases de Datos Distribuidas
Niveles de transparencia de una base de datos
distribuida
❖Transparencia de distribución.
❖Transparencia de transacción.
❖Transparencia de replicación.
❖Transparencia de falla.
❖Transparencia de desempeño.
❖Transparencia de heterogeneidad.
Facultad de Estadística e Informática
Bases de Datos Distribuidas
Niveles de transparencia de una base de datos
distribuida
❖Transparencia de desempeño.
La transparencia de desempeño permite que cuando los objetos de la base de
datos están fragmentados, el sistema maneja la conversión de consultas de
usuario definidas sobre relaciones globales a consultas definidas sobre
fragmentos. Así también, mezcla las respuestas a consultas fragmentadas para
obtener una sola respuesta a una consulta global.
Facultad de Estadística e Informática
Bases de Datos Distribuidas
Niveles de transparencia de una base de datos
distribuida. Transparencia de desempeño.
❖Optimización de consultas
Reducir al mínimo el costo total asociado
con la ejecución de una solicitud.
Facultad de Estadística e Informática
Bases de Datos DistribuidasNiveles de
transparencia de una base de datos
distribuida. Transparencia de desempeño.
❖Optimización de consultas
¿Qué costo se desea reducir?
Facultad de Estadística e Informática
Bases de Datos DistribuidasNiveles de
transparencia de una base de datos
distribuida. Transparencia de desempeño.
❖Optimización de consultas
Los costos asociados con una solicitud son una función (Rob, 2004):
▪Del costo del tiempo de acceso (E/S) implicado al acceder los datos
físicos guardados en disco.
▪Del costo de comunicación asociado con la transmisión de datos
entre nodos en sistemas de base de datos distribuidos.
▪Del costo de tiempo de CPU asociado con la sobrecarga de
procesamiento de manejar transacciones distribuidas.
Facultad de Estadística e Informática
Bases de Datos DistribuidasNiveles de
transparencia de una base de datos
distribuida. Transparencia de desempeño.
❖Optimización de consultas
La mayoría de los algoritmos propuestos para una
optimización de consultas se basan en dos principios:
▪La selección del orden de ejecución óptimo.
▪La selección de los sitios a ser accedidos para reducir al
mínimo los costos de comunicación.
Facultad de Estadística e Informática
Bases de Datos DistribuidasNiveles de
transparencia de una base de datos
distribuida. Transparencia de desempeño.
❖Optimización de consultas
¿Cómo se evalúan los algoritmos de
optimización?
Facultad de Estadística e Informática
Bases de Datos DistribuidasNiveles de
transparencia de una base de datos
distribuida. Transparencia de desempeño.
❖Optimización de consultas
Un algoritmo de optimización de consulta puede
ser evaluado con base en su modo de operación o
en la temporización de su optimización
Facultad de Estadística e Informática
Bases de Datos DistribuidasNiveles de
transparencia de una base de datos
distribuida. Transparencia de desempeño.
❖Optimización de consultas
Los modos de operación se clasifican como manuales
o automáticos.
▪Optimización de consulta automática: el DDBMS
localiza la ruta de acceso más barata sin la
intervención del usuario.
▪Optimización de consulta manual: requiere que la
optimización sea seleccionada y programada por el
usuario o programador.
Facultad de Estadística e Informática
Bases de Datos DistribuidasNiveles de
transparencia de una base de datos
distribuida. Transparencia de desempeño.
❖Optimización de consultas
Los algoritmos de optimización de consultas
también se clasifican de acuerdo con el momento
en el que se realiza la optimización:
◦Estáticos
◦Dinámicos
Facultad de Estadística e Informática
Bases de Datos DistribuidasNiveles de
transparencia de una base de datos
distribuida. Transparencia de desempeño.
❖Optimización de consultas
▪En la optimización de consulta estática, la mejor estrategia de
optimización se selecciona cuando la consulta es compilada por
el DBMS.
▪Cuando el programa se somete para su compilación, crea el
plan necesario para acceder a la base de datos. Cuando se
ejecuta el programa, el DBMS utiliza ese plan para acceder a la
base de datos.
Facultad de Estadística e Informática
Bases de Datos DistribuidasNiveles de
transparencia de una base de datos
distribuida. Transparencia de desempeño.
❖Optimización de consultas
▪La optimización de consulta dinámica ocurre en tiempo de
ejecución.
▪La estrategia de acceso a la base de datos se define cuando
se ejecuta el programa.
▪Es eficiente, su costo se mide por sobrecarga de
procesamiento en tiempo de ejecución.
Facultad de Estadística e Informática
Bases de Datos DistribuidasNiveles de
transparencia de una base de datos
distribuida. Transparencia de desempeño.
❖Optimización de consultas
¿Cómo se optimizan las
consultas?
Facultad de Estadística e Informática
Bases de Datos DistribuidasNiveles de
transparencia de una base de datos
distribuida. Transparencia de desempeño.
❖Optimización de consultas
▪ Las técnicas de optimización de consultas se clasifican
de acuerdo con el tipo de información emitida para
optimizar la consulta
▪Basado en estadísticas
▪Basado en reglas
Facultad de Estadística e Informática
Bases de Datos DistribuidasNiveles de
transparencia de una base de datos
distribuida. Transparencia de desempeño.
❖Optimización de consultas
▪Basado en estadísticas.
Las estadísticas proporcionan información sobre características de la
base de datos tales como tamaño, número de registros, tiempo de
acceso promedio, número de solicitudes atendidas, número de
usuarios con derechos de acceso, etc.
Posteriormente estas estadísticas son utilizadas por el DBMS para
determinar la mejor estrategia de acceso.
Facultad de Estadística e Informática
Bases de Datos DistribuidasNiveles de
transparencia de una base de datos
distribuida. Transparencia de desempeño.
❖Optimización de consultas
▪Basado en reglas.
Se basa en un conjunto de reglas definidas por el usuario para
determinar la mejor estrategia de acceso a la consulta.
Las reglas son ingresadas por el usuario o el administrador de la
base de datos, y casi siempre son de naturaleza muy general.
Facultad de Estadística e Informática
Bases de Datos Distribuidas
Niveles de transparencia de una base de datos
distribuida
❖Transparencia de distribución.
❖Transparencia de transacción.
❖Transparencia de replicación.
❖Transparencia de falla.
❖Transparencia de desempeño.
❖Transparencia de heterogeneidad.
Facultad de Estadística e Informática
Bases de Datos Distribuidas
Niveles de transparencia de una base de datos
distribuida
❖Transparencia de heterogeneidad.
La transparencia de heterogeneidad permite la integración de
varios sistemas de administración de bases de datos locales
diferentes (relacional, de red, jerárquicos, multimedia, etc.)
conforme un esquema global común.
Facultad de Estadística e Informática
Bases de Datos Distribuidas
Niveles de
transparencia de
una base de datos
distribuida
❖Transparencia de
heterogeneidad.
Facultad de Estadística e Informática