Download 15.565 Integración de sistemas de información: 15.578

Document related concepts

Open Database Connectivity wikipedia , lookup

NewSQL wikipedia , lookup

Base de datos wikipedia , lookup

SQL wikipedia , lookup

Base de datos temporal wikipedia , lookup

Transcript
MASSACHUSETTS INSTITUTE OF TECHNOLOGY
SLOAN SCHOOL OF MANAGEMENT
15.565 Integración de sistemas de información:
Factores tecnológicos, organizativos y estratégicos
15.578 Sistemas de información globales:
Comunicaciones y conectividad en sistemas de información
Primavera 2002
Clase 15
BASES DE DATOS DISTRIBUIDAS
HETEROGÉNEAS
SISTEMA DE BOLSA GLOBAL DE NUEVA GENERACIÓN (FXX)
• SISTEMAS DE COMERCIO
NYC (x 20)
Valores
•
Ingresos
fijos
LONDRES (x 20)
SYDNEY (x 10)
Ingresos
Valores
fijos
Valores
...
PREGUNTAS DE EJEMPLO:
– ¿CUÁL ES LA PARTICIPACIÓN TOTAL DE “IBM”?
– ¿Y EL TOTAL DE ACTIVOS EXPUESTOS AL “CAPITAL A LARGO PLAZO”?
– ¿CUÁL ES EL TOTAL DE ACTIVOS EXPUESTOS ASOCIADOS A LA ECONOMÍA DE “BRASIL”?
•
OTRAS SITUACIONES SIMILARES:
–
–
–
–
•
RELACIONES DE CLIENTES
ANÁLISIS DE BENEFICIOS (POR PRODUCTO, DEPARTAMENTO, ETC.)
VISIBILIDAD DE ACTIVOS (INVENTARIO, EN TRÁNSITO, ETC.)
ALMACENES DE DATOS (EN GENERAL)
¿POR QUÉ NO UTILIZAR UNA BASE DE DATOS MÁS GRANDE?
CONFIGURACIONES DE POSIBLES “B. DE DATOS GLOBALES”
B. DE DATOS
REGIONALES
SISTEMAS
DE COMERCIO
•
•
B.DATOS
SISTEMAS
GLOBAL
DE COMERCIO
B.DATOS
GLOBAL
SISTEMAS
DE COMERCIO
B.DATOS
GLOBAL
VIRTUAL
VENTAJAS Y DESVENTAJAS DE CADA ENFOQUE
COMPLICACIONES ADICIONALES
– LOS SISTEMAS DE COMERCIO USAN HARDWARE Y S. OPERATIVOS DISTINTOS
(MAINFRAMES, MINI, PC).
– LOS SISTEMAS DE COMERCIO USAN SOFTWARE DE SISTEMA DE GESTIÓN DE BASE
DE DATOS (DBMS) DISTINTOS
→ ENTORNO HETEROGÉNEO
3
SISTEMAS DE GESTIÓN DE BASES DE DATOS HETEROGÉNEAS
(BASE DE DATOS GLOBAL VIRTUAL)
INTERFAZ
ÚNICA
UNIFORME
SISTEMA
1
BASE DE
DATOS 1
JERÁRQUICA
(MODELO DATOS)
(P.EJ., IMS)
[1970-80]
• SISTEMAS "HEREDADOS"
SISTEMA
DE GESTIÓN DE
BASE DE DATOS
DISTRIBUIDA
HETEROGÉNEA
(DH DBMS)
SISTEMA
2
BASE DE
DATOS 2
RED
(MODELO DATOS)
(P.EJ., IDMS)
[1980-90]
SISTEMA
3
BASE DE
DATOS 3
RELACIONAL
(MODELO DATOS)
(P.EJ., SQL)
[1990-00]
VARIOS ENFOQUES DE BASES DE DATOS DISTRIBUIDAS
1. MODO DE LOTES -- EXTRACCIONES PERIÓDICAS, SIN CONSULTAS AD HOC
-- DESCARGA, BASES DE DATOS VIGILADAS, SNEAKER-NET
BD este
EIS
BD oeste
BD empresarial
2. INTERFAZ HETEROGÉNEA -- ACCESO EN LÍNEA A UNA ÚNICA
BASE DE DATOS
-- NO HAY INTEGRACIÓN DE BASES DE DATOS
-- EL ACCESO USA UN MODELO DE DATOS; EL DBMS, OTRO
-- P.EJ., INTERFAZ RELACIONAL AL SISTEMA DE RED (IDMS/R)
IDMS/R
Interfaz (SQL)
relacional
IDMS
Interfaz (“nativa”) de red
(a aplicaciones existentes)
5
VARIOS ENFOQUES DE BASES DE DATOS DISTRIBUIDAS
(continuación)
3. INTEROPERABILIDAD -- ACCESO A VARIAS BASES DE DATOS; DBMS SIMILARES O DIFERENTES
BD1
--SIN TRANSPARENCIA DE UBICACIÓN
(IMS: inventario)
-- ESQUEMAS NO INTEGRADOS
BD2
(SQL: nómina)
Interfaz
SQL
4. PUERTA DE ENLACE -- INTEGRACIÓN PARCIAL:
LA MAYORÍA DE DBMS HOMOGÉNEOS
-- PUERTA DE ENLACE A DBMS HETEROGÉNEOS
-- SIN CONSULTAS REALES DISTRIBUIDAS
IBM
BD2
Oracle/IBM
Interfaz
SQL
Oracle/HP
Oracle*
6
VARIOS ENFOQUES DE BASES DE DATOS DISTRIBUIDAS
(continuación)
5. DDBMS HETEROGÉNEO
-- ESQUEMA GLOBAL ÚNICO
-- MODELO DE DATOS Y LENGUAJE DE CONSULTAS COMÚN
-- ESQUEMA INTEGRADO
-- CONSULTAS REALES DISTRIBUIDAS
-- P.EJ., MULTIBASE
6. DDBMS FEDERALES DISTRIBUIDOS
-- VARIOS ESQUEMAS
-- AUTONOMÍA DE B. DATOS QUE LO COMPONEN
-- CONSULTAS REALES DISTRIBUIDAS
BASES DE DATOS REALES HETEROGÉNEAS = 5 Y 6
7
TAREAS REALIZADAS POR DHDBMS
1. ACEPTAR CONSULTAS ESTÁNDAR Y ACTUALIZAR PETICIONES
2. DIVIDIR AUTOMÁTICAMENTE LAS CONSULTAS PARA
BASES DE DATOS INDEPENDIENTES
3. TRANSFORMAR EN SUBCONSULTAS EN EL LENGUAJE LOCAL
ADECUADO DE CADA DBMS
4. FORMULAR SECUENCIAS DE EJECUCIÓN Y MOVIMIENTO DE
DATOS (optimización)
5. RESOLVER INCOMPATIBILIDADES ENTRE BASES DE DATOS
(P.EJ., DÓLARES, LIBRAS Y YENES)
6. RESOLVER INCOHERENCIAS EN LAS COPIAS DE LA MISMA
INFORMACIÓN (P.EJ., GRAN VÍA, 77 e ILUSTRACIÓN, 50)
7. COMBINAR DATOS RECUPERADOS EN RESPUESTA CONSOLIDADA
8
COMENTARIOS Y RESTRICCIONES DE UN DHDBMS
1. LOS COMPONENTES SON SISTEMAS DBMS EXISTENTES, NO
DISEÑADOS PARA FINES DE DDBMS
2. NO ES SENCILLO MODIFICAR LOS COMPONENTES
– ¿POR QUÉ?
3. DEBE PODERSE AGREGAR Y ELIMINAR COMPONENTES EN EL
DHDBMS
4. NOCIÓN DE "NO INTRUSIVO"
9
ENFOQUE DE ESQUEMA TRIPLE DHDBMS
VISTAS DEL USUARIO (ESQUEMA EXTERNO)
VISTAS
NÓMINA
PERSONAL
PROYECTO
MODELO GLOBAL DE DATOS
(ESQUEMA CONCEPTUAL)
ESQUEMAS
INDEPENDIENTES
HQ
DIV 1
DIV 2
IMS
IDMS
SQL
SISTEMAS DE ARCHIVOS LOCALES Y DBMS
(ESQUEMA INTERNO)
10
EJEMPLO DE MULTIBASE
Queremos: “SUMA DE
TODOS LOS SALARIOS”
(CONSULTA GLOBAL)
(RESPUESTA CONSOLIDADA)
GESTOR GLOBAL
DE DATOS
Red
(CONSULTA DE
SITIO ÚNICO)
INTERFAZ DE RED
INTERFAZ
DE BASE DE
DATOS LOCAL
(LDI)
OPTIMIZADOR
TRADUCTOR
(LENGUAJE COMÚN/GLOBAL)
INTERFAZ DE RED
(DATOS
FORMATEADOS)
FORMATEADOR
DE DATOS
(DATOS
ORIGINALES))
OPTIMIZADOR
TRADUCTOR
FORMATEADOR
DE DATOS
INTERFAZ DE HOST
INTERFAZ DE HOST
DBMS
LOCAL 1
DBMS
LOCAL N
NY, EE.UU.
BD 1
(IMS)
Salario ( $ )
TOKYO, JAPÓN
BD 2
(SQL)
Salario
11
CAPACIDADES DE MULTIBASE
• MULTIBASE:
– INTERFAZ UNIFORME DE RECUPERACIÓN (DAPLEX)
– LENGUAJE ÚNICO DE CONSULTAS
– BASES DE DATOS DISTRIBUIDAS HETEROGÉNEAS YA EXISTENTES
• OBJETIVOS: GENERALIDAD, COMPATIBILIDAD Y EXTENSIBILIDAD
• NO INTRUSIVA: SIN NECESIDAD DE CAMBIOS EN LOS DBMS SUBYACENTES, EN LOS SISTEMAS DE ARCHIVOS NI EN LAS APLICACIONES
• CAPACIDADES:
– INTEGRACIÓN DE ESQUEMAS -- DEFINE VISTAS GLOBALES A PARTIR
DE ESQUEMAS LOCALES
–TRATAMIENTO DE DATOS INCOMPATIBLES -- MANTIENE Y REFUERZA
REGLAS PARA SOLUCIONAR DIFERENCIAS
– OPTIMIZACIÓN DE CONSULTAS -- OPTIMIZA LOCAL Y GLOBALMENTE
(COMPENSA LAS LIMITACIONES LOCALES DEL SISTEMA)
– TRADUCCIÓN DE CONSULTAS -- TRADUCE DESDE DAPLEX A 12
LENGUAJES LOCALES DE CONSULTA
INCOMPATIBILIDADES DEL ESQUEMA
• PROBLEMAS (SE TRATARÁN EN LA SIGUIENTE SESIÓN)
-- DIFERENCIAS EN:
-- CONVENCIÓN DE NOMENCLATURA
-- ESTRUCTURAS DE DATOS SUBYACENTES
-- REPRESENTACIONES (masc./fem., hombre/mujer, M/F, 0/1)
-- ESCALAS/UNIDADES
-- DATOS PERDIDOS
-- VALORES DE DATOS CONFLICTIVOS
• SOLUCIONES: (MULTIBASE)
– EL MECANISMO DE VISTAS CON CAMBIO DE NOMBRE, REESTRUCTURACIÓN
LÓGICA Y CONVERSIÓN DE ESCALAS PUEDE RESOLVER
LOS PROBLEMAS DE "DIFERENCIAS"
– ES POSIBLE ADJUNTAR LA BASE DE DATOS AUXILIAR AL ESQUEMA
UNIFICADO PARA SOLUCIONAR OTROS DOS TIPOS DE PROBLEMAS
13
PROCESAMIENTO DE CONSULTAS
•
•
PROBLEMAS
-- USA PROCESAMIENTO PARALELO Y MINIMIZA LOS COSTES DE COMUNICACIÓN
-- PROBLEMAS:
-- LOS COSTES DE CONSULTAS LOCALES CAMBIAN SEGÚN EL SITIO
-- MUCHOS DBMS NO ADMITEN LA CREACIÓN DE B. DE DATOS TEMPORALES CON GDM
-- ES POSIBLE QUE LAS CAPACIDADES DE CONSULTA DE B. DE DATOS ESTÉN LIMITADAS
-- LOS DBMS LOCALES DISPONEN DE DISTINTAS CAPACIDADES DE OPTIMIZACIÓN
SOLUCIONES/ALTERNATIVAS
-- ALTERNATIVA 1: CONSULTA GLOBAL -> SUBCONSULTA DE SITIO ÚNICO MÁS PEQUEÑA
-- PUEDEN SER VARIAS SUBCONSULTAS EN UN SITIO Y UNIR RESULTADOS EN GDM
-- MAYOR TRABAJO DE GDM Y COMUNICACIÓN, PERO MÁS SENCILLO
-- ALTERNATIVA 2: CONSULTA GLOBAL -> SUBCONSULTA DE SITIO ÚNICO MÁS GRANDE
-- MENOS TRABAJO DE UNIÓN, MENOR COMUNICACIÓN
-- MAYOR SOFISTICACIÓN LDI NECESARIA
-- ALTERNATIVA 3:GENERAR PLAN EFICAZ, EL LDI PARTICIPA EN LA OPTIMIZACIÓN GLOBAL
-- SE ENVÍAN LOS RESULTADOS PARCIALES AL GDM O A OTROS LDI -- LOS LDI DEBEN ADMITIR ORDENACIÓN, ELIMINACIÓN DE DUPLICADOS Y UNIÓN TEMPORAL
-- MENOS TRABAJO PARA GDM, MENOR COMUNICACIÓN
-- GDM Y LDI COMPLEJOS
14
GESTIÓN DE TRANSACCIONES (ACTUALIZACIONES COMPLEJAS)
• PROBLEMAS
-- DBMS DISTINTOS -- DISTINTOS MÉTODOS DE CONTROL DE CONCURRENCIA
-- DIFERENCIAS DE IMPLEMENTACIÓN:
-- TRATAMIENTO DE INTERBLOQUEO Y BLOQUEO DE GRANULARIDAD
-- LOS PROTOCOLOS DE COMPROMISO PUEDEN VARIAR
-- LA DETECCIÓN GLOBAL DE INTERBLOQUEOS ES DIFÍCIL
-- LOS PROCESOS LOCALES IGNORAN LAS TRANSACCIONES NO LOCALES
-- LOS PROCESOS LOCALES IGNORAN LAS TRANSACCIONES LOCALES
• SOLUCIONES/ALTERNATIVAS
-- PERMITIR SÓLO LECTURA, NO ESCRITURA. EVITA PROBLEMA DE CONTROL DE CONCURRENCIA
-- PERMITIR SÓLO ACTUALIZACIONES DE SITIOS ÚNICOS
-- USAR MECANISMOS LOCALES DE CONTROL DE CONCURRENCIA
-- ASUMIR QUE TODOS LOS DBMS OFRECEN BLOQUEO Y COMPROMISO DE DOS FASES
-- DETECTAR CONFLICTOS MEDIANTE EL TIEMPO DE ESPERA
-- PERMITIR ACTUALIZACIONES DE SITIOS MÚLTIPLES
-- PUEDE SER NECESARIO MODIFICAR LOS DBMS Y SO LOCALES
15
RESUMEN
• LAS B. DE DATOS DISTRIBUIDAS HETEROGÉNEAS SON UNA
REALIDAD EN MUCHAS ORGANIZACIONES - PARA BIEN O PARA MAL
• LA MAYORÍA DE ENFOQUES BUSCAN AGREGAR Y
COORDINAR EL ACCESO -- SON AD-HOC
• LOS SISTEMAS DE GESTIÓN DE BASES DE DATOS DISTRIBUIDAS
HETEROGÉNEAS (DHDBMS) ESTÁN SURGIENDO PARA ATENDER
ESTAS NECESIDADES
16