Download 15.565 Integración de sistemas de información: 15.578
Document related concepts
Transcript
MASSACHUSETTS INSTITUTE OF TECHNOLOGY SLOAN SCHOOL OF MANAGEMENT 15.565 Integración de sistemas de información: Factores tecnológicos, organizativos y estratégicos 15.578 Sistemas de información globales: Comunicaciones y conectividad en sistemas de información Primavera 2002 Clase 15 BASES DE DATOS DISTRIBUIDAS HETEROGÉNEAS SISTEMA DE BOLSA GLOBAL DE NUEVA GENERACIÓN (FXX) • SISTEMAS DE COMERCIO NYC (x 20) Valores • Ingresos fijos LONDRES (x 20) SYDNEY (x 10) Ingresos Valores fijos Valores ... PREGUNTAS DE EJEMPLO: – ¿CUÁL ES LA PARTICIPACIÓN TOTAL DE “IBM”? – ¿Y EL TOTAL DE ACTIVOS EXPUESTOS AL “CAPITAL A LARGO PLAZO”? – ¿CUÁL ES EL TOTAL DE ACTIVOS EXPUESTOS ASOCIADOS A LA ECONOMÍA DE “BRASIL”? • OTRAS SITUACIONES SIMILARES: – – – – • RELACIONES DE CLIENTES ANÁLISIS DE BENEFICIOS (POR PRODUCTO, DEPARTAMENTO, ETC.) VISIBILIDAD DE ACTIVOS (INVENTARIO, EN TRÁNSITO, ETC.) ALMACENES DE DATOS (EN GENERAL) ¿POR QUÉ NO UTILIZAR UNA BASE DE DATOS MÁS GRANDE? CONFIGURACIONES DE POSIBLES “B. DE DATOS GLOBALES” B. DE DATOS REGIONALES SISTEMAS DE COMERCIO • • B.DATOS SISTEMAS GLOBAL DE COMERCIO B.DATOS GLOBAL SISTEMAS DE COMERCIO B.DATOS GLOBAL VIRTUAL VENTAJAS Y DESVENTAJAS DE CADA ENFOQUE COMPLICACIONES ADICIONALES – LOS SISTEMAS DE COMERCIO USAN HARDWARE Y S. OPERATIVOS DISTINTOS (MAINFRAMES, MINI, PC). – LOS SISTEMAS DE COMERCIO USAN SOFTWARE DE SISTEMA DE GESTIÓN DE BASE DE DATOS (DBMS) DISTINTOS → ENTORNO HETEROGÉNEO 3 SISTEMAS DE GESTIÓN DE BASES DE DATOS HETEROGÉNEAS (BASE DE DATOS GLOBAL VIRTUAL) INTERFAZ ÚNICA UNIFORME SISTEMA 1 BASE DE DATOS 1 JERÁRQUICA (MODELO DATOS) (P.EJ., IMS) [1970-80] • SISTEMAS "HEREDADOS" SISTEMA DE GESTIÓN DE BASE DE DATOS DISTRIBUIDA HETEROGÉNEA (DH DBMS) SISTEMA 2 BASE DE DATOS 2 RED (MODELO DATOS) (P.EJ., IDMS) [1980-90] SISTEMA 3 BASE DE DATOS 3 RELACIONAL (MODELO DATOS) (P.EJ., SQL) [1990-00] VARIOS ENFOQUES DE BASES DE DATOS DISTRIBUIDAS 1. MODO DE LOTES -- EXTRACCIONES PERIÓDICAS, SIN CONSULTAS AD HOC -- DESCARGA, BASES DE DATOS VIGILADAS, SNEAKER-NET BD este EIS BD oeste BD empresarial 2. INTERFAZ HETEROGÉNEA -- ACCESO EN LÍNEA A UNA ÚNICA BASE DE DATOS -- NO HAY INTEGRACIÓN DE BASES DE DATOS -- EL ACCESO USA UN MODELO DE DATOS; EL DBMS, OTRO -- P.EJ., INTERFAZ RELACIONAL AL SISTEMA DE RED (IDMS/R) IDMS/R Interfaz (SQL) relacional IDMS Interfaz (“nativa”) de red (a aplicaciones existentes) 5 VARIOS ENFOQUES DE BASES DE DATOS DISTRIBUIDAS (continuación) 3. INTEROPERABILIDAD -- ACCESO A VARIAS BASES DE DATOS; DBMS SIMILARES O DIFERENTES BD1 --SIN TRANSPARENCIA DE UBICACIÓN (IMS: inventario) -- ESQUEMAS NO INTEGRADOS BD2 (SQL: nómina) Interfaz SQL 4. PUERTA DE ENLACE -- INTEGRACIÓN PARCIAL: LA MAYORÍA DE DBMS HOMOGÉNEOS -- PUERTA DE ENLACE A DBMS HETEROGÉNEOS -- SIN CONSULTAS REALES DISTRIBUIDAS IBM BD2 Oracle/IBM Interfaz SQL Oracle/HP Oracle* 6 VARIOS ENFOQUES DE BASES DE DATOS DISTRIBUIDAS (continuación) 5. DDBMS HETEROGÉNEO -- ESQUEMA GLOBAL ÚNICO -- MODELO DE DATOS Y LENGUAJE DE CONSULTAS COMÚN -- ESQUEMA INTEGRADO -- CONSULTAS REALES DISTRIBUIDAS -- P.EJ., MULTIBASE 6. DDBMS FEDERALES DISTRIBUIDOS -- VARIOS ESQUEMAS -- AUTONOMÍA DE B. DATOS QUE LO COMPONEN -- CONSULTAS REALES DISTRIBUIDAS BASES DE DATOS REALES HETEROGÉNEAS = 5 Y 6 7 TAREAS REALIZADAS POR DHDBMS 1. ACEPTAR CONSULTAS ESTÁNDAR Y ACTUALIZAR PETICIONES 2. DIVIDIR AUTOMÁTICAMENTE LAS CONSULTAS PARA BASES DE DATOS INDEPENDIENTES 3. TRANSFORMAR EN SUBCONSULTAS EN EL LENGUAJE LOCAL ADECUADO DE CADA DBMS 4. FORMULAR SECUENCIAS DE EJECUCIÓN Y MOVIMIENTO DE DATOS (optimización) 5. RESOLVER INCOMPATIBILIDADES ENTRE BASES DE DATOS (P.EJ., DÓLARES, LIBRAS Y YENES) 6. RESOLVER INCOHERENCIAS EN LAS COPIAS DE LA MISMA INFORMACIÓN (P.EJ., GRAN VÍA, 77 e ILUSTRACIÓN, 50) 7. COMBINAR DATOS RECUPERADOS EN RESPUESTA CONSOLIDADA 8 COMENTARIOS Y RESTRICCIONES DE UN DHDBMS 1. LOS COMPONENTES SON SISTEMAS DBMS EXISTENTES, NO DISEÑADOS PARA FINES DE DDBMS 2. NO ES SENCILLO MODIFICAR LOS COMPONENTES – ¿POR QUÉ? 3. DEBE PODERSE AGREGAR Y ELIMINAR COMPONENTES EN EL DHDBMS 4. NOCIÓN DE "NO INTRUSIVO" 9 ENFOQUE DE ESQUEMA TRIPLE DHDBMS VISTAS DEL USUARIO (ESQUEMA EXTERNO) VISTAS NÓMINA PERSONAL PROYECTO MODELO GLOBAL DE DATOS (ESQUEMA CONCEPTUAL) ESQUEMAS INDEPENDIENTES HQ DIV 1 DIV 2 IMS IDMS SQL SISTEMAS DE ARCHIVOS LOCALES Y DBMS (ESQUEMA INTERNO) 10 EJEMPLO DE MULTIBASE Queremos: “SUMA DE TODOS LOS SALARIOS” (CONSULTA GLOBAL) (RESPUESTA CONSOLIDADA) GESTOR GLOBAL DE DATOS Red (CONSULTA DE SITIO ÚNICO) INTERFAZ DE RED INTERFAZ DE BASE DE DATOS LOCAL (LDI) OPTIMIZADOR TRADUCTOR (LENGUAJE COMÚN/GLOBAL) INTERFAZ DE RED (DATOS FORMATEADOS) FORMATEADOR DE DATOS (DATOS ORIGINALES)) OPTIMIZADOR TRADUCTOR FORMATEADOR DE DATOS INTERFAZ DE HOST INTERFAZ DE HOST DBMS LOCAL 1 DBMS LOCAL N NY, EE.UU. BD 1 (IMS) Salario ( $ ) TOKYO, JAPÓN BD 2 (SQL) Salario 11 CAPACIDADES DE MULTIBASE • MULTIBASE: – INTERFAZ UNIFORME DE RECUPERACIÓN (DAPLEX) – LENGUAJE ÚNICO DE CONSULTAS – BASES DE DATOS DISTRIBUIDAS HETEROGÉNEAS YA EXISTENTES • OBJETIVOS: GENERALIDAD, COMPATIBILIDAD Y EXTENSIBILIDAD • NO INTRUSIVA: SIN NECESIDAD DE CAMBIOS EN LOS DBMS SUBYACENTES, EN LOS SISTEMAS DE ARCHIVOS NI EN LAS APLICACIONES • CAPACIDADES: – INTEGRACIÓN DE ESQUEMAS -- DEFINE VISTAS GLOBALES A PARTIR DE ESQUEMAS LOCALES –TRATAMIENTO DE DATOS INCOMPATIBLES -- MANTIENE Y REFUERZA REGLAS PARA SOLUCIONAR DIFERENCIAS – OPTIMIZACIÓN DE CONSULTAS -- OPTIMIZA LOCAL Y GLOBALMENTE (COMPENSA LAS LIMITACIONES LOCALES DEL SISTEMA) – TRADUCCIÓN DE CONSULTAS -- TRADUCE DESDE DAPLEX A 12 LENGUAJES LOCALES DE CONSULTA INCOMPATIBILIDADES DEL ESQUEMA • PROBLEMAS (SE TRATARÁN EN LA SIGUIENTE SESIÓN) -- DIFERENCIAS EN: -- CONVENCIÓN DE NOMENCLATURA -- ESTRUCTURAS DE DATOS SUBYACENTES -- REPRESENTACIONES (masc./fem., hombre/mujer, M/F, 0/1) -- ESCALAS/UNIDADES -- DATOS PERDIDOS -- VALORES DE DATOS CONFLICTIVOS • SOLUCIONES: (MULTIBASE) – EL MECANISMO DE VISTAS CON CAMBIO DE NOMBRE, REESTRUCTURACIÓN LÓGICA Y CONVERSIÓN DE ESCALAS PUEDE RESOLVER LOS PROBLEMAS DE "DIFERENCIAS" – ES POSIBLE ADJUNTAR LA BASE DE DATOS AUXILIAR AL ESQUEMA UNIFICADO PARA SOLUCIONAR OTROS DOS TIPOS DE PROBLEMAS 13 PROCESAMIENTO DE CONSULTAS • • PROBLEMAS -- USA PROCESAMIENTO PARALELO Y MINIMIZA LOS COSTES DE COMUNICACIÓN -- PROBLEMAS: -- LOS COSTES DE CONSULTAS LOCALES CAMBIAN SEGÚN EL SITIO -- MUCHOS DBMS NO ADMITEN LA CREACIÓN DE B. DE DATOS TEMPORALES CON GDM -- ES POSIBLE QUE LAS CAPACIDADES DE CONSULTA DE B. DE DATOS ESTÉN LIMITADAS -- LOS DBMS LOCALES DISPONEN DE DISTINTAS CAPACIDADES DE OPTIMIZACIÓN SOLUCIONES/ALTERNATIVAS -- ALTERNATIVA 1: CONSULTA GLOBAL -> SUBCONSULTA DE SITIO ÚNICO MÁS PEQUEÑA -- PUEDEN SER VARIAS SUBCONSULTAS EN UN SITIO Y UNIR RESULTADOS EN GDM -- MAYOR TRABAJO DE GDM Y COMUNICACIÓN, PERO MÁS SENCILLO -- ALTERNATIVA 2: CONSULTA GLOBAL -> SUBCONSULTA DE SITIO ÚNICO MÁS GRANDE -- MENOS TRABAJO DE UNIÓN, MENOR COMUNICACIÓN -- MAYOR SOFISTICACIÓN LDI NECESARIA -- ALTERNATIVA 3:GENERAR PLAN EFICAZ, EL LDI PARTICIPA EN LA OPTIMIZACIÓN GLOBAL -- SE ENVÍAN LOS RESULTADOS PARCIALES AL GDM O A OTROS LDI -- LOS LDI DEBEN ADMITIR ORDENACIÓN, ELIMINACIÓN DE DUPLICADOS Y UNIÓN TEMPORAL -- MENOS TRABAJO PARA GDM, MENOR COMUNICACIÓN -- GDM Y LDI COMPLEJOS 14 GESTIÓN DE TRANSACCIONES (ACTUALIZACIONES COMPLEJAS) • PROBLEMAS -- DBMS DISTINTOS -- DISTINTOS MÉTODOS DE CONTROL DE CONCURRENCIA -- DIFERENCIAS DE IMPLEMENTACIÓN: -- TRATAMIENTO DE INTERBLOQUEO Y BLOQUEO DE GRANULARIDAD -- LOS PROTOCOLOS DE COMPROMISO PUEDEN VARIAR -- LA DETECCIÓN GLOBAL DE INTERBLOQUEOS ES DIFÍCIL -- LOS PROCESOS LOCALES IGNORAN LAS TRANSACCIONES NO LOCALES -- LOS PROCESOS LOCALES IGNORAN LAS TRANSACCIONES LOCALES • SOLUCIONES/ALTERNATIVAS -- PERMITIR SÓLO LECTURA, NO ESCRITURA. EVITA PROBLEMA DE CONTROL DE CONCURRENCIA -- PERMITIR SÓLO ACTUALIZACIONES DE SITIOS ÚNICOS -- USAR MECANISMOS LOCALES DE CONTROL DE CONCURRENCIA -- ASUMIR QUE TODOS LOS DBMS OFRECEN BLOQUEO Y COMPROMISO DE DOS FASES -- DETECTAR CONFLICTOS MEDIANTE EL TIEMPO DE ESPERA -- PERMITIR ACTUALIZACIONES DE SITIOS MÚLTIPLES -- PUEDE SER NECESARIO MODIFICAR LOS DBMS Y SO LOCALES 15 RESUMEN • LAS B. DE DATOS DISTRIBUIDAS HETEROGÉNEAS SON UNA REALIDAD EN MUCHAS ORGANIZACIONES - PARA BIEN O PARA MAL • LA MAYORÍA DE ENFOQUES BUSCAN AGREGAR Y COORDINAR EL ACCESO -- SON AD-HOC • LOS SISTEMAS DE GESTIÓN DE BASES DE DATOS DISTRIBUIDAS HETEROGÉNEAS (DHDBMS) ESTÁN SURGIENDO PARA ATENDER ESTAS NECESIDADES 16