Download Bases de Datos Avanzadas - Departamento de Ingeniería de

Document related concepts
Transcript
Bases de Datos Avanzadas
Introducción
Curso Maestría
Por
Elizabeth León Guzmán, Ph.D.
Profesora Asociada
Ingeniería de Sistemas
Grupo de Investigación MIDAS
TABD - Introducción
Agenda
1. ¿Qué son Bases de Datos?
Datos, Información, Conocimiento
2. Modelos de Bases de Datos
E/R
3. Integracion de Datos
4. Análisis de Datos
5. Recuperación de Datos
TABD - Introducción
¿Qué es un dato?
Hecho individual acerca de algo de interés para alguien
TABD - Introducción
¿Qué es información?
Datos relacionados
TABD - Introducción
Los datos son la materia prima bruta
INFORMACIÓN
TABD - Introducción
Generación de Datos
Comercial
Web (e-commerce)

Supermercados(compras)

Bancos (transacciones con tarjetas)

TABD - Introducción
Generación de Datos
Científico
Satélites (sensores)

Telescopios

Microarrays (información genética)

Simulaciones

TABD - Introducción
Datos
Datos almacenados
Bases de datos

Web

Archivos (excel, pdf, txt, etc)

TABD - Introducción
Modelo Relacional
TABD - Introducción
KDD
Descubrimiento de Conocimiento en Bases de Datos
Nos referimos al
Conocimiento
TABD - Introducción
¿Qué es conocimiento?
Información co-relacionada
Patrones!
TABD - Introducción
Información
Algo peor que no
tener información
disponible es tener
mucha información
Y no saber qué
hacer con ella.
TABD - Introducción
KDD
Descubrimiento de Conocimiento en Bases de Datos
TABD - Introducción
Necesidad de Análisis
“Conocimiento”
●
●
●
Entender mejor el ambiente
Seguimiento a transacciones diarias: evaluar como funciona la
organización
Evaluaciones y estrategías tácticas:
● Promociones
● Porción del mercado controlado
● Atracción de nuevos clientes
● Globalización
● Ambiente cultural
● Tecnología
TABD - Introducción
BD
BD
BD
BD
BD
BD
INTEGRAR
ANALIZAR
Descripción,
Algoritmos inteligentes
Grandes repositorios
RECUPERAR
Optimización
TABD - Introducción
Integrar Información
BODEGA
BODEGA
DE
DE
DATOS
DATOS
TABD - Introducción
Bodegas de Datos
Data Warehousing
TABD - Introducción
Estructura del Proceso de Acceso a
Datos y Entrega de Información en BI
Data Quality
Fuentes
de datos
OLAP
ETLC
Calidad de datos
Diseño y Construcción
Modelos OLAP
Data
Data
Warehouse
Warehouse
Modelos Molap / Rolap
Metadata Integrada para Acceder Bases de Datos y Fuentes OLAP
Análisis OLAP
Agregaciones
Reportes y Consultas
Score Cards
Minería de datos
Analizar Información
Análisis Exploratorio
Minería de Datos
TABD - Introducción
Análisis Exploratorio
Hacer uso de las habilidades humanas para el
reconocimiento de patrones.
Una imagen vale más que mil palabras.
l
l
l
l
l
Histogramas
Gráficas de Dispersión
10th
percentile
75th
percentile
50th
percentile
25th
percentile
10th
percentile
Gráficas de Caja
TABD - Introducción
OLAP
TABD - Introducción
Minería de Datos
Uso de métodos inteligentes para extraer conocimiento
(búsqueda de oro!)
oro! .
Datos
Minería
de
datos
Conocimiento
TABD - Introducción
Minería de datos
Paso del KDD,
Que descubre “conocimiento” en grandes conjunto de datos
Usa métodos como:
Estadistica
Aprendizaje
de Máquina
Mineria
Mineriade
dedatos
datos
Inteligencia
artificial
Bases de
datos
TABD - Introducción
Minería de datos
No es…
• Buscar un número telefónico en un directorio
• Buscar en Google
• Generar histogramas de salarios por grupos de edades
diferentes
TABD - Introducción
Minería de datos
es…
• Encontrar grupos de personas con similares hobbies.
• ¿Hay mas probabilidad de desarrollar cáncer si se vive
cerca de una línea de poder?
TABD - Introducción
Inteligencia de Negocios
(BI)
Integración
Análisis
TABD - Introducción
Estructura del Proceso de Acceso a
Datos y Entrega de Información en BI
Data Quality
Fuentes
de datos
OLAP
ETLC
Calidad de datos
Diseño y Construcción
Modelos OLAP
Data
Data
Warehouse
Warehouse
Modelos Molap / Rolap
Metadata Integrada para Acceder Bases de Datos y Fuentes OLAP
Análisis OLAP
Agregaciones
Reportes y Consultas
Score Cards
Minería de datos
Recuperar Información
Consultas (queries) sobre los repositorios de datos
Texto
Audio
Video
imagenes
Indices
DB
Información
estructurada
Datos estructurados
Datos no estructurados
TABD - Introducción
Sistemas de Recuperación
de Información
Query
System
(Db,
www,etc)
Query
System
query
matched to
object stored
Top ranking objects
System
Ranking objects
Query refined
System
(Db,
www,etc)
TABD - Introducción
Aplicaciones IR
Bibliotecas digitales: acceso a libros, revistas, etc.
Motores de búsqueda (search engines) tales como: Google, Yahoo
search y Live Search (MSN Search)
TABD - Introducción
Optimización: Indices
TABD - Introducción