Download Clase 3 - Apuntes DUOC / FrontPage

Document related concepts

Normalización de bases de datos wikipedia , lookup

Cuarta forma normal wikipedia , lookup

Base de datos objeto wikipedia , lookup

Primera forma normal wikipedia , lookup

Base de datos relacional wikipedia , lookup

Transcript
SQL Server
Aplicado
Rocío Contreras Águila
Primer Semestre 2010
- Conceptos Básicos
- Intro a SQL Server
¿Qué es una base de datos?
Una base de datos es un programa residente en memoria,
que se encarga de gestionar todo el tratamiento de
entrada, salida, protección y elaboración de la información
que almacena.
Conceptos Básicos

El corazón de una base de datos es el motor, que es el
programa que debe estar ejecutándose en una máquina
para gestionar los datos.
Funciones de las bases de datos

a) Permitir la introducción de datos.

b) Salida de datos.

c) Almacenamiento de datos.

d) Protección de datos

e) Elaboración de datos.
Funciones de las bases de datos
Modelo de Datos

Un modelo de datos es un lenguaje orientado a describir
una Base de Datos.

Permite describir los elementos que intervienen en una
realidad dada y la forma en que se relacionan esos
elementos entre sí.
Modelo de Datos

Es una representación de la realidad que contiene las
características generales de algo que se va a realizar. En
base de datos, esta representación la elaboramos de
forma gráfica.
Modelo de Datos

Es una colección de herramientas conceptuales para
describir los datos, las relaciones que existen entre ellos,
semántica asociada a los datos y restricciones de
consistencia.
Objetivos

Formalización: definir formalmente las estructuras
permitidas y las restricciones a fin de representar los
datos de un SI.

Diseño: el modelo resultante es un elemento básico para
el desarrollo de la metodología de diseño de la base de
datos.
Sub Lenguajes

Un modelo de datos es un lenguaje que, típicamente,
tiene dos sublenguajes:

Un Lenguaje de Definición de Datos o DDL (Data definition
Language), orientado a describir de una forma abstracta las
estructuras de datos y las restricciones de integridad.
Sub Lenguajes

Un Lenguaje de Manipulación de Datos o DML (Data
Manipulation Language), orientado a describir las
operaciones de manipulación de los datos.

A la parte del DML orientada a la recuperación de datos,
usualmente se le llama Lenguaje de Consulta o QL
(Query Language).
Concepto de tabla

Una tabla es una estructura lógica que sirve para
almacenar los datos de un mismo tipo, esto es, en una
misma estructura.

Una tabla se compone de campos o columnas, que son
conjuntos de datos del mismo tipo
Concepto de tabla
Base de Datos Relacional

Es un conjunto de una o más tablas estructuradas en
registros (líneas) y campos (columnas), que se vinculan
entre sí por un campo en común.
Normalización

Las bases de datos relacionales pasan por un proceso al
que se le conoce como normalización de una base de
datos, el cual es entendido como el proceso necesario
para que una base de datos sea utilizada de manera
óptima.
Ventajas

Garantiza herramientas para evitar la duplicidad de
registros, a través de campos claves o llaves.

Garantiza la integridad referencial: Así al eliminar un
registro elimina todos los registros relacionados
dependientes.

Favorece la normalización por ser más comprensible y
aplicable.
Normalización

Las Formas Normales buscan optimizar las estructuras
de una base de datos eliminando la redundancia utilizando
como medio principal las dependencias funcionales.
Ejemplo para aplicar FN

Tenemos una empresa pública donde los puestos de
trabajo están regulados por el Estado, de modo que las
condiciones salariales están determinadas por el puesto.
Se ha creado el siguiente esquema relacional

EMPLEADOS(nss, nombre, puesto, salario, emails) con nss
como clave primaria.
Ejemplo para aplicar FN
Normalización:1FN

Una tabla está en 1FN si sus atributos contienen valores
atómicos.

En el ejemplo, podemos ver que el atributo emails puede
contener más de un valor, por lo que viola 1FN.

En general, tenemos una relación R con clave primaria K. Si
un atributo M viola la condición de 1FN, tenemos dos
opciones.
Normalización:1FN

Solución 1, duplicar los valores repetidos:Siguiendo el ejemplo,
tendríamos el siguiente esquema para la nueva tabla
EMPLEADOS'(a) con clave primaria (nss, email):
Normalización:1FN

Solución 2: separar el atributo que viola 1FN en una tabla:
tendríamos el siguiente esquema para la nueva tabla
EMPLEADOS'(b)
Normalización:1FN

Y además tendríamos una nueva tabla EMAILS con clave
primaria (nss, email):
Normalización: 2FN

Un esquema está en 2FN si:

Está en 1FN.

Todos sus atributos que no son de la clave principal
tienen dependencia funcional completa respecto de todas
las claves existentes en el esquema. En otras palabras,
para determinar cada atributo no clave se necesita la
clave primaria completa, no vale con una subclave.
Normalización: 2FN

La 2FN se aplica a las relaciones que tienen claves
primarias compuestas por dos o más atributos.

Si una relación está en 1FN y su clave primaria es simple
(tiene un solo atributo), entonces también está en 2FN.
Normalización: 2FN

Por tanto, de las soluciones anteriores, la tabla
EMPLEADOS'(b) está en 1FN (y la tabla EMAILS no tiene
atributos no clave), por lo que el esquema está en 2FN.

Sin embargo, tenemos que examinar las dependencias
funcionales de los atributos no clave de EMPLEADOS'(a).
Normalización: 2FN




Las dependencias funcionales que tenemos son las
siguientes:
nss->nombre, salario, email
puesto->salario
Como la clave es (nss, email), las dependencias de
nombre, salario y email son incompletas, por lo que la
relación no está en 2FN.
Normalización: 3FN

Una relación está en tercera forma normal si, y sólo si:

está en 2FN

y, además, cada atributo que no está incluido en la clave
primaria no depende transitivamente de la clave primaria.

Por lo tanto, a partir de un esquema en 2FN, tenemos
que buscar dependencias funcionales entre atributos que
no estén en la clave
Normalización: 3FN

En general, tenemos que buscar dependencias transitivas
de la clave, es decir, secuencias de dependencias como la
siguiente: K->A y A->B, donde A y B no pertenecen a la
clave.

La solución a este tipo de dependencias está en separar
en una tabla adicional N el/los atributos B, y poner como
clave primaria de N el atributo que define la transitividad
A.
Normalización: 3FN




Siguiendo el ejemplo anterior, podemos detectar la
siguiente transitividad:
nss->puesto
puesto->salario
Por lo tanto la descomposición sería la siguiente:
En la nueva tabla PUESTOS, la
clave sería el puesto, que
también queda como clave
ajena referenciando la tabla
EMPLEADOS. El resto de las
tablas quedan como estaban.
Normalización: 4FN

Cuarta Forma Normal (4NF): Una fila no debe contener
dos o más campos multi-valorados (aquellos que pueden
contener más de un valor simultáneamente) sobre una
entidad.

La definición de la 4NF confía en la noción de una
dependencia multivalor. Una tabla con una dependencia
multivalor es una donde la existencia de dos o más
relaciones independientes muchos a muchos causa
redundancia; y es esta redundancia la que es suprimida
por la cuarta forma normal.
Normalización: 4FN
Normalización:5FN

Una tabla se dice que está en 5NF si y sólo si está en 4NF
y cada dependencia de unión (join) en ella es por las
llaves candidato.
Normalización:5FN
Concepto de Relación

Se denomina relación a todo aquellos vínculos que
establecen unas tablas con otras, debidos a la aplicación
de las formas normales.
Propiedades de las relaciones

Cada relación tiene un nombre y éste es distinto del
nombre de todas las demás. En el modelo relacional este
nombre es intrínseco, no se identifica como otra entidad.

Los valores de los atributos son atómicos: en cada tupla,
cada atributo toma un solo valor. Se dice que las
relaciones están normalizadas.

No hay dos atributos que se llamen igual.
Propiedades de las relaciones

El orden de los atributos no importa: los atributos no
están ordenados.

Cada tupla es distinta de las demás: no hay tuplas
duplicadas.

El orden de las tuplas no importa: las tuplas no están
ordenadas.
Cardinalidad
Cardinalidad
Cardinalidad
Reglas de Integridad

Ninguno de los atributos que componen la clave primaria
puede ser nulo.

Si en una relación hay alguna clave ajena, sus valores
deben coincidir con valores de la clave primaria a la que
hace referencia, o bien, deben ser completamente nulos.