Download Árboles

Document related concepts

Árbol binario wikipedia , lookup

Recorrido de árboles wikipedia , lookup

Árbol-B wikipedia , lookup

Árbol binario de búsqueda wikipedia , lookup

Treap wikipedia , lookup

Transcript
Árboles
Cursos Propedéuticos 2015
Dr. René Cumplido
M. en C. Luis Rodríguez Flores
Contenido de la sección
• Introducción
• Árbol genérico
– Definición y representación
• Árboles binarios
– Definición, implementación, aplicaciones y recorridos
• Árboles binarios de Búsqueda
– Definición y principales operaciones (insertar,
eliminar, buscar)
Introducción
Hasta ahora, en todas las estructuras existen al
menos dos operaciones:
• Insertar un elemento en el conjunto.
• Buscar y/o descartar un elemento
¿Que limitaciones existen respecto a
complejidad de sus operaciones básicas?
la
Introducción
Una lista no ordenada tiene:
• Costo de inserción O(1).
• Costos de búsqueda O(n).
En el segundo caso la repetición de n operaciones
sobre la estructura da origen a complejidad n2.
Introducción
Una lista ordenada en forma ascendente por
prioridad, permite:
• Seleccionar el mínimo con costo O(1).
• Insertar manteniendo el orden tiene costo
promedio O(n) en el peor caso.
Introducción
La estructura de un árbol binario garantiza que las
operaciones de inserción y eliminación sean de
complejidad O( log2 (n) )
¿Qué es un árbol?
Un árbol es un grafo A que tiene un único nodo llamado
raíz que:
• Si tiene 0 relaciones se llama nodo hoja.
• Si tiene un un número finito de relaciones donde cada una
de esas relaciones es un sub-árbol.
– Por tanto, un árbol es una estructura no secuencial.
Ejemplo de un árbol
A
B
E
C
F
G
D
H
I
Nomenclatura básica
• Todo nodo nj, exceptuando el raíz, está conectado
exclusivamente a otro nodo nk donde:
– nj es el padre de nk (e.g., B es el padre de E)
– nk es uno de los hijos de nj (e.g., E es un hijo de B)
– Nodos con el mismo padre son “hermanos”
– Nodos sin hijos son llamados “hojas”
• Si existe una trayectoria del nodo nj al nodo nk entonces:
– nj es antecesor de nk (e.g., A es antecesor de E)
– nk es descendiente de nj (e.g., E es descendiente de E)
Ejemplo
Más nomenclatura
• La trayectoria del nodo n1 a nk se define como la
secuencia de nodos n1,n2,…,nk, tal que ni es el
padre de ni+1. Entonces:
– La longitud de una trayectoria es el número de
ramas recorridas, es decir, K-1.
– Nivel o profundidad del nodo ni es la longitud de la
trayectoria que va del nodo raíz a ni.
• C tiene profundidad 1, mientras que I tiene profundidad 2.
– La altura del nodo ni es longitud de la trayectoria más
larga de ni a una hoja.
• G tiene altura 0, B altura 1 y A (raíz) altura 2.
Implementación
typedef struct {
TipoDato dato;
struct NodoArbol *hijo1;
struct NodoArbol *hijo2;
:
struct NodoArbol *hijoN;
} NodoArbol;
• Dos formas de implementar:
typedef struct {
TipoDato dato;
•
struct NodoArbol *hijo;
struct NodoArbol *hermano;
} NodoArbol;
– Tener un apuntador a cada uno
de los hijos. Problema cuando
NO sabemos el número de hijos.
– Mantener los hijos de un nodo en
una lista ligada. No hay ninguna
restricción sobre número de hijos.
Así, un nodo del árbol consiste en
un dato, un apuntador al primer
hijo y un apuntador a la lista de
hermanos.
Árboles binarios
• Un árbol binario es un
árbol donde cada nodo
puede tener como máximo
dos hijos.
• Recursivamente un árbol
binario puede definirse
como: un árbol vacío, o un
nodo raíz con un subárbol
izquierdo y un subárbol
derecho.
Raíz
Árbol
izquierdo
Árbol
derecho
Árboles binarios
Un árbol binario es una estructura de datos de tipo árbol en
donde cada uno de los nodos del árbol puede tener 0, 1,
ó 2 subárboles llamados de acuerdo a su caso como:
• Si el nodo raíz tiene 0 relaciones se llama hoja.
• Si el nodo raíz tiene 1 relación a la izquierda, el segundo
elemento de la relación es el subárbol izquierdo.
• Si el nodo raíz tiene 1 relación a la derecha, el segundo
elemento de la relación es el subárbol derecho.
* Si cada nodo que NO es una hoja tiene un subárbol izquierdo y un
subárbol derecho, entonces se trata de un árbol binario completo.
Árboles binarios
Cuales de las siguientes
figuras representa un árbol
binario?
Árboles binarios
• En un primer caso se tiene que el número de
nodos n es tres; un nivel (m elementos entre los
nodos en una trayectoria desde la raíz a las
hojas) y altura h igual dos.
Árboles binarios
Con dos niveles: n=7=23-1
m=2 h=3
Con tres niveles:
n=15=24-1 m=3 h=4
En un caso general para árboles binarios completos: n = 2h -1, h = m +1 y
h=log2 (n+1), despejando h de la primera relación.
Árboles binarios
• La altura, es el concepto importante para la
complejidad, ya que define el número de nodos
a revisar en una trayectoria desde la raíz hasta
las hojas.
• Cual es la altura h del árbol anterior?:
• Si conocemos h, cual es el valor de n?:
Árboles binarios
• Árboles binarios llenos: Cada nodo del árbol o
es una hoja o un nodo interno con exáctamente
dos hijos.
• Árbol binario completo: es aquel en el que todos
los nodos tienen dos hijos y todas las hojas
están en el mismo nivel.
– cada nodo,excepto las hojas, tiene el máximo de
hijos que puede tener.
Árboles binarios
(a)
¿Son completos?
¿Son llenos?
(b)
Implementación con arreglos
Posición
0
1
2
3
4
5
6
7
8
9
10
11
Padre
--
0
0
1
1
2
2
3
3
4
4
5
Hijo Izquierdo
1
3
5
7
9
11
--
--
--
--
--
--
Hijo Derecho
2
4
6
8
10
--
--
--
--
--
--
--
Hermano Izq
--
--
1
--
3
--
5
--
7
--
9
--
Hermano Der
--
2
--
4
--
6
--
8
--
10
--
--
Implementación con apuntadores
• Los nodos del árbol son
estructuras
que
almacenan los datos, y
apuntadores
a
los
subárboles de ese nodo.
Representación
del Árbol
Árbol
H
D
A
S
L
Estructura del
nodo del árbol
Y
Implementación
• Cada nodo del árbol consiste en:
typedef struct NodoArbol
*Arbol;
– Un dato (cualquier tipo)
struct NodoArbol {
TipoDatol dato;
struct NodoArbol *izq;
struct NodoArbol *der;
};
– Un apuntador al hijo derecho
– Un apuntador al hijo izquierdo
• Inicialmente el nodo raíz apunta
a NULL.
• En las hojas del árbol, los
apuntadores hacia los hijos
izquierdo y derecho son NULL.
Operaciones con árboles binarios
• Con los árboles binarios es posible definir
algunas
operaciones
primitivas,
estas
operaciones permiten obtener información de un
nodo y sirven para desplazarse en el árbol,
hacia arriba o hacia abajo.
Operaciones con árboles binarios
• info(p) que devuelve el contenido del nodo apuntado por p.
• left(p) devuelve un apuntador al hijo izquierdo del nodo
apuntado por p, o bien, devuelve NULL si el nodo apuntado
por p es una hoja.
• right(p) devuelve un apuntador al hijo derecho del nodo
apuntado por p, o bien, devuelve NULL si el nodo apuntado
por p es una hoja.
• father(p) devuelve un apuntador al padre del nodo apuntado
por p, o bien, devuelve NULL si el nodo apuntado por p es la
raíz.
• brother(p) devuelve un apuntador al hermano del nodo
apuntado por p, o bien, devuelve NULL si el nodo apuntado
por p no tiene hermano.
Operaciones con árboles binarios
Estas otras operaciones son lógicas, tienen que ver con la
identidad de cada nodo:
• isLeft(p) devuelve el valor true si el nodo actual es el
hijo izquierdo del nodo apuntado por p, y false en caso
contrario.
• isRight(p) devuelve el valor true si el nodo actual es el
hijo derecho del nodo apuntado por p, y false en caso
contrario.
• isBrother(p) devuelve el valor true si el nodo actual es
el hermano del nodo apuntado por p, y false en caso
contrario.
Operaciones con árboles binarios
• También son útiles las operaciones makeTree,
setLeft y setRight.
• makeTree(x) crea un nuevo árbol binario que consta de
un único nodo con un campo de información x y
devuelve un apuntador a ese nodo.
• setLeft(p,x) acepta un apuntador p a un nodo de árbol
binario sin hijo izquierdo. Crea un nuevo hijo izquierdo
de node(p) con el campo de información x.
• setRight(p,x) es similar, excepto que crea un hijo
derecho.
Aplicaciones de árboles binarios
Un árbol binario es una estructura de datos útil
cuando se trata de hacer modelos de procesos
en donde se requiere tomar decisiones en uno
de dos sentidos en cada parte del proceso.
Supongamos que tenemos un arreglo en donde
queremos encontrar todos los duplicados. Esta
situación es bastante útil en el manejo de las
bases de datos, para evitar la redundancia.
Aplicaciones de árboles binarios
• El primer número del arreglo se coloca en la raíz del árbol
con sus subárboles izquierdo y derecho vacíos.
• Luego, cada elemento del arreglo se compara son la
información del nodo raíz y se crean los nuevos hijos con el
siguiente criterio:
– Si el elemento del arreglo es igual que la información del nodo raíz,
entonces notificar duplicidad.
– Si el elemento del arreglo es menor que la información del nodo raíz,
entonces se crea un hijo izquierdo.
– Si el elemento del arreglo es mayor que la información del nodo raíz,
entonces se crea un hijo derecho.
Aplicaciones de árboles binarios
• Una vez que ya está creado el árbol, se pueden
buscar los elementos repetidos. Si x el elemento
buscado, se debe recorrer el árbol del siguiente
modo:
• Sea k la información del nodo actual p. Si x > k
entonces cambiar el nodo actual a right(p), en
caso contrario, en caso de que x = k informar
una ocurrencia duplicada y en caso de que x ≥ k
cambiar el nodo actual a left(p).
Aplicaciones de árboles binarios
Recorridos de un árbol
Para obtener el contenido de todos los nodos en
un árbol es necesario recorrer el árbol. Esto es
debido a que solo tenemos conocimiento del
contenido de la dirección de un nodo a la vez.
• El proceso de visitar los nodos en algún orden
se denomina recorrido.
• Cualquier recorrido que lista cada nodo del árbol
exáctamente una vez se denomina una
enumeración de los nodos del árbol.
Recorridos de un árbol
• ¿cómo lo podemos recorrer?
Recorridos estándar
• Preorder:
– Visitar nodo
– Visitar árbol izquierdo
– Visitar árbol derecho
• Inorder:
– Visitar árbol izquierdo
– Visitar nodo
– Visitar árbol derecho
• Postorder:
– Visitar árbol izquierdo
– Visitar árbol derecho
– Visitar nodo
void inorder(NodoArbol *nodo) {
if (nodo != NULL) {
inorder(nodo->izq);
visitar(nodo);
inorder(nodo->der);
}
}
void postorder(NodoArbol *nodo)
{
if (nodo != NULL) {
postorder(nodo->izq);
postorder(nodo->der);
visitar(nodo);
}
}
Ejemplo de recorridos
A
B
D
C
E
F
G
Preorden: A, B, D, E, C, F, G
Inorden: D, B, E, A, F, C, G
Postorden: D, E, B, F, G, C, A
Árbol binario de búsqueda
• Es un árbol:
– Una colección de nodos que puede ser vacía, o que en su defecto consiste de
un nodo raíz R y un número finito de estructuras tipo árbol T1,…,Tk, llamados
subárboles, los cuales son disjuntos y sus respectivos nodos raíz están
conectados a R.
• Es binario:
– Cada nodo puede tener como máximo dos hijos, en otras palabras, cada nodo
sólo puede tener dos subárboles.
• Es de búsqueda porque:
– Los nodos están ordenados de manera conveniente para la búsqueda.
– Todos los elementos almacenados en el subárbol izquierdo de un nodo con valor
K, tienen valores < K.
– Todos los elementos almacenados en el sub-árbol derecho de un nodo con valor
K, tienen valores >= K.
Ejemplos
• ¿son todos árboles binarios de búsqueda?
6
6
2
1
3
2
8
4
2
1
1
8
7
4
3
8
6
7
5
4
Operación INSERTAR
Insertando 5
6
2
1
8
4
3
5
void insertar(NodoArbol *nodo, int elem){
if (nodo == NULL) {
nodo=(NodoArbol *)malloc(sizeof(NodoArbol));
nodo->dato = elem;
nodo->izq = nodo->der = NULL;
}
else if (elem < nodo->dato)
nodo-izq = insertar(nodo->izq, elem);
else if (elem > nodo->dato)
nodo->der = insertar(nodo->der, elem);
return nodo;
}
Ejercicio
• Construya el árbol binario
de búsqueda, al insertar
secuencialmente los
valores 5, 9, 3, 7, 8, 12,
6, 4.
Operación BUSCAR
6
2
1
8
4
3
Buscando 4: VERDADERO
Buscando 7: FALSO
boolean buscar(NodoArbol *nodo, int elem) {
if (nodo == NULL)
return FALSE;
else if (nodo->dato < elem)
return buscar(nodo->izq, elem);
else if (nodo->dato > elem)
return buscar(nodo->der, elem);
else return TRUE;
}
Operación ELIMINAR (1)
• Existen cuatro distintos escenarios:
1. Intentar eliminar un nodo que no existe.
– No se hace nada, simplemente se regresa FALSE.
2. Eliminar un nodo hoja.
– Caso sencillo; se borra el nodo y se actualiza el
apuntador del nodo padre a NULL.
3. Eliminar un nodo con un solo hijo.
– Caso sencillo; el nodo padre del nodo a borrar se
convierte en el padre del único nodo hijo.
4. Eliminar un nodo con dos hijos.
– Caso complejo, es necesario mover más de un
apuntador.
ELIMINAR (casos sencillos)
Eliminar nodo hoja
Eliminar nodo con un hijo
Eliminar 3
Eliminar 4
6
2
1
2
8
4
3
6
1
8
4
3
ELIMINAR (Caso complejo)
Eliminar nodo con dos hijos
Eliminar 2
6
2
1
6
8
4
3
1
8
4
copiar
valor
3
5
3
5
eliminar
•
1. Remplazar el dato del nodo
que se desea eliminar con el
dato del nodo más pequeño del
subárbol derecho
2.Eliminar el nodo más
pequeño del subárbol
derecho (caso fácil)
Otro ejemplo (caso complejo)
Eliminar nodo con dos hijos
Eliminar 2
6
6
1
2
1
3
8
1
4
3
8
4
3
5
5
2
3.5
3.5
Eliminar 3.
Eliminación de
un nodo con
un hijo.
Ejercicio
• Dibujar el árbol
resultante después de
aplicar las siguientes
eliminaciones de 20,
27, 14 y 22 al
siguiente árbol.
Implementación ELIMINAR
else /* encontramos el elemento */
/* tiene dos hijos */
void eliminar(NodoArbol *nodo, int elem) {
NodoArbol *aux, * hijo;
if (nodo->izq && nodo->derecho){
aux = enontrar_min(nodo->der);
nodo->dato = aux->dato;
nodo->der = eliminar(
nodo->der; nodo->dato);
}
/* un solo hijo */
else {
aux = nodo;
if (nodo->izq == NULL) hijo = nodo->der;
if (nodo->der == NULL) hijo = nodo->izq;
free(aux);
return hijo;
}
if (nodo == NULL) return; /* no existe nodo */
/* recorrer árbol hasta encontrar elem */
else if (elem < nodo->dato)
nodo-izq = eliminar(nodo->izq, elem);
else if (elem > nodo->dato)
nodo->der = eliminar(nodo->der, elem);
}
}
return nodo;