Download Presentación de TMiner - Fernando Berzal

Document related concepts
no text concepts found
Transcript
Grupo de investigación en
Bases de Datos y Sistemas de Información Inteligentes
Departamento de Ciencias de la Computación e Inteligencia Artificial
ETS Ingeniería Informática - Universidad de Granada
TMiner
Data Mining en Java
Entorno integrado de
“minería de datos”
desarrollado en Java.
JDBC da acceso
prácticamente a cualquier
base de datos existente
en el mercado.
TMiner
Interfaz Windows
Los “trabajadores del
conocimiento” pueden analizar
sus propios datos utilizando un
interfaz estándar de tipo WIMP...
TMiner
Interfaz Web
Como applet...
... y como aplicación web
TMiner
Sistema de ayuda en línea
TMiner ofrece una
interfaz bilingüe
(español e inglés)
con un sistema
de ayuda en línea
en formato HTML
TMiner
Selección de los datos
TMiner
Selección de los datos
Mediante el
controlador JDBC
adecuado se accede a
la base de datos…
TMiner
Selección de los datos
Con TMiner
podemos analizar
cualquiera de los
conjuntos de datos
de la base de datos
TMiner
El conjunto de datos
TMiner
El conjunto de datos
Una vez seleccionado
el conjunto de datos,
podemos empezar a
trabajar con él
TMiner
El conjunto de datos
TMiner
permite realizar
consultas SQL
TMiner
El conjunto de datos
Importar datos
desde ficheros…
TMiner
El conjunto de datos
… o exportar los datos
de la base de datos
TMiner
Preparación de los datos
TMiner
Preparación de los datos
Una vez seleccionado el conjunto de datos,
podemos aplicar distintas técnicas de Data Mining
TMiner
Preparación de los datos
En primer lugar, seleccionamos
las columnas del conjunto de datos con las que vamos a trabajar
TMiner
Preparación de los datos
A continuación, agrupamos los valores de cada atributo
en función de cómo queramos interpretarlos
TMiner
Preparación de los datos
Cuando los atributos son de tipo numérico,
podemos utilizar distintas técnicas de discretización
TMiner
Preparación de los datos
Incluso se pueden asignar etiquetas descriptivas
a los conjuntos en que agrupamos los valores de los atributos
TMiner
Técnicas de Data Mining
TMiner
Técnicas de Data Mining
Ya sólo nos queda
elegir qué algoritmos utilizar,
indicar valores adecuados
para sus parámetros
y esperar a ver los resultados
que se obtienen…
TMiner
Técnicas de Data Mining
TMiner
Árboles de decisión
Algoritmos
ID3, C4.5 …
TMiner
Listas de decisión
Metodología STAR:
Algoritmos AQ y CN2
TMiner
Reglas de asociación
Algoritmos
Apriori y TBAR
TMiner
Reglas de asociación
Clasificación
con reglas de asociación
TMiner
Análizador Numérico
Analizador Numérico
Técnicas de clasificación y agrupamiento
El Analizador Numérico
es la parte de TMiner encargada de trabajar con números
Analizador Numérico
Técnicas de clasificación y agrupamiento
Incluye técnicas de edición y condensado de datos, distintos métodos de
construcción de clasificadores y múltiples algoritmos de agrupamiento
Analizador Numérico
Técnicas de clasificación y agrupamiento
Visualización de conjuntos de datos,
estadísticas y distribuciones de clases
Analizador Numérico
Técnicas de clasificación y agrupamiento
Estadísticas por clases
Analizador Numérico
Técnicas de clasificación y agrupamiento
Analizador Numérico
Técnicas de clasificación y agrupamiento
Clasificadores paramétricos (lineales y cuadráticos)
Analizador Numérico
Técnicas de clasificación y agrupamiento
Clasificadores no paramétricos: k-NN
Analizador Numérico
Técnicas de clasificación y agrupamiento
Aprendizaje adaptativo: LVQ y DSM
Analizador Numérico
Técnicas de clasificación y agrupamiento
Métodos de agrupamiento: K-MEANS, GRASP, ISODATA…
Más información...
Fernando Berzal Galiano
[email protected]
Juan Carlos Cubero Talavera
[email protected]