Download 2 Trabajando con Data Mining 2.1 Creando un Proyecto de Analysis

Document related concepts

Java Data Mining wikipedia , lookup

Data Source Name wikipedia , lookup

Cross Industry Standard Process for Data Mining wikipedia , lookup

ADO.NET wikipedia , lookup

Data Transformation Services wikipedia , lookup

Transcript
Trabajando con Data Mining 4
2 Trabajando con Data Mining
2.1 Creando un Proyecto de Analysis Services
Usted debe crear un nuevo proyecto de Analysis Services para utilizar los algoritmos de Minería de
Datos de SQL Server 2005, para ello utilice Microsoft Visual Studio y haga un nuevo proyecto desde
el menú Archivo, en tipos de proyecto seleccione Business Intelligence Projects y escoja la plantilla
Analysis Services Project, tal y como se muestra en la Figura 1.
Figure 1: New Analysis Services Project.
En la Figura 2 se muestra el "Solution Explorer" con el nuevo Proyecto de Analysis Services.
5
Guía de Usuario
Figure 2: Analysis Services Project - Solution Explorer.
Existen 3 objetos básicos para aplicar modelos de Minería en SQL Server 2005:
· Data Sources: Con este objeto, se crea la conexión hacia nuestra fuente de datos en SQL Server
2005.
· Data Source Views: Permite seleccionar cuales serán las tablas de datos para el modelo de
Minería a partir del Data Source creado previamente.
· Mining Structures: Una vez creado el Data Source View se procede a utilizar un Wizard
(Asistente) para aplicar un modelo de Minería a los datos de las tablas.
Nota: Es importante recalcar que un proyecto de Analysis Services puede tener configurados
múltiples objetos Data Source, Data Source View y Mining Structures.
Trabajando con Data Mining 6
2.1.1 Definiendo un Data Source
El primer paso para aplicar un modelo de minería es definir la conexión hacia la Base de Datos de
Microsoft SQL Server donde se tienen los datos, para ello dé clic derecho en el objeto Data Sources
del Proyecto de Analysis Services, el cual se muestra en la Figura 3.
Figure 3: Data Sources.
Dé clic en la opción New Data Source... para crear una nueva conexión, tal como se muestra en la
Figura 4.
Figure 4: Create a New Data
Source.
Paso 1: En la Figura 5 se muestra un asistente que le orienta paso a paso en el proceso que define la
conexión hacia la Base de Datos. Dé clic en el botón Next para continuar.
7
Guía de Usuario
Figure 5: Data Source Wizard.
Paso 2: Definir la conexión a los datos, por defecto el asistente no selecciona la opción crear un
nuevo Data Source, para ello dé clic en el botón New, este proceso lo llevará al siguiente paso, tal
como se muestra en la Figura 6.
Trabajando con Data Mining 8
Figure 6: How to define the connection.
Paso 3: Usar el Connection Manager para seleccionar el Servidor y Base de Datos a usar en el
modelo de Minería. Se usa un Provider como protocolo para establecer la conexión hacia la Base de
Datos, por defecto se usa
Native OLE DB\SQL Native Client,en la Figura 7 se muestra la lista de
Provider's disponibles:
9
Guía de Usuario
Figure 7: Provider List.
Paso 4: La opción Server name se utiliza para escribir o seleccionar el servidor de Base de Datos, las
credenciales para la conexión pueden ser con una cuenta de usuario administrador de Windows o
con autenticación de un usuario en Microsoft SQL Server. La opción Database name es el nombre de
la base de datos de donde se van a tomar las tablas para aplicarles un modelo de Minería. La Figura
8, muestra como se cambian estas opciones.
Trabajando con Data Mining 10
Figure 8: Database selection.
Paso 5: Se selecciona la base de datos de la lista y luego dé clic en el botón para
probar la conexión, si es efectiva se muestra un mensaje de confirmación en pantalla, que se ilustra
en la Figura 9, luego se da clic en el botón OK para terminar la prueba de conexión y continuar.
Figure 9: Test connection.
Paso 6: Después de probar la conexión, se da clic en el botón Ok para establecer los parámetros de
conexión. La Figura 10 muestra el nuevo paso se en el asistente.
11
Guía de Usuario
Figure 10: Data Source Connection.
Paso 7: En Data Connection properties se detallan los parámetros para la conexión. Dé clic en
para ir al nuevo paso del asistente donde se establecen las políticas para conectarse a
la Base de Datos. La primera opción especifica un usuario y password para la Base de Datos, la
segunda permite conectarse al SQL Server con el service account, la siguiente utiliza las
credenciales del usuario de Windows y Default utiliza las credenciales especificadas en las
propiedades del Data Source. La Figura 11 muestra la selección de la mejor opción para
impersonalización.
Trabajando con Data Mining 12
Figure 11: Impersonation Information.
Paso 8: Seleccione la opción y dé clic en el botón para ir al último paso del
asistente donde usted puede personalizar el nombre del Data Source como se muestra en la Figura
12. Dé clic en
para terminar de guardar los parámetros de conexión.
13
Guía de Usuario
Figure 12: Data Source Name.
Al finalizar se tiene el objeto Data Source con la conexión hacia la Base de Datos, tal como se
muestra en la Figura 13.
Figure 13: Data Source.
Nota: consulte la siguiente dirección http://msdn.microsoft.com/es-cr/library/ms188949(en-us).aspx
para obtener una especificación de las propiedades del objeto Data Source.
Trabajando con Data Mining 14
2.1.2 Definiendo un Data Source View
Una vez que se define el Data Source, se seleccionan las tablas con los datos a los que se les va a
aplicar el modelo de Minería con el objeto Data Source View.
Dé clic en el folder Data Source Views, como se muestra en la Figura 14.
Figure 14: Data Source Views.
Se debe dar clic derecho en Data Source Views para crear un nuevo Data Source View. Siga los
pasos del asistente para configurar un nuevo Data Source View, tal como se muestra en la Figura 15.
Figure 15: Create a New Data
Source View.
Paso 1: La Figura 16 muestra el inicio del Asistente para crear un nuevo Data Source View desde
tablas y vistas en una Base de Datos Relacional. Dé clic en el botón Next para continuar.
15
Guía de Usuario
Figure 16: Data Source View Wizard.
Paso 2: Seleccionar la fuente de datos (Data Source) donde están las tablas o las vistas que se
quieren usar. Se selecciona el Data Source previamente creado que apunta hacia la Base de Datos
Master y que tiene las tablas que se quieren usar en el modelo de Minería tal como se muestra en la
Figura 17. Dé clic en el botón Next para continuar.
Trabajando con Data Mining 16
Figure 17: Select a Data Source.
Paso 3: El asistente permite buscar relaciones lógicas entre las tablas, para el caso del ejemplo no
se necesitan este tipo de relaciones, desmarque la opción
tal como se muestra
en la Figura 18 y dé clic en el botón Next para continuar.
17
Guía de Usuario
Figure 18: Logical relationships.
Paso 4: La Figura 19 muestra el proceso para seleccionar las tablas que van a estar disponibles en el
Data Source View para ser usadas en el método de Minería. Use el botón
seleccionada o el botón
al Data Source View.
para agregar la tabla
para agregar todo el conjunto de tablas disponibles en el Data Source
Trabajando con Data Mining 18
Figure 19: Avalaible Tables for Data Source View.
Paso 5: Después de seleccionar las tablas que serán cargadas en el Data Source View, tal como se
muestra en la Figura 20, dé clic en el botón Next.
19
Guía de Usuario
Figure 20: Included Tables.
Paso 6: La Figura 21 muestra como cambiar el nombre al Data Source View y finalizar el Asistente.
Trabajando con Data Mining 20
Figure 21: Data Source View Name.
El "Solution Explorer" del Proyecto de Analysis Services debe contener la lista de objetos creados
hasta el momento, tal como se ilustra en la Figura 22.
Figure 22: Data Source View.
21
Guía de Usuario
2.2 Agregando Mining Structures al Proyecto
Para generar modelos de Minería de datos en Microsoft SQL Server 2005 Analysis Services (SSAS),
se debe crear una estructura de Minería de datos, utilizando el Asistente en Business Intelligence
Development Studio. La estructura de Minería de datos define el dominio de los datos desde el que
se generan los modelos de Minería de datos.
Las estructuras de Minería de datos se pueden basar en orígenes de datos relacionales o de
procesamiento analítico en línea (OLAP). Las estructuras de Minería de datos relacionales describen
los datos que están almacenados en sistemas de bases de datos relacionales. Las estructuras de
Minería de datos OLAP se generan utilizando un cubo OLAP que existe en la misma base de datos
que la estructura de Minería de datos.
Nota: en http://msdn.microsoft.com/es-cr/library/ms174757.aspx
sobre Mining Structures en Microsoft SQL Server 2005.
se puede encontrar más información
2.2.1 Creando una nueva Mining Structure
Para crear una nueva Mining Structure seleccione el objeto Mining Structures del Proyecto de
Analysis Services tal como se muestra en la Figura 23.
Figure 23: Mining Structure - Solution Explorer.
Dé clic derecho en Mining Structures para definir una nueva Mining Structure tal como muestra la
Figura 24. Se deben seguir los pasos del asistente para configurar la nueva Mining Structure.
Figure 24: New Mining Structure.
Iniciar el Asistente para crear una nueva Mining Structure y un nuevo Modelo de Minería para aplicar
en tablas y vistas en una Base de Datos Relacional. Dé clic en el botón Siguiente para continuar. Tal
como se muestra en la Figura 25.
Trabajando con Data Mining 22
Figure 25: Mining Structure Wizard.
Seleccionar una técnica de data mining para usar en la nueva Mining Structure, tal como se muestra
en la Figura 26.
Microsoft SQL Server Analysis Services incluye los siguientes tipos de algoritmos:
·
·
·
·
·
Algoritmos de Clasificación
Algoritmos de Regresión
Algoritmos de Segmentación
Algoritmos de Asociación
Algoritmos de Análisis de Secuencia
Nota:
consulte
http://msdn.microsoft.com/es-cr/library/ms175595(en-us).aspx
para obtener
información detallada sobre los tipos de algoritmos que provee Analysis Services y sobre como
escoger el tipo correcto de algoritmo a usar.
23
Guía de Usuario
Figure 26: Select the Data Mining Technique.
Analysis Services se instala con una serie implementaciones de algoritmos de data mining, la lista de
técnicas de Minería de datos default se observa en la Figura 27:
Trabajando con Data Mining 24
Figure 27: Microsoft Data Mining Technique List.