Download 2 Trabajando con Data Mining 2.1 Creando un Proyecto de Analysis
Document related concepts
Transcript
Trabajando con Data Mining 4 2 Trabajando con Data Mining 2.1 Creando un Proyecto de Analysis Services Usted debe crear un nuevo proyecto de Analysis Services para utilizar los algoritmos de Minería de Datos de SQL Server 2005, para ello utilice Microsoft Visual Studio y haga un nuevo proyecto desde el menú Archivo, en tipos de proyecto seleccione Business Intelligence Projects y escoja la plantilla Analysis Services Project, tal y como se muestra en la Figura 1. Figure 1: New Analysis Services Project. En la Figura 2 se muestra el "Solution Explorer" con el nuevo Proyecto de Analysis Services. 5 Guía de Usuario Figure 2: Analysis Services Project - Solution Explorer. Existen 3 objetos básicos para aplicar modelos de Minería en SQL Server 2005: · Data Sources: Con este objeto, se crea la conexión hacia nuestra fuente de datos en SQL Server 2005. · Data Source Views: Permite seleccionar cuales serán las tablas de datos para el modelo de Minería a partir del Data Source creado previamente. · Mining Structures: Una vez creado el Data Source View se procede a utilizar un Wizard (Asistente) para aplicar un modelo de Minería a los datos de las tablas. Nota: Es importante recalcar que un proyecto de Analysis Services puede tener configurados múltiples objetos Data Source, Data Source View y Mining Structures. Trabajando con Data Mining 6 2.1.1 Definiendo un Data Source El primer paso para aplicar un modelo de minería es definir la conexión hacia la Base de Datos de Microsoft SQL Server donde se tienen los datos, para ello dé clic derecho en el objeto Data Sources del Proyecto de Analysis Services, el cual se muestra en la Figura 3. Figure 3: Data Sources. Dé clic en la opción New Data Source... para crear una nueva conexión, tal como se muestra en la Figura 4. Figure 4: Create a New Data Source. Paso 1: En la Figura 5 se muestra un asistente que le orienta paso a paso en el proceso que define la conexión hacia la Base de Datos. Dé clic en el botón Next para continuar. 7 Guía de Usuario Figure 5: Data Source Wizard. Paso 2: Definir la conexión a los datos, por defecto el asistente no selecciona la opción crear un nuevo Data Source, para ello dé clic en el botón New, este proceso lo llevará al siguiente paso, tal como se muestra en la Figura 6. Trabajando con Data Mining 8 Figure 6: How to define the connection. Paso 3: Usar el Connection Manager para seleccionar el Servidor y Base de Datos a usar en el modelo de Minería. Se usa un Provider como protocolo para establecer la conexión hacia la Base de Datos, por defecto se usa Native OLE DB\SQL Native Client,en la Figura 7 se muestra la lista de Provider's disponibles: 9 Guía de Usuario Figure 7: Provider List. Paso 4: La opción Server name se utiliza para escribir o seleccionar el servidor de Base de Datos, las credenciales para la conexión pueden ser con una cuenta de usuario administrador de Windows o con autenticación de un usuario en Microsoft SQL Server. La opción Database name es el nombre de la base de datos de donde se van a tomar las tablas para aplicarles un modelo de Minería. La Figura 8, muestra como se cambian estas opciones. Trabajando con Data Mining 10 Figure 8: Database selection. Paso 5: Se selecciona la base de datos de la lista y luego dé clic en el botón para probar la conexión, si es efectiva se muestra un mensaje de confirmación en pantalla, que se ilustra en la Figura 9, luego se da clic en el botón OK para terminar la prueba de conexión y continuar. Figure 9: Test connection. Paso 6: Después de probar la conexión, se da clic en el botón Ok para establecer los parámetros de conexión. La Figura 10 muestra el nuevo paso se en el asistente. 11 Guía de Usuario Figure 10: Data Source Connection. Paso 7: En Data Connection properties se detallan los parámetros para la conexión. Dé clic en para ir al nuevo paso del asistente donde se establecen las políticas para conectarse a la Base de Datos. La primera opción especifica un usuario y password para la Base de Datos, la segunda permite conectarse al SQL Server con el service account, la siguiente utiliza las credenciales del usuario de Windows y Default utiliza las credenciales especificadas en las propiedades del Data Source. La Figura 11 muestra la selección de la mejor opción para impersonalización. Trabajando con Data Mining 12 Figure 11: Impersonation Information. Paso 8: Seleccione la opción y dé clic en el botón para ir al último paso del asistente donde usted puede personalizar el nombre del Data Source como se muestra en la Figura 12. Dé clic en para terminar de guardar los parámetros de conexión. 13 Guía de Usuario Figure 12: Data Source Name. Al finalizar se tiene el objeto Data Source con la conexión hacia la Base de Datos, tal como se muestra en la Figura 13. Figure 13: Data Source. Nota: consulte la siguiente dirección http://msdn.microsoft.com/es-cr/library/ms188949(en-us).aspx para obtener una especificación de las propiedades del objeto Data Source. Trabajando con Data Mining 14 2.1.2 Definiendo un Data Source View Una vez que se define el Data Source, se seleccionan las tablas con los datos a los que se les va a aplicar el modelo de Minería con el objeto Data Source View. Dé clic en el folder Data Source Views, como se muestra en la Figura 14. Figure 14: Data Source Views. Se debe dar clic derecho en Data Source Views para crear un nuevo Data Source View. Siga los pasos del asistente para configurar un nuevo Data Source View, tal como se muestra en la Figura 15. Figure 15: Create a New Data Source View. Paso 1: La Figura 16 muestra el inicio del Asistente para crear un nuevo Data Source View desde tablas y vistas en una Base de Datos Relacional. Dé clic en el botón Next para continuar. 15 Guía de Usuario Figure 16: Data Source View Wizard. Paso 2: Seleccionar la fuente de datos (Data Source) donde están las tablas o las vistas que se quieren usar. Se selecciona el Data Source previamente creado que apunta hacia la Base de Datos Master y que tiene las tablas que se quieren usar en el modelo de Minería tal como se muestra en la Figura 17. Dé clic en el botón Next para continuar. Trabajando con Data Mining 16 Figure 17: Select a Data Source. Paso 3: El asistente permite buscar relaciones lógicas entre las tablas, para el caso del ejemplo no se necesitan este tipo de relaciones, desmarque la opción tal como se muestra en la Figura 18 y dé clic en el botón Next para continuar. 17 Guía de Usuario Figure 18: Logical relationships. Paso 4: La Figura 19 muestra el proceso para seleccionar las tablas que van a estar disponibles en el Data Source View para ser usadas en el método de Minería. Use el botón seleccionada o el botón al Data Source View. para agregar la tabla para agregar todo el conjunto de tablas disponibles en el Data Source Trabajando con Data Mining 18 Figure 19: Avalaible Tables for Data Source View. Paso 5: Después de seleccionar las tablas que serán cargadas en el Data Source View, tal como se muestra en la Figura 20, dé clic en el botón Next. 19 Guía de Usuario Figure 20: Included Tables. Paso 6: La Figura 21 muestra como cambiar el nombre al Data Source View y finalizar el Asistente. Trabajando con Data Mining 20 Figure 21: Data Source View Name. El "Solution Explorer" del Proyecto de Analysis Services debe contener la lista de objetos creados hasta el momento, tal como se ilustra en la Figura 22. Figure 22: Data Source View. 21 Guía de Usuario 2.2 Agregando Mining Structures al Proyecto Para generar modelos de Minería de datos en Microsoft SQL Server 2005 Analysis Services (SSAS), se debe crear una estructura de Minería de datos, utilizando el Asistente en Business Intelligence Development Studio. La estructura de Minería de datos define el dominio de los datos desde el que se generan los modelos de Minería de datos. Las estructuras de Minería de datos se pueden basar en orígenes de datos relacionales o de procesamiento analítico en línea (OLAP). Las estructuras de Minería de datos relacionales describen los datos que están almacenados en sistemas de bases de datos relacionales. Las estructuras de Minería de datos OLAP se generan utilizando un cubo OLAP que existe en la misma base de datos que la estructura de Minería de datos. Nota: en http://msdn.microsoft.com/es-cr/library/ms174757.aspx sobre Mining Structures en Microsoft SQL Server 2005. se puede encontrar más información 2.2.1 Creando una nueva Mining Structure Para crear una nueva Mining Structure seleccione el objeto Mining Structures del Proyecto de Analysis Services tal como se muestra en la Figura 23. Figure 23: Mining Structure - Solution Explorer. Dé clic derecho en Mining Structures para definir una nueva Mining Structure tal como muestra la Figura 24. Se deben seguir los pasos del asistente para configurar la nueva Mining Structure. Figure 24: New Mining Structure. Iniciar el Asistente para crear una nueva Mining Structure y un nuevo Modelo de Minería para aplicar en tablas y vistas en una Base de Datos Relacional. Dé clic en el botón Siguiente para continuar. Tal como se muestra en la Figura 25. Trabajando con Data Mining 22 Figure 25: Mining Structure Wizard. Seleccionar una técnica de data mining para usar en la nueva Mining Structure, tal como se muestra en la Figura 26. Microsoft SQL Server Analysis Services incluye los siguientes tipos de algoritmos: · · · · · Algoritmos de Clasificación Algoritmos de Regresión Algoritmos de Segmentación Algoritmos de Asociación Algoritmos de Análisis de Secuencia Nota: consulte http://msdn.microsoft.com/es-cr/library/ms175595(en-us).aspx para obtener información detallada sobre los tipos de algoritmos que provee Analysis Services y sobre como escoger el tipo correcto de algoritmo a usar. 23 Guía de Usuario Figure 26: Select the Data Mining Technique. Analysis Services se instala con una serie implementaciones de algoritmos de data mining, la lista de técnicas de Minería de datos default se observa en la Figura 27: Trabajando con Data Mining 24 Figure 27: Microsoft Data Mining Technique List.