Download Construcción de cubos OLAP utilizando Business

Document related concepts

Expresiones multidimensionales wikipedia , lookup

OLAP wikipedia , lookup

Cubo OLAP wikipedia , lookup

SQL Server Integration Services wikipedia , lookup

Esquema en copo de nieve wikipedia , lookup

Transcript
Universidad Católica de Santa María
Facultad de Ciencias e Ingenierías Físicas y Formales
Informe de Trabajo
Construcción de cubos OLAP utilizando Business Intelligence
Development Studio
Alumnos: Solange Griselly Ramos Cooper
Pedro Michael Yallerco Bentura
Enrique Giancarlo Mendoza Mayta
Materia: Inteligencia de Negocios
Docente: Dr. Guillermo Calderon Ruiz
Ingeniería de Sistemas
Arequipa – Perú
2013
INTRODUCCIÓN
El presente trabajo aborda el tema de diseño de cubos OLAP, este término que por sus siglas
en ingles indican OnLine Analitical Processing fue acuñado por Edgar Frank Codd, quien propuso
disponer los datos en un vector multidimensional para suplir la necesidad de obtener resultados a
sentencias de búsqueda más rápidos. Por lo tanto, un cubo Olap no es más que la representación
abstracta de una base de datos multidimensional utilizada como mecanismo de análisis de datos que
permite una rápida ejecución de sentencias SQL de tipo SELECT en altas cantidades de datos.
Actualmente los cubos Olap se clasifican en tres tipos, Rolap, Molap y Holap, que básicamente
se diferencian por el lugar donde reside la fuente de datos. En ROLAP los datos residen en la misma
base de datos relacional, esto hace que el rendimiento pueda ser lento; por otro lado en MOLAP los
datos fuente residen en el mismo formato multidimensional, esto optimiza las consultas, pero
requiere más espacio de disco y diferente software; finalmente HOLAP es una combinación de los dos
anteriores, es decir, algunos datos se almacenan en estructuras multidimensionales y otros en la base
de datos relacional, esto requiere un buen trabajo de análisis para identificar que datos deben ir
donde.
En este trabajo se implementará el diseño de una solución ya modelada, para esto se utilizará
el entorno Business Intelligence Development Studio de Microsoft Visual Studio 2008, se hablará un
poco sobre esta herramienta y se hará paso a paso la construcción del cubo, luego se explicará el
funcionamiento de la solución y finalmente se plantearán tres preguntas que serán respondidas con la
solución implementada.
OBJETIVOS
 Entender cómo es que esta solución proporciona información útil para la toma de decisiones a
nivel Estratégico.
 Aprender sobre la construcción de un cubo OLAP en Microsoft Visual Studio 2008.
 Entender cómo funciona el mecanismo de Procesamiento Analítico en Línea.
DESARROLLO
Business Intelligence Development Studio
Business Intelligence Development Studio es el entorno de Microsoft Visual Studio 2008 con
mejoras específicas para soluciones de Inteligencia de Negocios, además es el entorno principal que se
utiliza para desarrollar soluciones empresariales que incluyan proyectos de Analysis Services,
Integration Services y Reporting Services. Cada tipo de proyecto proporciona plantillas para crear los
objetos necesarios para las soluciones de Inteligencia de Negocios y ofrece varios diseñadores,
herramientas y asistentes para trabajar con los objetos.
Business Intelligence Development Studio permite desarrollar cubos de Procesamiento
analítico en línea (OLAP) y modelos de minería de datos en SQL Server Analysis Services.
La superficie de diseño de Business Intelligence Development Studio se especializa en función
del objeto con el que se trabaja en Analysis Services. Por ejemplo, existe un diseñador para trabajar
con cubos, denominado Diseñador de cubos. El Explorador de soluciones, que se encuentra a la
derecha de la superficie de diseño, proporciona un mecanismo para navegar entre superficies de
diseño y administrar los elementos de un proyecto. Business Intelligence Development Studio
también contiene una ventana de implementación que muestra el progreso de una implementación y
una ventana Propiedades que permite cambiar las propiedades de los objetos seleccionados.[1]
Business Intelligence Development Studio es el entorno que se utilizará para desarrollar el
cubo OLAP en SQL Server Analysis Services de este trabajo.
NOTA
Microsoft Visual Studio 2010 no admite proyectos de Business Intelligence Development
Studio Integration Services, Reporting Services y Analysis Services para SQL Server 2008 y SQL
Server 2008 R2.
Figura 1 Entorno de Business Intelligence Development Studio.
Conexión a origen de datos
Para diseñar un cubo OLAP es necesario tener un origen de datos, la fuente de datos con la
que se trabajó fue una base de datos relacional creada previamente, administrada en SQL Server y
sigue el siguiente modelo.
Figura 2 Modelo Relacional.
Este modelo soluciona un problema planteado que se encuentra en el Anexo 1.
Para realizar la conexión de origen de datos se utilizará el Asistente para Orígenes de Datos.
Crear una nueva conexión.
Figura 3 Asistente para orígenes de datos.
Configurar la conexión indicado el nombre del servidor y el de la base de datos con la que se
trabajará. Comprobar conexión.
Figura 4 Configuración de conexión.
Para finalizar la conexión es necesario proporcionar un nombre al origen de datos.
Figura 5 Finalización del asistente de origen de datos.
Luego seleccionar los objetos de a base de datos relacional que van a incluirse en la vista del
origen de datos, esto con el Asistente para vistas del origen de datos. Se puede observar la vista previa
de las tablas que aparecerán en la vista.
Figura 6 Asistente para vistas de origen de datos.
Finalmente, se creará el siguiente diagrama.
Figura 7 Diseño de vista de origen de datos
Construcción del cubo OLAP
Para construir un nuevo cubo se necesita seleccionar la vista del origen de datos y las tablas
del cubo, para establecer sus propiedades.
NOTA
También se puede crear un cubo vacío (sin origen de datos) o generando tablas en el origen de
datos.
Seleccionar la tabla o las tablas que se utilizarán para el grupo de medidas, luego en la siguiente
ventana seleccionar las medidas que se desean considerar en el cubo.
Figura 8 Asistente para cubos. Selección de tabla de medidas
Figura 9 Asistente para cubos. Selección de medidas.
Al inicio no existen dimensiones, pero el asistente para la creación de cubos sugiere la creación
de dimensiones simples.
Figura 10 Asistente para cubos. Selección de dimensiones.
Finalmente, asignar un nombre al cubo. Se puede observar la vista previa de los grupos de
medida y las dimensiones como se observa en la siguiente figura.
Figura 11 Finalización del asistente para cubos.
A continuación mostrará el diseño del cubo.
Figura 12 Estructura del cubo. Hechos y dimensiones.
En la pestaña Examinador, se puede modelar el cubo según las dimensiones que se tengan.
Figura 13 Examinador de datos.
Ahora existe un inconveniente en las dimensiones creadas, solo se recuperó un atributo por
dimensión que fueron las PK de las tablas iniciales, entonces se procederá a crear dimensiones
manualmente para recuperar las demás columnas en cada dimensión.
Primero eliminar las dimensiones que se crearon con el cubo, luego utilizar el Asistente para
dimensiones para crear nuevas.
Para crear dimensiones se debe selecciona la vista de origen de datos y las tablas de dimensión
para luego estableces la propiedades.
Figura 14 Estructura del cubo. Hechos y dimensiones.
Para cada dimensión, seleccionar los atributos de dimensión y habilitarlos para que se
muestren como jerarquías.
Figura 15 Asistente para dimensión. Selección de atributos de dimensión.
Luego se puede observar el diseño final de la dimensión.
Figura 16 Estructura de dimensión.
Para poder observar los datos de la tabla de la dimensión, se debe procesar la dimensión.
Figura 17 Procesar Dimensión.
En el progreso del proceso se puede observar los atributos de la dimensión, así como el
número de filas que fueron leídas de la tabla.
Figura 18 Confirmación de finalización de proceso.
Una vez terminado el proceso, agregar la dimensión al diseño del cubo en la pestaña Uso de
dimensiones.
Figura 19 Adición de nueva dimensión al diseño del cubo.
Examinar cubo
Dirigirse al explorador de soluciones hasta llegar al diseño del cubo, luego en la pestaña
Examinador podemos empezar a manipular los datos según se desee.
Por ejemplo, en la siguiente imagen se puede observar los ingresos por cada departamento en
los meses de enero de los 5 años, de esta forma se puede comparar los ingresos de cada año por dicho
mes.
Figura 19 Examinador de datos.
Utilidad del cubo OLAP
Los sistemas OLAP es una de las soluciones que responden a la gran demanda que existe de
sistemas de información por parte de los gerentes y analistas empresariales, ya que permiten obtener
respuestas rápidas a consultas complejas además de analizar datos desde distintas perspectivas.
Este modelo de datos simplifica a los usuarios formular consultas complejas, arreglar los datos
en un reporte, cambiar de datos resumidos a datos detallados y filtrar o rebanar los datos en
subconjuntos significativos.[2]
A continuación se plantearán preguntas de un analista empresarial referidas a la solución
OLAP que se pidió en el documento que se encuentra en el Anexo 1 y que fue desarrollada en este
trabajo.
1. ¿Cómo ha sido el beneficio obtenido en ROPA JUVENIL del departamento de
Arequipa en verano de este año, con respecto al verano de años anteriores?
Figura 20 Análisis de dato Beneficio según dimensiones Mes, Año, Producto y
Departamento.
Como se puede observar, la figura indica que hubo un ligero crecimiento de Beneficios en
cuanto a la venta Ropa Juvenil desde el año 2008 hasta el año 2012 en los meses de Enero y Febrero.
2. ¿Cuál es el menor y mayor margen de ELECTRODOMESTICOS de las tiendas de todos
los departamentos por año?
Figura 21 Análisis del dato Margen según dimensiones Departamento y Año.
Como se puede observar, el menor margen de ganancia fue en CUZCO en el año 2009 con
2.29% sobre el margen de ganancia total en los 4 años y el mayor es de PIURA en el año 2009 con
2.68% sobre el margen de ganancia total en los 4 años.
3. Se desea saber si es conveniente invertir más en marketing.
Como podemos observar el Costo de Marketing es relativamente proporcional al Beneficio, por lo
que se podría concluir que seguir invirtiendo o aumentar la inversión en Marketing daría resultados
positivos en los Beneficios para la empresa.
CONCLUSIONES
El Procesamiento Analítico en Línea es una buena alternativa de solución a los problemas que se
presentan en los niveles estratégicos de las empresas, ya que los gerentes o analistas empresariales
necesitan obtener respuestas rápidas a consultas complejas en grandes cantidades de datos, más aún
este tiempo de respuesta se puede optimizar implementando los diferentes tipos de cubos OLAP que
existe según las necesidades del usuario.
El entorno Business Intelligence Development Studio de Microsoft Visual Studio 2008 permite
implementar soluciones OLAP de una forma sencilla y rápida, gracias a sus diferentes tipos de
asistentes que ofrece como Asistente para Administrar conexión de Datos, Asistente para crear Vista
de Origen de Datos, Asistente para Cubos, Asistente para dimensiones, etc.
REFERENCIAS BIBLIOGRÁFICAS
[1] Analysis Services en Business Intelligence Development Studio (Analysis Services - Datos
multidimensionales) (2013, Octubre 26) [En línea].
Disponible en: http://technet.microsoft.com/es-es/library
[2] Procesamiento Analítico en Línea (OLAP) (2013, Octubre 26) [En línea].
Disponible en: http://exa.unne.edu.ar/depar/areas/informatica/SistemasOperativos/OLAPMonog.pdf
ANEXOS
ANEXO 1