Download Guía técnica para desarrollo de Sistemas de Información BI con
Document related concepts
no text concepts found
Transcript
GUÍA TÉCNICA GOBIERNO DE EXTREMADURA Dirección General de Administración Electrónica y Tecnologías de la Información Desarrollo de Sistemas de Información con la platafomra BI Pentaho GUÍA TÉCNICA Desarrollo de Sistemas de Información la plataforma Business Intellingence Pentaho Página 1 de 11 GUÍA TÉCNICA GOBIERNO DE EXTREMADURA Dirección General de Administración Electrónica y Tecnologías de la Información Desarrollo de Sistemas de Información con la platafomra BI Pentaho Control de versiones Ver. Fecha 1 04/07/14 Descripción Versión inicial Autores SDP Página 2 de 11 GUÍA TÉCNICA GOBIERNO DE EXTREMADURA Dirección General de Administración Electrónica y Tecnologías de la Información Desarrollo de Sistemas de Información con la platafomra BI Pentaho Índice del Documento Capítulo Página 1.- Alcance del documento 4 2.- Plataforma 4 3.- Estructura de la plataforma Pentaho 6 3.1.- Pentaho BI Platform 6 3.2.- Pentaho Data Integrator 8 4.- Inegración de aplicaciones 10 5.- Pentaho Reportint 11 Página 3 de 11 GUÍA TÉCNICA GOBIERNO DE EXTREMADURA Dirección General de Administración Electrónica y Tecnologías de la Información Desarrollo de Sistemas de Información con la platafomra BI Pentaho 1.- Alcance del documento Este documento establece las características técnicas que deben cumplir las aplicaciones desarrolladas utilizando la plataforma de Business Intelligence Pentaho. Se describe el entorno tecnológico existente, el cual hay que tener en cuenta a la hora de implementar y testear la compatibilidad de las aplicaciones desarrolladas. En este documento se establecen los estándares, frameworks y librerías que deben utilizarse en las aplicaciones a desarrollar, para asegurar unos requisitos mínimos de calidad y estandarización y una completa compatibilidad con el entorno, así como facilitar las tareas de despliegue y mantenimiento de las aplicaciones. Todas las aplicaciones desarrolladas utilizando la plataforma de Business Intelligence Pentaho deberán respetar las características establecidas en este documento. En el caso de necesitarse algún componente (framework, librería, entorno, etc.), tecnología o herramienta no descrita en el documento, el Servicio de Administración Electrónica deberá conocer este hecho y aprobar su uso. Este documento es complementario a la “Guía Técnica para el desarrollo de Sistemas de Información con JAVA”. 2.- Plataforma El entorno tecnológico para las aplicaciones desarrolladas con Pentaho para el Gobierno de Extremadura es el siguiente: • Java Platform, Standard Edition 7.0 Es una plataforma de programación para desarrollar y ejecutar software de aplicaciones en lenguaje de programación Java con arquitectura de n Página 4 de 11 GUÍA TÉCNICA GOBIERNO DE EXTREMADURA Dirección General de Administración Electrónica y Tecnologías de la Información Desarrollo de Sistemas de Información con la platafomra BI Pentaho niveles distribuida, basándose ampliamente en componentes de software modulares ejecutándose sobre un servidor de aplicaciones. http://java.sun.com/ • Apache Tomcat 6 Tomcat es un servidor web con soporte de servlets y JSPs. Al estar basado en Java, Tomcat puede ser utilizado en cualquier sistema operativo que lo soporte. Tomcat es mantenido y desarrollado por miembros de la Apache Software Foundation y voluntarios independientes. Tomcat 6.x implementa la especificaciones de Servlet 2.5 y JSP 2.1. Tomcat se utilizará para el despliegue del servidor BI de pentaho. http://tomcat.apache.org/ • Pentaho BI Platform 5 CE La plataforma Pentaho BI proporciona una arquitectura e infraestructura para construir aplicaciones de inteligencia de negocio. Proporciona servicios como autenticación, auditoría, log, servicios web, etc. También incluye un motor de solución que integra componentes de reporting, análisis, cuadros de mando y minería de datos. Pentaho BI Server está escrito entéramente en Java, por lo que se ejecuta en cualquier entorno J2EE. Así, es compatible con la mayoría SOs, contenedores Servlet, servidores de aplicaciones y Bases de Datos. http://community.pentaho.com/ • Pentaho Data Integrator 5 CE Pentaho Data Integrator es una solución ETL (Extracción, Transformación y Carga) basada en una aproximación dirigida por metadatos. Incluye un entorno gráfico de fácil uso para crear trabajos y transformaciones ETL, consiguiendo un desarrollo más rápido, menores costes de mantenimiento, un debug interactivo y un despliegue simplificado. Página 5 de 11 GUÍA TÉCNICA GOBIERNO DE EXTREMADURA Dirección General de Administración Electrónica y Tecnologías de la Información Desarrollo de Sistemas de Información con la platafomra BI Pentaho Pentaho Data Integrator está 100% construido en java, por lo que es multiplataforma: Windows, Linux, Macintosh. http://community.pentaho.com/ • SQLServer 2008 SQLServer es un sistema de bases de datos objeto-relacional, que será utilizado para dar soporte a las necesidades de persistencia de información de la plataforma BI Pentaho 5 CE. Se utilizará como motor de las bases de datos: - Repositorios de Pentaho Data Integrator - Bases de datos de operación del servidor Pentaho BI (quartz, hibernate y jackrabbit). http://www.microsoft.com Las aplicaciones tienen que ser 100% compatibles con esta plataforma. 3.- Estructura de la Plataforma Pentaho 3.1.- Pentaho BI Platform La plataforma de Business Intelligence Pentaho está compuesta, como norma general, por los siguientes módulos: • Un servidor Pentaho BI. El servidor Pentaho BI proporciona la arquitectura e infraestructura para construir las aplicaciones de inteligencia de negocio con Pentaho. Página 6 de 11 GUÍA TÉCNICA GOBIERNO DE EXTREMADURA Dirección General de Administración Electrónica y Tecnologías de la Información Desarrollo de Sistemas de Información con la platafomra BI Pentaho El servidor Pentaho BI ya estará disponible en los servidores de las Consejerías, por lo que no será entregado como parte de las aplicaciones. El servidor será utilizado por varias aplicaciones, por lo que no se podrá modificar el servidor ni ninguno de sus componentes y/o librerías para adaptarlo a necesidades específicas de una aplicación. • Un repositorio de soluciones. La plataforma BI accede al repositorio de soluciones dónde se almacena su configuración y las distintas soluciones. Cada aplicación contendrá toda su configuración, informes, análisis, etc., en una sola solución. Dicha solución se integrará en el repositorio de soluciones de la plataforma. • Consola de Administración Pentaho (integrada en la consola de usuario). Se trata de una aplicación web dirigida a los administradores de la plataforma, con utilidades para gestión de usuarios y roles, conexiones a bases de datos, operaciones de mantenimiento de la plataforma, etc. • A la consola de administración solo tendrán acceso los administradores de la plataforma. • Consola de Usuario Pentaho. Se trata de una interfaz web dirigida a los usuarios de la plataforma BI en la que pueden ejecutar los informes, cuadros de mando, análisis, etc., de las distintas aplicaciones (soluciones). Cada usuario tiene acceso a una o varias soluciones en función de su rol. • La consola de usuario Pentaho será corporativa, con un diseño y logos corporativos y será compartida por todas las aplicaciones. Sin embargo, los usuarios de las aplicaciones no podrán acceder a dicha consola, sino que accederán a las aplicaciones o portales web que acceden al servidor Pentaho. • Una o varias aplicaciones o portales web. Cada aplicación puede estar formada por una o varias aplicaciones o portales web, que accedan a los informes, cuadros de mando, etc., de su solución a través de la plataforma BI. La integración con la plataforma se realizará utilizando servicios web. • Una o varias fuentes de datos. La plataforma tendrá acceso a las fuentes de datos (bases de datos, ficheros, etc.) que exploten las distintas aplicaciones. Los datasources a utilizar por las aplicaciones Página 7 de 11 GUÍA TÉCNICA GOBIERNO DE EXTREMADURA Dirección General de Administración Electrónica y Tecnologías de la Información Desarrollo de Sistemas de Información con la platafomra BI Pentaho estarán definidos en sus soluciones, y la configuración de las conexiones a base de datos se realizarán desde la consola de administración de la plataforma. • Plataforma PBI 3.2.- Pentaho Data Integrator La solución ETL Pentaho Data Integrator está compuesta, como norma general, por los siguientes módulos: • Repositorios ETL. Pentaho Data Integrator almacena los trabajos y transformaciones ETL en repositorios de ficheros XML o en repositorios en base de datos. Página 8 de 11 GUÍA TÉCNICA GOBIERNO DE EXTREMADURA Dirección General de Administración Electrónica y Tecnologías de la Información Desarrollo de Sistemas de Información con la platafomra BI Pentaho En nuestro caso, cada aplicación almacenará su repositorio de trabajos y transformaciones en una instancia de base de datos. • Herramienta de Integración de Datos Spoon. La herramienta Spoon es un interfaz gráfico que permite gestionar repositorios, crear trabajos y transformaciones ETL, ejecutar transformaciones, etc. Esta herramienta estará instalada en un servidor y a ella tendrán acceso los administradores de la plataforma. • Herramienta de Integración de Datos Kitchen. La herramienta Kitchen permite ejecutar trabajos y transformaciones ETL desde línea de comandos. Esta herramienta estará instalada en un servidor y en este mismo servidor se podrán definir las tareas programadas que ejecuten trabajos ETL mediante Kitchen. • Aplicaciones. Las aplicaciones podrán ejecutar trabajos y transformaciones ETL, incorporando las librerías de Pentaho Data Integrator: ◦ kettle-core.jar ◦ kettle-db.jar ◦ kettle-engine.jar ◦ kettle-ui-swt.jar Estas aplicaciones deberán incorporar un fichero properties en el que definir el repositorio de trabajos y transformaciones ETL, así como las credenciales de acceso al mismo. Los trabajos y transformaciones que ejecuten las aplicaciones serán procesos internos y no tendrán acceso ni a las fuentes de datos ni a la base de datos del datawarehouse. • Una o varias fuentes de datos. La plataforma tendrá acceso a las fuentes de datos (bases de datos, ficheros, etc.) que intervengan en los distintos procesos ETL. Los datasources a utilizar por los procesos ETL estarán definidos en los repositorios, y serán administrados mediante la herramienta Spoon por los administradores de la plataforma. Página 9 de 11 GUÍA TÉCNICA GOBIERNO DE EXTREMADURA Dirección General de Administración Electrónica y Tecnologías de la Información Desarrollo de Sistemas de Información con la platafomra BI Pentaho Plataforma PDI 4.- Integración de aplicaciones Como ya se ha comentado antes, la integración de las aplicaciones (aplicaciones web java o portales web liferay) con pentaho BI server se realizará utilizando los servicios web de pentaho. Para ello, las aplicaciones deben disponer de un fichero de propiedades que permita indicar los parámetros de acceso a los servicios web: • url. • usuario. Página 10 de 11 GUÍA TÉCNICA GOBIERNO DE EXTREMADURA Dirección General de Administración Electrónica y Tecnologías de la Información • Desarrollo de Sistemas de Información con la platafomra BI Pentaho Password. Por otro lado, no está permitido hacer uso del visor OLAP JPivot, ya que en una plataforma pentaho BI compartida por varias aplicaciones el rendimiento es prioritario, y el uso de consultas OLAP a través de JPivot penaliza en gran medida el rendimiento. Las aplicaciones pueden hacer uso de los informes generados por pentaho, si bien es recomendable que, en la medida de lo posible, los informes generados sean almacenados para su consumo por otros usuarios, evitando repetir la consulta cada vez que se solicite el informe. Los usuarios accederán a los informes, cuadros de mando, etc., a través de una aplicación o portal web integrado con la plataforma, ya que no tendrán acceso a la consola de usuario de la plataforma Pentaho BI. 5.- Pentaho Reporting El motor de informes utilizado en las aplicaciones basadas en Pentaho es el de librerías Pentaho Reporting SDK disponible en la plataforma Pentaho BI basado en los productos Open Source JfreeReport y JfreeChart. Página 11 de 11