Download Guía técnica para desarrollo de Sistemas de Información BI con

Document related concepts
no text concepts found
Transcript
GUÍA TÉCNICA
GOBIERNO DE EXTREMADURA
Dirección General de
Administración Electrónica y Tecnologías de la Información
Desarrollo de Sistemas de
Información con la platafomra BI
Pentaho
GUÍA TÉCNICA
Desarrollo de Sistemas
de Información la
plataforma Business
Intellingence Pentaho
Página 1 de 11
GUÍA TÉCNICA
GOBIERNO DE EXTREMADURA
Dirección General de
Administración Electrónica y Tecnologías de la Información
Desarrollo de Sistemas de
Información con la platafomra BI
Pentaho
Control de versiones
Ver.
Fecha
1
04/07/14
Descripción
Versión inicial
Autores
SDP
Página 2 de 11
GUÍA TÉCNICA
GOBIERNO DE EXTREMADURA
Dirección General de
Administración Electrónica y Tecnologías de la Información
Desarrollo de Sistemas de
Información con la platafomra BI
Pentaho
Índice del Documento
Capítulo
Página
1.- Alcance del documento
4
2.- Plataforma
4
3.- Estructura de la plataforma Pentaho
6
3.1.- Pentaho BI Platform
6
3.2.- Pentaho Data Integrator
8
4.- Inegración de aplicaciones
10
5.- Pentaho Reportint
11
Página 3 de 11
GUÍA TÉCNICA
GOBIERNO DE EXTREMADURA
Dirección General de
Administración Electrónica y Tecnologías de la Información
Desarrollo de Sistemas de
Información con la platafomra BI
Pentaho
1.- Alcance del documento
Este documento establece las características técnicas que deben cumplir
las aplicaciones desarrolladas utilizando la plataforma de Business Intelligence
Pentaho.
Se describe el entorno tecnológico existente, el cual hay que tener en
cuenta a la hora de implementar y testear la compatibilidad de las aplicaciones
desarrolladas.
En este documento se establecen los estándares, frameworks y librerías
que deben utilizarse en las aplicaciones a desarrollar, para asegurar unos
requisitos mínimos de calidad y estandarización y una completa compatibilidad
con el entorno, así como facilitar las tareas de despliegue y mantenimiento de
las aplicaciones.
Todas las aplicaciones desarrolladas utilizando la plataforma de Business
Intelligence Pentaho deberán respetar las características establecidas en este
documento. En el caso de necesitarse algún componente (framework, librería,
entorno, etc.), tecnología o herramienta no descrita en el documento, el
Servicio de Administración Electrónica deberá conocer este hecho y aprobar su
uso.
Este documento es complementario a la “Guía Técnica para el desarrollo
de Sistemas de Información con JAVA”.
2.- Plataforma
El entorno tecnológico para las aplicaciones desarrolladas con Pentaho
para el Gobierno de Extremadura es el siguiente:
•
Java Platform, Standard Edition 7.0
Es una plataforma de programación para desarrollar y ejecutar software
de aplicaciones en lenguaje de programación Java con arquitectura de n
Página 4 de 11
GUÍA TÉCNICA
GOBIERNO DE EXTREMADURA
Dirección General de
Administración Electrónica y Tecnologías de la Información
Desarrollo de Sistemas de
Información con la platafomra BI
Pentaho
niveles distribuida, basándose ampliamente en componentes de software
modulares ejecutándose sobre un servidor de aplicaciones.
http://java.sun.com/
•
Apache Tomcat 6
Tomcat es un servidor web con soporte de servlets y JSPs. Al estar
basado en Java, Tomcat puede ser utilizado en cualquier sistema
operativo que lo soporte.
Tomcat es mantenido y desarrollado por miembros de la Apache
Software Foundation y voluntarios independientes.
Tomcat 6.x implementa la especificaciones de Servlet 2.5 y JSP 2.1.
Tomcat se utilizará para el despliegue del servidor BI de pentaho.
http://tomcat.apache.org/
•
Pentaho BI Platform 5 CE
La plataforma Pentaho BI proporciona una arquitectura e infraestructura
para construir aplicaciones de inteligencia de negocio. Proporciona
servicios como autenticación, auditoría, log, servicios web, etc. También
incluye un motor de solución que integra componentes de reporting,
análisis, cuadros de mando y minería de datos.
Pentaho BI Server está escrito entéramente en Java, por lo que se
ejecuta en cualquier entorno J2EE. Así, es compatible con la mayoría
SOs, contenedores Servlet, servidores de aplicaciones y Bases de Datos.
http://community.pentaho.com/
•
Pentaho Data Integrator 5 CE
Pentaho Data Integrator es una solución ETL (Extracción, Transformación
y Carga) basada en una aproximación dirigida por metadatos. Incluye un
entorno gráfico de fácil uso para crear trabajos y transformaciones ETL,
consiguiendo un desarrollo más rápido, menores costes de
mantenimiento, un debug interactivo y un despliegue simplificado.
Página 5 de 11
GUÍA TÉCNICA
GOBIERNO DE EXTREMADURA
Dirección General de
Administración Electrónica y Tecnologías de la Información
Desarrollo de Sistemas de
Información con la platafomra BI
Pentaho
Pentaho Data Integrator está 100% construido en java, por lo que es
multiplataforma: Windows, Linux, Macintosh.
http://community.pentaho.com/
•
SQLServer 2008
SQLServer es un sistema de bases de datos objeto-relacional, que será
utilizado para dar soporte a las necesidades de persistencia de
información de la plataforma BI Pentaho 5 CE.
Se utilizará como motor de las bases de datos:
-
Repositorios de Pentaho Data Integrator
-
Bases de datos de operación del servidor Pentaho BI (quartz,
hibernate y jackrabbit).
http://www.microsoft.com
Las aplicaciones tienen que ser 100% compatibles con esta plataforma.
3.- Estructura de la Plataforma Pentaho
3.1.- Pentaho BI Platform
La plataforma de Business Intelligence Pentaho está compuesta, como
norma general, por los siguientes módulos:
•
Un servidor Pentaho BI. El servidor Pentaho BI proporciona la
arquitectura e infraestructura para construir las aplicaciones de
inteligencia de negocio con Pentaho.
Página 6 de 11
GUÍA TÉCNICA
GOBIERNO DE EXTREMADURA
Dirección General de
Administración Electrónica y Tecnologías de la Información
Desarrollo de Sistemas de
Información con la platafomra BI
Pentaho
El servidor Pentaho BI ya estará disponible en los servidores de las
Consejerías, por lo que no será entregado como parte de las
aplicaciones. El servidor será utilizado por varias aplicaciones, por lo que
no se podrá modificar el servidor ni ninguno de sus componentes
y/o librerías para adaptarlo a necesidades específicas de una
aplicación.
•
Un repositorio de soluciones. La plataforma BI accede al
repositorio de soluciones dónde se almacena su configuración y las
distintas
soluciones.
Cada
aplicación
contendrá
toda
su
configuración, informes, análisis, etc., en una sola solución. Dicha
solución se integrará en el repositorio de soluciones de la plataforma.
•
Consola de Administración Pentaho (integrada en la consola de
usuario). Se trata de una aplicación web dirigida a los administradores de
la plataforma, con utilidades para gestión de usuarios y roles, conexiones
a bases de datos, operaciones de mantenimiento de la plataforma, etc.
•
A la consola de administración solo tendrán acceso los
administradores de la plataforma.
•
Consola de Usuario Pentaho. Se trata de una interfaz web
dirigida a los usuarios de la plataforma BI en la que pueden ejecutar los
informes, cuadros de mando, análisis, etc., de las distintas aplicaciones
(soluciones). Cada usuario tiene acceso a una o varias soluciones en
función de su rol.
•
La consola de usuario Pentaho será corporativa, con un
diseño y logos corporativos y será compartida por todas las aplicaciones.
Sin embargo, los usuarios de las aplicaciones no podrán acceder a
dicha consola, sino que accederán a las aplicaciones o portales web que
acceden al servidor Pentaho.
•
Una o varias aplicaciones o portales web. Cada aplicación puede
estar formada por una o varias aplicaciones o portales web, que accedan
a los informes, cuadros de mando, etc., de su solución a través de la
plataforma BI. La integración con la plataforma se realizará
utilizando servicios web.
•
Una o varias fuentes de datos. La plataforma tendrá acceso a las
fuentes de datos (bases de datos, ficheros, etc.) que exploten las
distintas aplicaciones. Los datasources a utilizar por las aplicaciones
Página 7 de 11
GUÍA TÉCNICA
GOBIERNO DE EXTREMADURA
Dirección General de
Administración Electrónica y Tecnologías de la Información
Desarrollo de Sistemas de
Información con la platafomra BI
Pentaho
estarán definidos en sus soluciones, y la configuración de las
conexiones a base de datos se realizarán desde la consola de
administración de la plataforma.
•
Plataforma PBI
3.2.- Pentaho Data Integrator
La solución ETL Pentaho Data Integrator está compuesta, como norma
general, por los siguientes módulos:
•
Repositorios ETL. Pentaho Data Integrator almacena los trabajos y
transformaciones ETL en repositorios de ficheros XML o en repositorios
en base de datos.
Página 8 de 11
GUÍA TÉCNICA
GOBIERNO DE EXTREMADURA
Dirección General de
Administración Electrónica y Tecnologías de la Información
Desarrollo de Sistemas de
Información con la platafomra BI
Pentaho
En nuestro caso, cada aplicación almacenará su repositorio de
trabajos y transformaciones en una instancia de base de datos.
•
Herramienta de Integración de Datos Spoon. La herramienta Spoon es
un interfaz gráfico que permite gestionar repositorios, crear trabajos y
transformaciones ETL, ejecutar transformaciones, etc.
Esta herramienta estará instalada en un servidor y a ella tendrán
acceso los administradores de la plataforma.
•
Herramienta de Integración de Datos Kitchen. La herramienta Kitchen
permite ejecutar trabajos y transformaciones ETL desde línea de
comandos.
Esta herramienta estará instalada en un servidor y en este mismo
servidor se podrán definir las tareas programadas que ejecuten trabajos
ETL mediante Kitchen.
•
Aplicaciones.
Las
aplicaciones
podrán
ejecutar
trabajos
y
transformaciones ETL, incorporando las librerías de Pentaho Data
Integrator:
◦ kettle-core.jar
◦ kettle-db.jar
◦ kettle-engine.jar
◦ kettle-ui-swt.jar
Estas aplicaciones deberán incorporar un fichero properties en el que
definir el repositorio de trabajos y transformaciones ETL, así como las
credenciales de acceso al mismo.
Los trabajos y transformaciones que ejecuten las aplicaciones
serán procesos internos y no tendrán acceso ni a las fuentes de
datos ni a la base de datos del datawarehouse.
•
Una o varias fuentes de datos. La plataforma tendrá acceso a las fuentes
de datos (bases de datos, ficheros, etc.) que intervengan en los distintos
procesos ETL. Los datasources a utilizar por los procesos ETL estarán
definidos en los repositorios, y serán administrados mediante la
herramienta Spoon por los administradores de la plataforma.
Página 9 de 11
GUÍA TÉCNICA
GOBIERNO DE EXTREMADURA
Dirección General de
Administración Electrónica y Tecnologías de la Información
Desarrollo de Sistemas de
Información con la platafomra BI
Pentaho
Plataforma PDI
4.- Integración de aplicaciones
Como ya se ha comentado antes, la integración de las aplicaciones
(aplicaciones web java o portales web liferay) con pentaho BI server se
realizará utilizando los servicios web de pentaho. Para ello, las
aplicaciones deben disponer de un fichero de propiedades que permita
indicar los parámetros de acceso a los servicios web:
•
url.
•
usuario.
Página 10 de 11
GUÍA TÉCNICA
GOBIERNO DE EXTREMADURA
Dirección General de
Administración Electrónica y Tecnologías de la Información
•
Desarrollo de Sistemas de
Información con la platafomra BI
Pentaho
Password.
Por otro lado, no está permitido hacer uso del visor OLAP JPivot, ya
que en una plataforma pentaho BI compartida por varias aplicaciones el
rendimiento es prioritario, y el uso de consultas OLAP a través de JPivot
penaliza en gran medida el rendimiento.
Las aplicaciones pueden hacer uso de los informes generados por
pentaho, si bien es recomendable que, en la medida de lo posible, los
informes generados sean almacenados para su consumo por otros
usuarios, evitando repetir la consulta cada vez que se solicite el informe.
Los usuarios accederán a los informes, cuadros de mando, etc., a
través de una aplicación o portal web integrado con la plataforma, ya
que no tendrán acceso a la consola de usuario de la plataforma Pentaho BI.
5.- Pentaho Reporting
El motor de informes utilizado en las aplicaciones basadas en Pentaho es
el de librerías Pentaho Reporting SDK disponible en la plataforma Pentaho BI
basado en los productos Open Source JfreeReport y JfreeChart.
Página 11 de 11