proceso de business inteligente

36
JUAN GUILLERMO FORERO NEME DIPLOMADO EN BISINESS INTELLIGENCE AND DATA MINNING Proceso de Business Inteligente Extracción, Transformación y Carga ETL Creación cubo Reportes Contar con una base de datos, para este caso se cuenta con una base de datos de MariaDB (software)

Upload: juan-guillermo-forero-neme

Post on 07-Nov-2015

17 views

Category:

Documents


6 download

DESCRIPTION

Proceso de Business Inteligente

TRANSCRIPT

JUAN GUILLERMO FORERO NEMEDIPLOMADO EN BISINESS INTELLIGENCE AND DATA MINNINGProceso de Business InteligenteExtraccin, Transformacin y Carga ETLCreacin cuboReportesContar con una base de datos, para este caso se cuenta con una base de datos de MariaDB (software)

Este ejercicio ventas_e cuenta con las tablas ciudad_e, cliente_e, factura_e, f_pago_e, y vendedor_e y estn dispuestos en modelo estrella

Abra los datos en el apex de ORACLE.

La base de datos tambin est cargada en ORACLE, vista SQL WORKSHOP

En estas tablas creadas en ORACLE no hay datos, ac vamos a configurar el proceso de extraccin de informacin para que alimente los datos de MariaBD.El expositor comenta que se debe correr el programa spoon, localizado en una carpeta llamada data-integration

Para hacer las conexiones de las bases de datos se deben contar con los respectivos drivers o en su defecto crear conexiones ODBC y configurar una variable de entorno classpathHecho esto, se cargara el programa spoon

En spoon vamos a crear unas transformaciones y unos JobsTRANSFORMACIONClick derecho transformacin -> new

Se cargaran todos los objetos a los que tenemos acceso para desarrollar los cubos

Por la opcin view se va a hacer una configuracin que conecte las bases de datos, damos: click derecho -> database conections -> new

Configuramos primero la base de datos que tiene la informacin del cubo, esta data esta en MariaDBEn connection type usamos MySQL puesto que MariaDB comparte muchas caractersticas de este programa.

Es importante que los drivers o las conexiones estn debidamente configuradas, de no ser asi, el ejercicio no funcionar

La siguiente conexin se va a hacer para efectos prcticos del ejercicio en ODBC, esta creacin de la conexin por ODBC la realizamos en la unidad anterior, tanto para el DSN de sistema y DSN de usuario.

Las conexiones estn listas

Ahora se deben definir los objetos del cubo por la pestaa Desing

En input definimos la entrada de la informacin, en el caso del ejemplo usan tablas

Se usan 5 tablas que representan a las 5 tablas que estn en MariaDBOutput vamos a relacionar las 5 tablas de ORACLE

Transformaciones en esta opcin podemos crear formulas, filtros, declarar variables, constantesetc

SALIDA EN CASO DE SER FALSOSALIDA EN CASO DE SER VERDADEROFILTROTABLA

Guardado los archivos y ejecuto

El chulo verde que aparece en cada uno de los objetos significa que despus de la ejecucin del proceso no hay errores

EL PROCESO DE ETLRequiere de tables input o tablas de entrada, trasformaciones Select Values y tablas de salida o tables output

Se deben configurar cada una de las tablas, recuerde que las tablas de entrada provienen de MariaDB

Configure la seleccin de los campos segn su necesidad

Configure las tablas de salida, estas son las tablas de ORACLE

Grabe el proceso

Se ejecuta el proceso y valide que este bien hecho (chulos verdes)

Vamos a ORACLE y validamos la tabla factura_e, debe tener ya datos.

CREACION DEL CUBOIngrese a la carpeta Pentaho, en la carpeta esquemas es donde va a quedar el cubo guardado, en la carpeta schema workbench corremos el driver Workbench

Abierto schema workbench procedemos a realizar la configuracin de la conexin a ORACLE.

La conexin es de tipo JDBC Java Data Base ConnectionAhora creamos el schema

Schema, click derecho add cube, bautice el cubo

Click sobre el cubo y de damos add table y bautice la tabla

Debe buscar la tabla factura_e

Click derecho add dimensin Usage y alimentamos los campos name, foreingkey y source

Repita este paso para las dems dimensionesCREACION DE LAS MEDIDASClick derecho sobre el cubo add measure

Configure segn su necesidad las medidas que requiere el cubo

En el campo agregator puede incluir las operaciones que requiere que haga el cuboCree una nueva dimensin sobre SCHEMA y sobre esta nueva dimensin cree una nueva tabla y una nueva jerarqua

Sobre la nueva jerarqua cree un nuevo nivel

Esta tarea se debe repetir para todas las tablas (creacin de niveles)

Publique la informacin mediante la instruccin file publish

Entre a la carpeta Pentaho Administration console Se debe crear ahora publicar el trabajo, se hace lo siguiente: file publish start pac

Ahora Biserver Start pentaho

Ingrese a la consola localhost:8099

Configure las conexiones a las bases de datos por administration

La url esta en el archivo cadena de conexin

Pero como la conexin es con ORACLE usamos el dato que aparece debajo de las opciones de BASESCUBO

Configurada la consola no se puede cerrarContinue el proceso de publicacin

Ingrese a la consola localhost:8080/pentaho/login

Accese a la aokicacionAbra nuevo anlisis new analisys

Aparece el cuboMEDIDASDIMENSIONES

REPORTINGSe hace por reporting desing, active el programa launcher ubicado en la carpeta pentaho report-desing

Esta es la interfaz del programa

Configure el data source (JDBC) por la opcin data data solurce JDBC

Genere reporte de la BD de MariaDB, primero debe generar la conexin a la BD

Conectada la base, click al icono para crear un nuevo queryHecho esto nos van a aparecer las tablas con sus relaciones

En este paso debe seleccionar nicamente los valores que quiere que aparezcan en el queryPreview permite validar la estructura con la cual va a aparecer el reporte a manera de vista previa

Los objetos seleccionados de las tablas se arrastran al campo Details

Si activa el botn podr ver una vista previa del informe con los datos de las tablas

Repita esta operacin para la conexin ORACLE

En report header puede colocar imgenes al informe

Las grficas se pueden incluir en el campo report footer