proceso de business inteligente
DESCRIPTION
Proceso de Business InteligenteTRANSCRIPT
JUAN GUILLERMO FORERO NEMEDIPLOMADO EN BISINESS INTELLIGENCE AND DATA MINNINGProceso de Business InteligenteExtraccin, Transformacin y Carga ETLCreacin cuboReportesContar con una base de datos, para este caso se cuenta con una base de datos de MariaDB (software)
Este ejercicio ventas_e cuenta con las tablas ciudad_e, cliente_e, factura_e, f_pago_e, y vendedor_e y estn dispuestos en modelo estrella
Abra los datos en el apex de ORACLE.
La base de datos tambin est cargada en ORACLE, vista SQL WORKSHOP
En estas tablas creadas en ORACLE no hay datos, ac vamos a configurar el proceso de extraccin de informacin para que alimente los datos de MariaBD.El expositor comenta que se debe correr el programa spoon, localizado en una carpeta llamada data-integration
Para hacer las conexiones de las bases de datos se deben contar con los respectivos drivers o en su defecto crear conexiones ODBC y configurar una variable de entorno classpathHecho esto, se cargara el programa spoon
En spoon vamos a crear unas transformaciones y unos JobsTRANSFORMACIONClick derecho transformacin -> new
Se cargaran todos los objetos a los que tenemos acceso para desarrollar los cubos
Por la opcin view se va a hacer una configuracin que conecte las bases de datos, damos: click derecho -> database conections -> new
Configuramos primero la base de datos que tiene la informacin del cubo, esta data esta en MariaDBEn connection type usamos MySQL puesto que MariaDB comparte muchas caractersticas de este programa.
Es importante que los drivers o las conexiones estn debidamente configuradas, de no ser asi, el ejercicio no funcionar
La siguiente conexin se va a hacer para efectos prcticos del ejercicio en ODBC, esta creacin de la conexin por ODBC la realizamos en la unidad anterior, tanto para el DSN de sistema y DSN de usuario.
Las conexiones estn listas
Ahora se deben definir los objetos del cubo por la pestaa Desing
En input definimos la entrada de la informacin, en el caso del ejemplo usan tablas
Se usan 5 tablas que representan a las 5 tablas que estn en MariaDBOutput vamos a relacionar las 5 tablas de ORACLE
Transformaciones en esta opcin podemos crear formulas, filtros, declarar variables, constantesetc
SALIDA EN CASO DE SER FALSOSALIDA EN CASO DE SER VERDADEROFILTROTABLA
Guardado los archivos y ejecuto
El chulo verde que aparece en cada uno de los objetos significa que despus de la ejecucin del proceso no hay errores
EL PROCESO DE ETLRequiere de tables input o tablas de entrada, trasformaciones Select Values y tablas de salida o tables output
Se deben configurar cada una de las tablas, recuerde que las tablas de entrada provienen de MariaDB
Configure la seleccin de los campos segn su necesidad
Configure las tablas de salida, estas son las tablas de ORACLE
Grabe el proceso
Se ejecuta el proceso y valide que este bien hecho (chulos verdes)
Vamos a ORACLE y validamos la tabla factura_e, debe tener ya datos.
CREACION DEL CUBOIngrese a la carpeta Pentaho, en la carpeta esquemas es donde va a quedar el cubo guardado, en la carpeta schema workbench corremos el driver Workbench
Abierto schema workbench procedemos a realizar la configuracin de la conexin a ORACLE.
La conexin es de tipo JDBC Java Data Base ConnectionAhora creamos el schema
Schema, click derecho add cube, bautice el cubo
Click sobre el cubo y de damos add table y bautice la tabla
Debe buscar la tabla factura_e
Click derecho add dimensin Usage y alimentamos los campos name, foreingkey y source
Repita este paso para las dems dimensionesCREACION DE LAS MEDIDASClick derecho sobre el cubo add measure
Configure segn su necesidad las medidas que requiere el cubo
En el campo agregator puede incluir las operaciones que requiere que haga el cuboCree una nueva dimensin sobre SCHEMA y sobre esta nueva dimensin cree una nueva tabla y una nueva jerarqua
Sobre la nueva jerarqua cree un nuevo nivel
Esta tarea se debe repetir para todas las tablas (creacin de niveles)
Publique la informacin mediante la instruccin file publish
Entre a la carpeta Pentaho Administration console Se debe crear ahora publicar el trabajo, se hace lo siguiente: file publish start pac
Ahora Biserver Start pentaho
Ingrese a la consola localhost:8099
Configure las conexiones a las bases de datos por administration
La url esta en el archivo cadena de conexin
Pero como la conexin es con ORACLE usamos el dato que aparece debajo de las opciones de BASESCUBO
Configurada la consola no se puede cerrarContinue el proceso de publicacin
Ingrese a la consola localhost:8080/pentaho/login
Accese a la aokicacionAbra nuevo anlisis new analisys
Aparece el cuboMEDIDASDIMENSIONES
REPORTINGSe hace por reporting desing, active el programa launcher ubicado en la carpeta pentaho report-desing
Esta es la interfaz del programa
Configure el data source (JDBC) por la opcin data data solurce JDBC
Genere reporte de la BD de MariaDB, primero debe generar la conexin a la BD
Conectada la base, click al icono para crear un nuevo queryHecho esto nos van a aparecer las tablas con sus relaciones
En este paso debe seleccionar nicamente los valores que quiere que aparezcan en el queryPreview permite validar la estructura con la cual va a aparecer el reporte a manera de vista previa
Los objetos seleccionados de las tablas se arrastran al campo Details
Si activa el botn podr ver una vista previa del informe con los datos de las tablas
Repita esta operacin para la conexin ORACLE
En report header puede colocar imgenes al informe
Las grficas se pueden incluir en el campo report footer