software data warehouse

Upload: angao7

Post on 10-Oct-2015

39 views

Category:

Documents


0 download

TRANSCRIPT

Software Data Warehouse81 resultadosBalanced ScorecardSoftware Balanced Scorecard es la aplicacin de planeacin estratgica que permite diagnosticar y planear las estrategias de su organizacin, proceso o proyecto. Balanced Scorecard es una solucin que proporciona las herramientas necesarias para poder asociar las estrategias a act... (Software Business Intelligence/CPM)Empresa/Fabricante:KAWAKImplantadores:KAWAKTipo de licencia:CompraMianet WebReportsSoftware Mianet WebReports es una solucin BI de reporting que permite obtener toda la informacin en una sola consulta conviertiendose en una herramienta importante en la toma de decisiones. Con la aplicacin Mianet WebReports se pueden visualizar grficas de su base de datos al instante... (Software Business Intelligence/CPM)Empresa/Fabricante:JVSystemImplantadores:JVSystemTipo de licencia:CompraTableauSoftwareTableau es una empresa americana cuyo objetivo es ayudar las empresas a entender sus datos . Debido al volumen creciente de datos generados en el mundo Tableau Software naci con el objetivo de proveer una tecnologa puntera, gil y fcil de usa con fin de manejar muy grandes volumen... (Software Business Intelligence/CPM)Empresa/Fabricante:Tableau SoftwareImplantadores:AMSO GroupTipo de licencia:CompraBusiness ObjectsSoftware Business Objects es la solucin Integral de SAP que proporciona un acceso fcil de autoservicio a informacin prctica con nuestra plataforma de BI. Business Objects permite el acceso, en cualquier momento y desde cualquier lugar, a la informacin clave ofrecidos en contexto con ... (Software Business Intelligence/CPM)Empresa/Fabricante:SAPImplantadores:SAP,Accenture,T&GTipo de licencia:CompraTen Cuadro de mandoSoftware Ten Cuadro de mando operacional es la herramienta complementaria que ofrece en todo momento los indicadores que el usuario necesita. La aplicacin Ten Cuadro de mando permite la visualizacin de la informacin relevante, mostrndola como Indicadores respecto a los objetivos e... (Software Business Intelligence/CPM)Empresa/Fabricante:Ten SolutionsImplantadores:Ten SolutionsTipo de licencia:CompraeBusiness SolutionsSoftware eBusiness Solutions es la solucin que engloba todos los aspectos de la gestin del funcionamiento de su negocio, sin importar si se trata de un negocio individual, una cadena o una organizacin de franquicias. eBusiness Solutions proporciona un punto de integracin nico, poten... (Software Business Intelligence/CPM)Empresa/Fabricante:MICROS Systems, IncImplantadores:MICROS Systems, IncTipo de licencia:CompraDataGraficSoftware DataGrafic es la herramienta que nos ayuda a gestionar de manera dinmica toda la informacin, realizando consultas en tiempo real, consolidando grandes volmenes de datos en consultas OLAP generadas en diferido y permitiendo el acceso a bases de datos sean o no propietarias de Anta... (Software Business Intelligence/CPM)Empresa/Fabricante:ANTARA Soluciones tecnolgicasImplantadores:ANTARA Soluciones tecnolgicasTipo de licencia:CompraJet ExpressSoftware Jet Express es la herramienta integral de generacin de informes que a partir de la extraccin directa de datos desde Dynamics NAV permite crear de manera sencilla informes en Excel. Con Jet Express se puede tener acceso a toda la informacin de la empresa en tiempo real y poder... (Software Business Intelligence/CPM)Empresa/Fabricante:Jet ReportsImplantadores:Jet ReportsTipo de licencia:CompraJet EnterpriseSoftware Jet Enterprise es la solucin global para la gestin de Inteligencia Empresarial y generacin de informes creada para Microsoft Dynamics. Jet Enterprise permite tratar toda la informacin para poder realizar un anlisis completo y rpido ofreciendo las respuestas para conocer la ... (Software Business Intelligence/CPM)Empresa/Fabricante:Jet ReportsImplantadores:Jet ReportsTipo de licencia:CompraZafiroSoftware ZAFIRO es la aplicacin Business Intelligence que ofrece Antara Soluciones Tecnolgicas que permite transformar la informacin que proviene de una base de datos y la estructura de forma inteligente, fiable y til, transformando los datos en informacin que podemos utilizar para los... (Software Business Intelligence/CPM)Empresa/Fabricante:ANTARA Soluciones tecnolgicasImplantadores:ANTARA Soluciones tecnolgicasTipo de licencia:CompraICG BUSINESS INTELLIGENCESoftware ICG BUSINESS INTELLIGENCE es la solucin informtica que proporciona toda la informacin de la situacin de su empresa con el principal objetivo de aumentar la productividad y beneficio. ICG BUSINESS INTELLIGENCE es la herramienta que ayuda en la toma de decisiones y a planificar es... (Software Business Intelligence/CPM)Empresa/Fabricante:ICG SoftwareImplantadores:ICG SoftwareTipo de licencia:CompraMercur Business ControlSoftware Mercur Business Control es la solucin CPM (Corporate Performance Management) que facilita la realizacin de presupuestos, previsiones, planificacin, informes, consolidacin y anlisis. Mercur Business Control es una solucin multiusuario, utilizado por centenar de empresas... (Software Business Intelligence/CPM)Empresa/Fabricante:MercurSolutions ABImplantadores:AMSO GroupTipo de licencia:Compra,AlquilerGXquerySoftware GXquery es la solucin que permite visualizar y analizar la informacin de su negocio. GXquery es una potente herramienta de reportes que proporciona toda la informacin que necesitamos para la toma de decisiones. GXquery se puede vincular con bases de datos, crear una interfaz... (Software Business Intelligence/CPM)Empresa/Fabricante:ArtechImplantadores:ArtechTipo de licencia:CompraeFlex QueriesSoftware eFlex Queries , es la aplicacin que genera reportes requeridos a nivel de direccin a partir de la informacin global de la empresa. eFlex Queries ofrece todo tipo de informes detallados combinando la informacin recibida desde distintas reas y mdulos. eFlex Queries , es ... (Software Business Intelligence/CPM)Empresa/Fabricante:Sistemas BejermanImplantadores:Sistemas BejermanTipo de licencia:Compra

Mianet WebReportsSoftware Mianet WebReportses una solucin BI de reporting que permite obtener toda la informacin en una sola consulta conviertiendose en una herramienta importante en la toma de decisiones. Con la aplicacin Mianet WebReportsse pueden visualizar grficas de su base de datos al instante hace que las alertas o problemas en la gestin diaria de su Empresa se resuelvan de manera ms eficiente.Todos los datos de ventas, pedidos pendientes, rotacin de productos, variables de produccin, flujos de efectivo, tesorera en una web con acceso 24h desde su servidor.Mianet WebReportspermite la utilizacin desde distintos dispositivos , iPad o dispositivo Android, podr estar leyendo el resultado del da, viendo sus grficas, sus informes diarios, sus consultas cotidianas con un men fcil y que se configura en funcin del perfil que ocupe en la empresa. Organizar, gestionar y controlar, desde un nico sistema integrado, prcticamente todas las actividades que se realizan en cualquier departamento su empresa.Mianet WebReportsnos permite acceder a los datos almacenados en MIANET y a otras fuentes de informacin externas.Mianet WebReportsse parametriza segn las necesidades concretas de cada cliente, con un asesoramiento y una adaptacin personalizada (con logos, colores corporativos y fondos) de informes y el men atendiendo a las caractersticas de su sector.Mianet WebReportslleva detrs una consultora de negocio y tecnolgica para poder implantar y realizar los informes que desee.Quiero ampliar informacin sobre este producto >>Empresa/Fabricante:JVSystemTipo de licencia:Compra

eBusiness SolutionsSoftware eBusiness Solutionses la solucin que engloba todos los aspectos de la gestin del funcionamiento de su negocio, sin importar si se trata de un negocio individual, una cadena o una organizacin de franquicias. eBusiness Solutions proporciona un punto de integracin nico, potente y sencillo que permite acceder de manera fcil y rpida a travs de un navegador Web a informacin operativa y financiera como controles de mano de obra, gestin de inventario, prevencin de prdidas, valor almacenado e inteligencia empresarial.eBusiness Solutions es una suite de productos formada por :Mycentral.Con la innovadora arquitectura de software de comercio electrnico mycentral, MICROS integra el elemento final del puzzle: la integracin del nivel de consumidor en las soluciones de IT centrales y de tienda.mymicros.net.Es un potente sistema de inteligencia empresarial y almacenamiento de datos que compila y organiza informacin operativa y financiera tpica de todas sus tiendas en informes en lnea de fcil visualizacin.Enterprise Maintenance Services(EMS) Automatiza todas las cargas de datos de tiendas en el sistema de terminal punto de venta para los cambios sobre la marcha en artculos del men, precios, descuentos, impuestos y otros datos especficos de TPV.Mylabor. Gestiona tareas montonas de recursos humanos mediante una interfaz de usuario en lnea sencilla y de uso fcil.Myinventory. Es una slida aplicacin de inventario que proporciona funciones de gestin de existencias, recepcin y compras, junto con opciones completas de coste de productos y recetas tanto en una propiedad nica como en varios puntos de venta.Myprevention. Es una herramienta de informacin basada en excepciones que le ayuda a reducir prdidas drsticamente, obtener una mayor productividad, analizar mrgenes y lograr un retorno de la inversin rpido.iCare. Es un mdulo de relaciones con clientes que ofrece una forma sencilla de configurar y gestionar tarjetas regalo y programas de fidelidad basados en puntos con informacin completa a travs de mymicros.net.Quiero ampliar informacin sobre este producto >>Empresa/Fabricante:MICROS Systems, IncTipo de licencia:CompraSectores:Retail (Distribucin Comercial),Hoteles y Hosteleria

CG BUSINESS INTELLIGENCESoftware ICG BUSINESS INTELLIGENCEes la solucin informtica que proporciona toda la informacin de la situacin de su empresa con el principal objetivo de aumentar la productividad y beneficio.ICG BUSINESS INTELLIGENCEes la herramienta que ayuda en la toma de decisiones y a planificar estrategias empresariales a partir de transformar y tratar los datos empresariales centralizados en distintos puntos de venta de una cadena de establecimientos.ICG BUSINESS INTELLIGENCEaporta la informacin real y de tallada de las ventas con mltiples dimensiones y mtricas, proporcionando los criterios de anlisis y reglas de decisin para el futuro de su empresa.ICG BUSINESS INTELLIGENCEes un programa diseado para ser usado en el sector multinegocio (hostelera, comercios...), en distintos modelos de negocio (propios, franquicias, depsitos) y con carcter internacional adaptada a diferentes idiomas, monedas y fiscalidad.ICG BUSINESS INTELLIGENCEfacilita la exportacin de datos a Microsoft Excel y Adobe PDF.Quiero ampliar informacin sobre este producto >>Empresa/Fabricante:ICG SoftwareTipo de licencia:CompraSectores:Hoteles y Hosteleria

Mercur Business ControlSoftwareMercur Business Controles la solucin CPM (Corporate Performance Management) que facilita la realizacin de presupuestos, previsiones, planificacin, informes, consolidacin y anlisis.Mercur Business Controles una solucin multiusuario, utilizado por centenar de empresas, principalmente en Europa, de todo tamao y de cualquier sector. Empresas medianas, como grandes empresas como Securitas, Loomis, Hellmann Worldwide Logistics, Tetra Pack, Canal+, etc., as organizaciones publicas (sanidad, etc.) han elegido Mercur Business Controlpor su flexibilidad, su rapidez de implantacin, su POTENCIA Y SOLIDEZ de base de datos, y su alta aceptacin por parte de los usuarios.Mercur Business Controlpermite, en una nica herramienta, realizar la entrada de los presupuestos, planificacin, objetivos y el seguimiento y reporting. Incluyendo Balanced Scorecar y Anlisis de datos (BI).Mercur Business Controltiene como finalidad proporcionar a las empresas un entorno estructurado, fiable y gil de gestin y anlisis de datos para el control financiero y de gestin, sin obligacin de uso de hojas de clculo. Lo que puede realizar fcilmente conMercur Business Control: Presupuestos por centro de coste / productos / proyectos / etc. Presupuestos detallados como Recursos Humanos, Inversiones, etc. Asignar costes indirectos fcilmente, Repartos, ABC, ABB, etc. Aadir rpidamente nuevos negocios, centros de responsabilidad, vendedor, pas para realizar los presupuestos y/o el reporting y seguimiento. Controlar el flujo de informacin entre varios usuarios (workflow), plantillas, etc. Trabajar al internacional con gestin de divisas y multi idiomas. Realizar rpidamente anlisis de desviaciones. Tomar en cuenta la estacionalidad y variables regionales en su presupuesto. Calcular las revisiones a mitad de ao automticamente y mucho ms. Consolidacin automatica con diario de eliminacin, seguimiento de distintos tipos de eliminaciones.Mercur Business Controles complementario e integrable con cualquier sistema ( ERP, CRM, etc.) disponible en el mercado como: Dynamic NAV & AX, JDE, SAP, Oracle y otros.Quiero ampliar informacin sobre este producto >>Empresa/Fabricante:MercurSolutions ABTipo de licencia:Compra,Alquiler

3. SOFTWARE EN UN DATA WAREHOUSE

3.1 HERRAMIENTAS DE CONSULTA Y REPORTE

Existe una gran cantidad de poderosas herramientas de consulta y reporte en el mercado (Ver Anexo 1-A). Algunos proveedores ofrecen productos que permiten tener ms control sobre qu procesamiento de consulta es hecho en el cliente y qu procesamiento en el servidor.Las ms simples de estas herramientas son productos de reporte y consultas bsicas. Ellos proporcionan desde pantallas grficas a generadores SQL (o ms preciso, generadores de acceso-llamada a base de datos).Ms que aprender SQL o escribir un programa para accesar a la informacin de una base de datos, las herramientas de consulta al igual que la mayora de herramientas visuales, le permiten apuntar y dar un click a los mens y botones para especificar los elementos de datos, condiciones, criterios de agrupacin y otros atributos de una solicitud de informacin.La herramienta de consulta genera entonces un llamado a una base de datos, extrae los datos pertinentes, efecta clculos adicionales, manipula los datos si es necesario y presenta los resultados en un formato claro.Se puede almacenar las consultas y los pedidos de reporte para trabajos subsiguientes, como est o con modificaciones. El procesamiento estadstico se limita comnmente a promedios, sumas, desviaciones estndar y otras funciones de anlisis bsicas. Aunque las capacidades varan de un producto a otro, las herramientas de consulta y reporte son ms apropiadas cuando se necesita responder a la pregunta "Qu sucedi"? (Ejemplo: "Cmo comparar las ventas de los productos X,Y y Z del mes pasado con las ventas del presente mes y las ventas del mismo mes del ao pasado?").Para hacer consultas ms accesibles a usuarios no-tcnicos, los productos tales como Crystal Reports de Seagate, Impromptu de Cognos, Reportsmith de Borland, Intelligent Query de IQ Software, Esperant de Software AG y GQL de Andyne, ofrecen interfases grficas para seleccionar, arrastrar y pegar.Lo ms avanzado de estos productos lo orientar hasta las consultas que tienen sintaxis mala o que devuelven resultados imprevistos. El acceso a los datos han mejorado tambin con las nuevas versiones de estos productos y los vendedores ya instalan drivers estndares tales como ODBC y 32-bit nativo, hasta fuentes de datos comerciales.En general, los administradores de data warehouses que usen estos tipos de productos, deben estar dispuestos a ocupar su tiempo para resolver las tareas de estructuracin, como administrar bibliotecas y directorios, instalar software de conectividad, establecer nombres similares en Ingls y precalcular "campos de datos virtuales".Una vez que se han creado las pantallas SQL, puede necesitar desarrollar un conjunto de consultas y reportes estndares, aunque algunos productos ofrecen libreras de plantillas prediseadas y reportes predefinidos que se pueden modificar rpidamente.3.2 HERRAMIENTAS DE BASE DE DATOSMULTIDIMENSIONALES / OLAP

Los generadores de reporte tienen sus limitaciones cuando los usuarios finales necesitan ms que una sola, una vista esttica de los datos, que no sean sujeto de otras manipulaciones. Para estos usuarios, las herramientas del procesamiento analtico en lnea (OLAP - On Line Analytical Processing), proveen capacidades "Slide y Dice" que contestara "qu sucedi?" al analizar por qu los resultados estn como estn.Las primeras soluciones OLAP estuvieron basadas en bases de datos multidimensionales (MDDBS). Un cubo estructural (dos veces un hipercubo o un arreglo multidimensional) almacenaba los datos para que se puedan manipular intuitivamente y claramente ver las asociaciones a travs de dimensiones mltiples. Los productos pioneros tal como Essbase de Arbor Software soportan directamente las diferentes vistas y las manipulaciones dimensionales requeridas por OLAP.Limitaciones del enfoque de bases de datos multidimensionales:1ra.:Las nuevas estructuras de almacenamiento de datos requieren bases de datos propietarias. No hay realmente estndares disponibles para accesar a los datos multidimensionales.Los proveedores como Arbor, vieron sto como una oportunidad para crear de facto normas para editar MDDB APIs, propiciando herramientas terceristas y estableciendo asociaciones estratgicas.Muchas de estas herramientas de consulta y de soluciones data-mining soportan directamente Essbase, Oracle Express y otros formatos MDDB comunes. El Commander OLAP, herramienta cliente/servidor de Comshare, se sita sobre la parte superior de un data warehouse multidimensional Essbase y soporta el acceso dinmico y la manipulacin de los datos.2da.:La segunda limitacin de un MDDB concierne al desarrollo de una estructura de datos. Las compaas generalmente almacenan los datos de la empresa en bases de datos relacionales, lo que significa que alguien tiene que extraer, transformar y cargar estos datos en el hipercubo.Este proceso puede ser complejo y consumidor de tiempo pero, nuevamente, los proveedores estn investigando la forma de solucionarlos. Las herramientas de extraccin de datos y otras automatizan el proceso, trazando campos relacionales en la estructura multidimensional y desarrollando el MDDB sobre la marcha.Algunos proveedores ofrecen ahora la tcnica OLAP relacional (Relational On Line Analytical Processing - ROLAP), que explora y opera en el data warehouse directamente usando llamadas SQL estndares. Las herramientas de pantallas permiten retener los pedidos multidimensionales, pero el motor ROLAP transforma las consultas en rutinas SQL. Entonces se recibe los resultados tabulados como una hoja de clculos multidimensional o en alguna otra forma que soporte rotacin, drilling down y reduccin.As como la extraccin de los datos, el desarrollo y evolucin de la estructura MDDB puede cambiarse. Los administradores ROLAP deben afrontar algunas veces las tareas (agobiantes) de desarrollar las rutinas SQL para agregar e indexar los datos ROLAP, as como, asegurar la traduccin correcta de los pedidos multidimensionales en la ventana de comandos SQL.Los defensores de ROLAP argumentan que se usan estndares abiertos (SQL) y que se esquematiza (nivel de detalle) los datos para hacerlos ms fcilmente accesibles. Por otra parte, argumentan que una estructura multidimensional nativa logra mejor performance y flexibilidad, una vez que se desarrolla el almacn de los datos.Lo bueno es que estas tecnologas evolucionan rpidamente y/o pueden proveer una pronta solucin OLAP. Algunos productos ejemplos son PowerPlay de Cognos, Business Objects con el software del mismo nombre, Brio Query de Brio Technology y una serie de DSS Agent/DSS Server de MicroStrategy.Los retos administrativos y de desarrollo de OLAP, a diferencia de las encontradas con las herramientas de consulta y reporte, son generalmente ms complejos. Definiendo el OLAP y el software de acceso a los datos, se requiere un claro entendimiento de los modelos de datos de la corporacin y las funciones analticas requeridas por ejecutivos, gerentes y otros analistas de datos.El desarrollo de productos comerciales pueden aminorar los problemas, pero OLAP es raramente una solucin clave. La arquitectura debe permitir el soporte a su fuente de datos y requerimientos. Pero una vez que se ha establecido un sistema OLAP, el soporte al usuario final ser mnimo.Los usuarios de estos productos deben decidir sobre si los datos del procesamiento analtico en lnea, deberan almacenarse en bases de datos multidimensionales especialmente diseadas o en bases de datos relacionales. Esto depende de las necesidades de la organizacin. En el Anexo 1-B, se indica si un producto almacena datos en bases de datos relacionales o en una base de datos multidimensional (MDDB).

3.3 SISTEMAS DE INFORMACION EJECUTIVOS

Las herramientas de sistemas de informacin ejecutivos (Executive Information Systems - EIS), proporcionan medios sumamente fciles de usar para consulta y anlisis de la informacin confiable. Generalmente se disean para el usuario que necesita conseguir los datos rpidamente, pero quiere utilizar el menor tiempo posible para comprender el uso de la herramienta.Tambin, permiten a los desarrolladores de sistemas colocar el contexto del negocio alrededor de informacin diversa. Un uso tpico de un EIS es facilitar al usuario la recuperacin y anlisis de la mtricas, de performance de la organizacin.El precio de esta facilidad de uso es que por lo general existen algunas limitaciones sobre las capacidades analticas disponibles con el sistema de informacin ejecutivo. Adems, muchas de las herramientas de consulta/reporte y OLAP/multidimensional, pueden usarse para desarrollar sistemas de informacin ejecutivos.El concepto de sistema de informacin ejecutivo es simple: los ejecutivos no tienen mucho tiempo, ni la habilidad en muchos casos, para efectuar el anlisis de grandes volmenes de datos. El EIS presenta vistas de los datos simplificados, altamente consolidados y mayormente estticas.Categoras de Ambientes EIS:1.Ellibro electrnicoes una versin en lnea, electrnica, contraparte del papel que muchos ejecutivos usan en reuniones con el personal. Las diapositivas electrnicas presentan una visin concreta de una iniciativa organizacional o quizs los datos para dar a conocer la situacin actual de un proyecto importante.2.Elcentro de comandoes bsicamente una coleccin de puertos en un amplio conjunto de reportes, el newsgroup recupera desde Internet y otros materiales que proveen conocimientos en la organizacin.Los reportes del centro de comando pueden ser accesados diariamente o con ms frecuencia, si la informacin cambia constantemente o slo cuando se garantiza las excepciones. Algunos productos generan alarmas cuando ocurren las excepciones especificadas.Cuando sea apropiado, cada diapositiva del libro electrnico o pantalla del centro de comando, debera permitir al ejecutivo recibir informacin adicional si lo desea (y si est disponible). A diferencia del modelo OLAP, donde el incremento de niveles de informacin se dan a conocer tal como el analista manipula los datos, un ejecutivo espera una descripcin global. No deberan escudriar para obtener respuestas.Por ello, cuando los ejecutivos piden ms informacin desde las diapositivas del libro electrnico o de las pantallas del centro de comandos, la presentacin debera ser cuidadosamente elaborada para presentar principalmente informacin adicional amplificada. El ejecutivo debe ser capaz de pasar cada punto para "ms informacin", sin perder alguna informacin crtica.Los ejecutivos pueden administrar su propio libro electrnico y centro de comandos o los administradores pueden mantener y modificar el EIS de acuerdo a las especificaciones del ejecutivo. Los sistemas de informacin ejecutivos, generalmente tienen una programacin que variar en complejidad de un producto a otro. Los pioneros en el mercado de EIS incluyen Comshare, creadores del Commander EIS y Pilot Software, desarrolladores del Pilot Command Center.En el Anexo 1-C, se incluye una relacin de productos y empresas que brindan herramientas de Sistemas de Informacin Ejecutivos.3.4 HERRAMIENTAS DATA MINING

Data mining es una categora de herramientas de anlisis open-end. En lugar de hacer preguntas, se toma estas herramientas y se pregunta algo "interesante", una tendencia o una agrupacin peculiar, por ejemplo. El proceso de data mining extrae los conocimientos guardados o informacin predictiva desde el data warehouse sin requerir pedidos o preguntas especficas.Las herramientas Mining usan algunas de las tcnicas de computacin ms avanzadas como: redes neurales deteccin de desviacin modelamiento predictivo y programacin genticapara generar modelos y asociaciones. Mining es un dato-conducido, no una aplicacin-conducida.El Intelligent Miner de IBM para AIX soporta sofisticadas tcnicas mining, as como las funciones de preparacin de los datos para extraer informacin desde bases de datos Oracle o Sybase y cargarlos en DB2 para mining. Con su opcin Data Mine para el motor Red Brick Warehouse 5.0, Red Brick integra la funcionalidad de un data mining y la arquitectura de almacenamiento.Otros ejemplos de herramientas data mining comerciales incluyen Darwin de Thinking Machines, herramientas de visualizacin de datos en MDDB de SAS Institute, SGI MineSet y Focus 6 Serie de Visualizacin y Anlisis de Information Builders.3.5 SISTEMAS DE GESTION DE BASES DE DATOS

Estos software proporcionan procesamiento en paralelo y/o algo fuera de los aspectos ordinarios, que puedan ser especialmente interesantes para la gente de desarrollo de data warehouse y de sistemas de soporte de decisiones.Se incluye el Anexo 1-D con una relacin de Bases de Datos usados para Data Warehouse.3.6 ELECCION DE HERRAMIENTAS

Hay algunas reglas obvias a seguir cuando se eligen herramientas de anlisis. Las herramientas se combinan segn las necesidades de los usuarios finales, capacidad tcnica empresarial y la fuente de datos existente.1Si se elige un proveedor de depsito que adems ofrece herramientas integradas, probablemente se ahorrar un tiempo de desarrollo significativo al elegir un conjunto de herramientas compatibles.De otro modo, seleccione un conjunto de herramientas que soporte su fuente de datos original. Sin ese soporte, se debera optar por una solucin OLAP relacional debido a que provee una arquitectura abierta.2Despus que se ha seleccionado un conjunto de herramientas compatible con su fuente de datos, determine cunto anlisis necesita realmente. Si usted simplemente necesita saber "cunto" o "cuntos", ser suficiente una herramienta bsica de consultas y reportes. Si usted requiere un anlisis ms avanzado que explique la causa y los efectos de las ocurrencias y las tendencias, busque una solucin OLAP. Las herramientas data mining sofisticadas requieren expertos en tcnicas de anlisis de datos y se necesitan para pronsticos avanzados, clasificacin y creacin del modelo.

3Como con cualquier tecnologa, para el mejor desempeo de su compaa, se puede optar por una solucin nica o un conjunto de soluciones. Su personal debe comprender los requerimientos de tecnologa, desarrollar soluciones que renan esos requerimientos y mantener y mejorar efectivamente los sistemas.Los softwares de negocio inteligentes son slo herramientas. Todava se necesita gerentes y ejecutivos que capten los conocimientos derivados y tomen decisiones intuitivamente. En otras palabras, estos softwares requieren todava inteligencia comercial propia.En la siguiente tabla se definen los parmetros a tener en cuenta para la eleccin de las herramientas adecuadas.

Elija la Herramienta adecuada

Tipo de HerramientaPregunta bsicaModelo de SalidaUsuario tpico

Consulta y ReporteQu sucedi?Reportes de ventas mensuales;histrico de inventarioNecesita data histrica puede tener aptitud tcnica limitada

Procesamiento analticoen lnea (OLAP)Qu sucedi ypor qu?Ventas mensuales vs. Cambiosde precio de los competidoresNecesita ir de una visin esttica de los datos a "slicing and dicing"tcnicamente astuto

Sistema de InformacinEjecutiva (SIE)Qu necesitoconocer ahora?Libros electrnicos;Centros de comandosNecesita informacin resumida o de alto nivel puede no ser tcnicamente astuto

Data miningQu es interesante?Qu podra pasar?Modelos predictivosNecesita extraer la relacin ytendencias de la data ininteligibletcnicamente astuto.

ANEXOSN 1 Software en una Data EWarehouse

Anexo 1-AHERRAMIENTAS DE CONSULTA Y REPORTE

PRODUCTOEMPRESA DISTRIBUIDORA

AccessMicrosoft

Access+Sonetics

Actuate Reporting SystemActuate Software Corporation

AMIS Information ServerHoskyns Group plc

Application SystemIBM

ApproachLotus Corporation

ARPEGGIOWall Data Inc.

APTuserInternational Software Group

AS/Access for Microsoft AccessMartin Spencer & Associates

ASK JoeInformation Management Services

aXcess/400Glenbrook Software

BrioQueryBrio Technology

Business ObjectsBusiness Objects, Inc.

Clear: AccessSterling Software

Crystal Reports, Crystal InfoSeagate Software

d.b. ExpressComputer Concepts Corp.

Databoard, DatareadSLP Infoware

DataDirect ExplorerIntersolv

DataSiteNetScheme Solutions, Inc.

DB PublisherXense Technology Inc.

DbPowerDb-Tech Inc.

Decision AnalyzerDecisin Technology

DECquery, DECdecisionTouch Technologies, Inc.

Discoverer, Discoverer/2000Oracle Corporation

DS Server, DS ModelerInterweave

EasyReporterSpeedware Corporation

Eclipse Query/ReportCornut Informatique

ELFELF Software

English WizardEnglish Wizard

EnQuiryProgress Software

EsperantSpeedware

FOCUS SixInformation Builders, Inc.

4S-ReportFour Seasons Software, Inc

FreequeryDimension Software Systems

Front & Center for Reporting, NomadThomson Software Products

GQLAndyne

HarborLightHarbor Software

HP Information AccessHewlett-Packard

ifLeep Technology, Inc.

Impress, SqlBuddyObjective Technologies, Inc.

ImpromptuCognos Corporation

InfoAssistantAsymetrix

PRODUCTOEMPRESA DISTRIBUIDORA

InfoMakerPowersoft Corporation

InfoQueryPlatinum Technology, Inc.

InfoReportsPlatinum Technology, Inc.

InformEnt Warehouse DesktopFiserv

Internet DataSpotDTL Data Technologies Ltd.

inSightWilliams & Partner

Interactive QueryNew Generation software

IQ/Objects, IQ/SmartServerIQ Software Corporation

Iridon PanoramaThe Great Elk Company Limited

KinetixHilco Technologies

LANSA/ClientLANSA USA

MARKIS/400AS Software

NirvanaSynergy Technologies

OR-REPORTER IIOutput Reporting, Inc.

Oracle Reports, BrowserOracle Corporation

ParadoxBorland

Platinum Report FacilityPlatinum Technology, Inc

ProBitSystem Builder

Productivity Series Reportsmichaels, ross & cole

QBE VisionSysdeco

QMFIBM

QueryObjectCross/Z International, Inc.

QuestCentura Software Corporation

R&R Report WriterConcentric Data Systems

Report WriterRaima

ReportoireSynergistic Systems, Inc.

ReportsNine to Five software Co.

ReporToolZen Software

ReportSmithBorland

Rocket ShuttleRocket Software, Inc.

Safari ReportWriterInteractive Software Systems

Sagent Data Mart SolutionSagent Technology, Inc.

SAS SystemSAS Institute

Second WindAnju Technologies

Select!Attachmate

SEQUELAdvanced Systems Concepts

Snow Report WriterSnow International Corporation

Spectrum WriterPacific Systems Group

SQLPRO AgentBeacon Ware, Inc.

SQR WorkbenchMITI

Star TrackerLeep Technology, Inc.

StrategyShowCase Corporation

The ReporterSea Change Systems, Inc

Unique XTRAUnique AS

URSA InfoSuiteDecision Support Inc.

ViewPointInformix

PRODUCTOEMPRESA DISTRIBUIDORA

ViewPointSoliton Associates

ViperBrann Software

VisPro/ReportsHock Ware

Visual CyberqueryCyberscience Corporation

Visual DbaseBorland

Visual ExpressComputer Associates International

Visual FoxProMicrosoft Corporation

Visual NetCNet Svenska AB

Visualizer Query, ChartsIBM

VoyantBrossco Systems

WebBizCybercom Partners

WebSeQueLInfoSpace Inc.

WinQLData Access Corporation

XentisGrayMatter Software Corporation

Anexo 1-BHERRAMIENTAS DE BASE DE DATOS MULTIDIMENSIONAL/OLAP

PRODUCTOEMPRESA DISTRIBUIDORATIPO

Acuity ESAcuity Management Systems Ltd.MDDB

Acumate ESKenan Systems CorporationMDDB

Advance For WindowsLighten, Inc.MDDB

AMIS OLAP ServerHoskyns Group plcMDDB

BrioQueryBrio TechnologyMDDB

Business ObjectsBusiness Objects, Inc.Relacional

Commander OLAP, Decision, PrismComshare Inc.MDDB

ControlKCI ComputingRelacional

CrossTargetDimensional InsightMDDB

Cube-ItFICS GroupMDDB

DatamanSLP InfowareMDDB

DataTrackerSilvon Software, Inc.Relacional

DecisionSuiteInformation Advantage, Inc.Relacional

Delta SolutionsMIS AGMDDB

Demon for WindowsData Command LimitedMDDB

DSS AgentMicroStrategyRelacional

DynamicCube.OCXData Dynamics, Ltd.Relacional

EKS/EmpowerMetapraxis, Inc.MDDB

Essbase Analysis ServerArbor Software CorporationMDDB

Essbase/400ShowCase CorporationMDDB

Express Server, ObjectsOracleMDDB

FiscalLingo Computer Design, Inc.Relacional

FusionInformation Builders, Inc.MDDB

FYI PlannerThink SystemsMDDB

GentiaPlanning SciencesMDDB

HelmCodeworksMDDB

HolosHolistic SystemsMDDB

Hyperion OLAPHyperion SoftwareMDDB

InfoBeaconPlatinum technology, Inc.Relacional

InformerReportechMDDB/Relacional

Intelligent Decision ServerIBMRelacional

IQ/VisionIQ Software CorporationRelacional

KhalixLongview Solutions, Inc.Relacional

LightshipPilot Software, Inc.MDDB

MatryxStone, Timber, RiverMDDB

MDDB ServerSASRelacional

MediaSpeedware CorporationMDDB

MetacubeInformixRelacional

MIKSolutionMIKMDDB

MIT/400SAMAC, IncMDDB

PRODUCTOEMPRESA DISTRIBUIDORATIPO

MSMMicronetics Design CorporationMDDB

MuseOCCAM Research Corp.MDDB

OLAP OfficeGraphitti Software GmbHMDDB

OpenOLAPInphase Software LimitedRelacional

PabloAndyneMDDB/Relacional

ParaScopeDataVistaRelacional

PowerPlayCognos CorporationMDDB/Relacional

StarTrieveSelectStarRelacional

The Ant ColonyGeppetto's Workshop LLCRelacional

TM/1ApplixMDDB

TotoAmbit Research Ltd.MDDB

Track for OLAPTrack Business SolutionsMDDB

Visualizer Plans for OS/2IBMMDDB

MDDB:Multidimensional Data Base.Anexo 1-CSISTEMAS DE INFORMACION EJECUTIVOS

PRODUCTOEMPRESA DISTRIBUIDORATIPO

Acuity/ESAcuity Management Systems Limited1

ApplixwareApplix1

BusinessMetricsValstar Systems Ltd.1

BOARDPragma Inform1

COINSRussell Consulting Limited1

ColumbusEISJitcons YO1

Commander EISComshare Inc.1

Corporate Management/ Financial Executive Information SystemStrategic Information Associates, Inc.1

CorVuCorVu Pty Ltd.1

Decision SuiteSoftkit1

Discovery EISAtlantic Information Systems Ltd.1

EISInphase Software Limited1

Electronic Balanced ScorecardASI Financial Services1

Enterprise PeriscopeEveryware Development Corp.1

EurekaEuropean Management Systems1

ExecuSenseTLG Corporation1

FOCUS EISInformation Builders, Inc.1

Forest & TreesPlatinum Technologies, Inc.1

iMonitorBayStone Software1

InfoManagerFerguson Information Systems1

Iridon AlmanacThe Great Elk Company Limited1

inSightArcplan Information Services2

LEADERSterling Strategic Solutions1

PRODUCTOEMPRESA DISTRIBUIDORATIPO

MagnaFORUMForum Systems, Inc.1

MeritGIST, s.r.o.1

Open EIS PakMicrosoft1

Panorama Business ViewsPanorama Business Views Inc.1

PerspectivesSyntell1

QbitZenia Software, Inc.1

RevealCSD Software Inc.1

SAS SystemSAS Institute1

Show Business EISShow Business Software1

Tiler EIS++Avoca Systems Limited1

TrackTrack Business Solutions1

Traffic Control EISResearch & Planning, Inc.3

VentoMap, VentoSalesVento Software Inc.1

Virtual Headquarters Management SystemvHQ LLC1

Visual EISSynergistic Software1

Visual PublisherKMA Associates International, Inc1

VITALBraintec Corporation1

WingzInvestment Intelligence Systems Group1

Wired for OLAPAppSource Corporation1

Xecutive Pulse EISMegatrend Systems, Ltd.1

1. Proporciona un sistema de informacin ejecutivo con capacidades analticas.2. Proporciona un sistema de informacin ejecutivo con capacidades analticas para usuarios SAP R/3.3. Proporciona un sistema de informacin ejecutivo con capacidades analticas para usuarios SAP R/2 y R/3.http://www.ongei.gob.pe/publica/metodologias/Lib5084/index.htm

Anexo 1-DBASES DE DATOS USADAS PARA DATA WAREHOUSE

PRODUCTOEMPRESA DISTRIBUIDORA

Adabas DSoftware AG

Advanced PickPick Systems

DB2IBM

Fast-Count DBMSMegaPlex Software

HOPSHOPS International

Microsoft SQL ServerMicrosoft

Model 204Computer Corporation of America

NonStop SQLTandem

Nucleus ServerSand Technology Systems

OnLine Dynamic Server,Extended Parallel ServerInformix

OpenIngresComputer Associates

Oracle ServerOracle

RdbOracle

Red Brick WarehouseRed Brick Systems

SAS SystemSAS

Sybase IQSybase

Sybase SQL Server, SQL Server MPPSybase

SymfoWAREFujitsu

Teradata DBSNCR

THORHitachi

Time MachineData Management Technologies, Inc.

TitaniumMicro Data Base Systems, Inc.

UnidataUnidata, Inc.

UniVerseVMARK

VisionInnovative Systems Techniques, Inc.

WX9000White Cross Systems Inc.

XDB ServerXDB Systems, Inc.

Data Warehouse 27/11/09 Administracin de las Tecnologas de la Informacin FACULTAD DE INGENIERA INDUSTRIAL Y DE SISTEMAS 2. Definiciones de Data Warehouse Un Data Warehouse es un conjunto integrado de bases de datos, con orientacin temtica, que estn diseados para el apoyo a la Toma de Decisiones, y donde cada unidad de datos es relevante en algn momento del tiempo Bill H. Inmon "una copia de las transacciones de datos especficamente estructurada para la consulta y el anlisis o"la unin de todos los Data marts de una entidad Ralph Kimball Yo considero al DW como algo que provee dos beneficios empresariales reales: Integracin y Acceso de datos. DW elimina una gran cantidad de datos intiles y no deseados, como tambin el procesamiento desde el ambiente operacional clsico Susan Osterfeldt 27/11/09 Administracin de las Tecnologas de la Informacin 3. Objetivos Hacer la informacin de la organizacin accesible Hacer a la informacin de la organizacin consistente Controlar el acceso efectivo a los datos Generar informacin de manera flexible Servir de ayuda a la toma de decisiones 27/11/09 Administracin de las Tecnologas de la Informacin 4. En resumen Un Data Warehouse tiene como objetivo almacenar y proveer a la Organizacin de informacin relevante y a tiempo 27/11/09 Administracin de las Tecnologas de la Informacin 5. Importancia del Data Warehouse Mejorar la Entrega de Informacin: . Mejorar el Proceso de Toma de Decisiones Impacto Positivo sobre los Procesos Empresariales 27/11/09 Administracin de las Tecnologas de la Informacin 6. A pensar antes de implementar un Data Warehouse La amplitud; el nmero de diferentes temas y puntos de foco Fuentes que proveern datos brutos. Los medios por los cuales los datos se transportan de las aplicaciones fuente y son cargados al Data Warehouse. Las reglas de negocio que se aplican a la data en bruto para producir activos de datos de alta calidad. Las bases de datos receptoras, en la que estos activos de datos sern almacenados. Los activos de datos; los elementos, el nivel de detalle de cada elemento, y cunta historia se ha mantenido, por ejemplo. La Inteligencia de negocio Herramientas de nivel usuario para acceder a los activos de datos. La arquitectura y complejidad en general del entorno. 27/11/09 Administracin de las Tecnologas de la Informacin 7. Empresas que usan DATA WAREHOUSE Royal bank of canada Paypal 3M Coca-Cola Company Verizon Ford Motor Company Herramientas de nivel usuario para acceder a los activos de datos. La arquitectura y complejidad en general del entorno. 27/11/09 Administracin de las Tecnologas de la Informacin 8. 27/11/09 Administracin de las Tecnologas de la Informacin 9. Productos (suites) de DATA WAREHOUSE y BI IBM Cognos http://www-01.ibm.com/software/data/cognos/ Teradata http://www.teradata.com Oracle Hyperion http://www.oracle.com/hyperion/index.html MicroStrategy http://www.strategy.com SAS http://www.sas.com 27/11/09 Administracin de las Tecnologas de la Informacin 10. Caractersticas de un Data Warehouse Orientado a un tema Administra grandes cantidades de informacin Guarda informacin en diversos medios de almacenamiento Comprende mltiples versiones de uno (o varios) esquema de base de datos Condensa y agrega informacin Integra y asocia informacin de muchas fuentes 27/11/09 Administracin de las Tecnologas de la Informacin 11. Diferencias entre un sistema de Data Warehouse y aplicaciones tradicionales 27/11/09 Administracin de las Tecnologas de la Informacin SISTEMAS TRADICIONALES DATAWAREHOUSE Predomina la actualizacin. Actividad operativa (da a da). Proceso puntual. Estabilidad. Datos desagregados. Dato actual. Respuesta de la transaccin inmediata. Estructura relacional. Usuarios de perfiles bajos. Explotacin de la informacin relacionada con operatividad de cada aplicacin Predomina la consulta Anlisis y decisin estratgica. Proceso masivo. Dinamismo. Niveles de detalle/agregacin. Dato histrico. Respuesta masiva Estructura Multidimensional Usuarios de perfiles altos. Explotacin de informacin interna y externa relacionada con el negocio. 12. Metodologas de Diseo de Data Warehouse Metodologa de Inmon (Top Bottom) 27/11/09 Administracin de las Tecnologas de la Informacin 13. Metodologa de Kimball (Bottom-up) 27/11/09 Administracin de las Tecnologas de la Informacin 14. Metodologa agil para la implementacin de un dw 27/11/09 Administracin de las Tecnologas de la Informacin 15. Page Arquitectura de un Data Warehouse 27/11/09 Administracin de las Tecnologas de la Informacin 16. Production systems Other sources CRM Billing Activation systems Other DBs Files ETL DataWarehouse OLAP cubes Business Users Querying & Reporting tools Acquisition Storage / Archiving Restitution Datamarts Flujo de Datos de un DW 27/11/09 Administracin de las Tecnologas de la Informacin 17. Page Base de datos operacional / Nivel de base de datos externo. Nivel de acceso a los datos Nivel de organizacin de datos Nivel de data warehouse Nivel de acceso a la informacin Nivel de gestin de proceso Arquitectura de un Data Warehouse 27/11/09 Administracin de las Tecnologas de la Informacin 18. Page Base de datos operacional / Nivel de base de datos externo (Fuentes de datos) Los sistemas operacionales procesan datos para apoyar las necesidades operacionales crticas, tales como ERPs, SCMs, tambin se procesa informacin de fuentes de datos externas, tales como de la internet, INEI, BCRP. Nivel de acceso a los datos Es responsable de la interfaces entre las herramientas de acceso a la informacin y las bases de datos operacionales. En algunos casos, esto es todo lo que un usuario final necesita para realizar estas interfases se utiliza el SQL (Standar Query Lenguaje) Elementos de la Arq. De un DW 27/11/09 Administracin de las Tecnologas de la Informacin 19. Page Nivel de organizacin de datos El componente final de la arquitectura data Warehouse es la organizacin de los datos, incluye todos los procesos necesarios como seleccionar, editar, resumir, combinar y cargar datos en el depsito y acceder a la informacin desde bases de datos operacionales y/o externas Nivel de data warehouse En un data Warehouse fsico, el almacenaje de data procesada, incluso en forma redundante Elementos de la Arq. De un DW 27/11/09 Administracin de las Tecnologas de la Informacin 20. Page Nivel de acceso a la informacin Este nivel se incluye el hardware y software involucrados en representar y proveer de informacin al usuario final normalmente usa da a da. Por ejemplo: Excel, Lotus 1-2-3, Focus, Access, SAS, etc. Nivel de gestin de proceso El nivel de gestin de procesos tiene que ver con la programacin de diversas tareas que deben realizarse para construir y mantener actualizado el data warehouse y la informacin del directorio de datos. Elementos de la Arq. De un DW 27/11/09 Administracin de las Tecnologas de la Informacin 21. PROYECTO DE ELABORACION DE UN DATA WAREHOUSE 1 FACTORES EN LA PLANIFICACION DE UN DATA WAREHOUSE Establecer una asociacin de usuarios, gestin y grupos Construir prototipos rpida y frecuentemente Implementacin incremental Reportar activamente y publicar los casos exitosos Administracin de las Tecnologas de la Informacin Fase 1: Organizacin 27/11/09 22. PROYECTO DE ELABORACION DE UN DATA WAREHOUSE 2 ESTRATEGIAS PARA EL DESARROLLO DE UN DATA WAREHOUSE Administracin de las Tecnologas de la Informacin Quin es el auditorio? Cul es el alcance? Qu tipo de data warehouse debera construirse? 1ra.: Establecer un ambiente "data warehouse virtual. 2da.: Construir una copia de los datos operacionales desde un sistema operacional nico y posibilitar al data warehouse de una serie de herramientas de acceso a la informacin. 3ra.: Finalmente, la estrategia data warehousing ptima es seleccionar el nmero de usuarios basados en el valor de la empresa y hacer un anlisis de sus puntos, preguntas y necesidades de acceso a datos. 27/11/09 23. PROYECTO DE ELABORACION DE UN DATA WAREHOUSE Administracin de las Tecnologas de la Informacin 3 ESTRATEGIAS PARA EL DISEO DE UN DATA WAREHOUSE 1ra. : Los usuarios de los data warehouses usualmente no conocen mucho sobre sus requerimientos y necesidades como los usuarios operacionales. 2da.: El diseo de un data warehouse, con frecuencia involucra lo que se piensa en trminos ms amplios y con conceptos del negocio ms difciles de definir que en el diseo de un sistema operacional. Al respecto, un data warehouse est bastante cerca a Reingeniera de los Procesos del Negocio (Business Process Reengineering). 3ra.: Finalmente, la estrategia de diseo ideal para un data warehousing es generalmente de afuera hacia adentro (outside-in) a diferencia de arriba hacia abajo (top-down). 27/11/09 24. PROYECTO DE ELABORACION DE UN DATA WAREHOUSE Administracin de las Tecnologas de la Informacin 4 ESTRATEGIAS PARA LA GESTION DE UN DATA WAREHOUSE 1ra.: Un data warehouse es una inversin buena slo si los usuarios finales realmente pueden conseguir informacin vital ms rpida y ms barata de lo que obtienen con la tecnologa actual. 2da.: La administracin debe reconocer que el mantenimiento de la estructura del data warehouse es tan crtico como el mantenimiento de cualquier otra aplicacin de misin-crtica. 3ra.: La gestin debe comprender tambin que si se embarcan sobre un programa data warehousing, se crearn nuevas demandas sobre sus sistemas operacionales, que son: Demandas para mejorar datos Demandas para una data consistente Demandas para diferentes tipos de datos, etc. 27/11/09 25. PROYECTO DE ELABORACION DE UN DATA WAREHOUSE Administracin de las Tecnologas de la Informacin Se ha reconocido los beneficios del procesamiento analtico en lnea (On Line Analytical Processing - OLAP), ms all de las reas tradicionales de marketing y finanzas. El crecimiento de la computacin cliente/servidor, ha creado servidores de hardware y software ms poderosos y sofisticados que nunca. Los servidores de hoy compiten con las mainframes de ayer y ofrecen arquitecturas de memoria tecnolgicamente superiores, procesadores de alta velocidad y capacidades de almacenamiento masivas. Fase 2: Desarrollo 1. PORQUE CONSTRUIR BLOQUES DE DATA WAREHOUSE? 27/11/09 26. PROYECTO DE ELABORACION DE UN DATA WAREHOUSE Administracin de las Tecnologas de la Informacin 2 CONSIDERACIONES PREVIAS AL DESARROLLO DE UN DATA WAREHOUSE Hay muchas maneras para desarrollar data warehouses como tantas organizaciones existen. Sin embargo, hay un nmero de dimensiones diferentes que necesitan ser consideradas: Alcance de un data warehouse Redundancia de datos Tipo de usuario final 27/11/09 27. PROYECTO DE ELABORACION DE UN DATA WAREHOUSE Administracin de las Tecnologas de la Informacin 3 ELEMENTOS CLAVES PARA EL DESARROLLO DE UN DATA WAREHOUSE Si se escoge incorrectamente, el data warehouse se convierte en una gran empresa con problemas difciles de trabajar en su entorno, costoso para arreglar y difcil de justificar. Para conseguir que la implementacin del depsito tenga un inicio exitoso, se necesita enfocar hacia tres bloques claves de construccin: Arquitectura total del depsito Arquitecturas del servidor Sistemas de Gestin de Base de Dato Hay muchas maneras para desarrollar data warehouses como tantas organizaciones existen. Sin embargo, hay un nmero de dimensiones diferentes que necesitan ser consideradas: Alcance de un data warehouse Redundancia de datos Tipo de usuario final 27/11/09 28. PROYECTO DE ELABORACION DE UN DATA WAREHOUSE Administracin de las Tecnologas de la Informacin 4 CONFIABILIDAD DE LOS DATOS La data "sucia" es peligrosa. Las herramientas de limpieza especializadas y las formas de programar de los clientes proporcionan redes de seguridad. No importa cmo est diseado un programa o cun hbilmente se use. Si se alimenta mala informacin, se obtendr resultados incorrectos o falsos. Desafortunadamente, los datos que se usan satisfactoriamente en las aplicaciones de lnea comercial operacionales pueden ser basura en lo que concierne a la aplicacin data warehousing 27/11/09 29. PROYECTO DE ELABORACION DE UN DATA WAREHOUSE Administracin de las Tecnologas de la Informacin 5 FACTORES DECISIVOS PARA DECIDIR EL DESARROLLO DE UN DATA WAREHOUSE La data sucia es un serio peligro para el xito de un proyecto de data warehouse. Dependiendo del alcance del problema, simplemente podra no ser posible dirigirlo rpidamente y abaratarlo. Los principales factores son: El tiempo que toma la programacin interna El costo de las herramientas Los gerentes de proyectos de Data Warehouse necesitan evaluar el problema con realismo, los recursos internos disponibles para distribuirlos y seleccionar la solucin que se adapte a la planilla y presupuesto del proyecto, o modificar la planilla y el presupuesto para solucionar el problema. 27/11/09 30. PROYECTO DE ELABORACION DE UN DATA WAREHOUSE Administracin de las Tecnologas de la Informacin Proyecto Total o Proyecto en Fases Es ms viable el desarrollo de un proyecto en fases que produzcan resultados a corto plazo que el desarrollo de un proyecto que entregue resultados al trmino de varios aos. Por ello, el proyecto debe estar centrado en un rea o un proceso. Modelo lgico de datos El modelo lgico de datos debe tener un alcance ms alto y cubrir todas las reas de inters, as como los procesos ms estratgicos de cada una de ellas. Proyecto Especializado o Proyecto Base Decidir sobre qu tipo de proyecto, es algo complicado. Un proyecto especializado soporta directamente un proceso especfico, por ejemplo: retencin de clientes. Un proyecto base entrega capacidad genrica de anlisis a todos los usuarios que tengan acceso al data warehouse, pero no tiene, entre sus funcionalidades, la solucin de un problema especfico o el soporte especializado de un proceso especfico. FASE 3: IMPLEMENTACION 1 ELEMENTOS A CONSIDERAR EN LA IMPLEMENTACION 27/11/09 31. PROYECTO DE ELABORACION DE UN DATA WAREHOUSE Administracin de las Tecnologas de la Informacin 2 ESTRATEGIAS PARA EL PROCESO DE IMPLEMENTACION Identificar el problema en el cual el uso estratgico de la informacin detallada, permita conseguir una solucin para generar una ventaja competitiva o un ahorro de costos. Definir el modelo lgico de datos a implementar para resolver el problema planteado. 27/11/09 32. PROYECTO DE ELABORACION DE UN DATA WAREHOUSE Administracin de las Tecnologas de la Informacin 3 ESTRATEGIAS EN LA IMPLEMENTACION Definir el mejor diseo fsico para el modelo de datos. El diseo fsico debe estar orientado a generar buen rendimiento en el procesamiento de consultas, a diferencia del modelo lgico que est orientado al usuario y a la facilidad de consulta. Definir los procesos de extraccin, filtro, transformacin de informacin y carga de datos que se deben implementar para poblar ese modelo de datos. Definir los procesos de administracin de la informacin que permanece en el data warehouse Definir las formas de consultas a la informacin del data warehouse que se le proporcionar al usuario. Para sto, debe considerarse la necesidad de resolver un problema y la potencia de consulta. Completar el modelo de consulta base, relativo al rea seleccionada. Implementar los procesos estratgicos del rea de trabajo, es decir, implementar herramientas especializadas de scoring, herramientas especializadas para induccin de conocimiento (Data Mining), etc. Completar las reas de inters, en forma similar a lo descrito anteriormente. 27/11/09 33. PROYECTO DE ELABORACION DE UN DATA WAREHOUSE Administracin de las Tecnologas de la Informacin Qu clases de costos excedieron el presupuesto en ms del 10% en cada uno de los 12 meses pasados? Se aumentaron los presupuestos en ms de 5% para cualquier rea dentro de los ltimos 18 meses? Cmo especificar las clases de gasto entre diferentes departamentos? Entre divisiones? A travs de las regiones geogrficas? Cmo tener mrgenes de operacin sobre los dos ltimos aos en cada rea de negocio? Donde han disminuido los mrgenes, se han incrementado los costos? FASE 4: EVALUACION 1 EVALUACION DE RENDIMIENTO DE LA INVERSION 27/11/09 34. PROYECTO DE ELABORACION DE UN DATA WAREHOUSE Administracin de las Tecnologas de la Informacin CASO PRACTICO En un estudio encargado por 20 vendedores y consultores, se encontr un Retorno Promedio Total de la inversin (Return On Investment-ROI) de 401%.Tambin, se excluyeron los proyectos fracasados, as como los ejecutados excepcionalmente, tanto buenos como malos. 27/11/09 2.2 Millones Costo promedio 2.3 Aos Perodo de reembolso promedio 160% ROI mediano 533% ROI promedio del modelo complementario de datos 322% ROI promedio del proyecto ms grande 401% ROI promedio total CAMBIOS DE VALOR 35. PROYECTO DE ELABORACION DE UN DATA WAREHOUSE Administracin de las Tecnologas de la Informacin 1.1 COSTOS Y BENEFICIOS Costos preliminares Planificacin Diseo Modelamiento /Ingeniera de Informacin Costos iniciales Plataforma de hardware Software de base de datos Costos en procesamiento Mantenimiento de datos Desarrollo de aplicaciones Capacitacin y soporte Beneficios Tcticos Impresin y emisin de reporte reducido Demanda reducida para consultas de clientes Entrega ms rpida de informacin a los usuarios Beneficios Estratgicos (Potencialidad) Aplicaciones y herramientas de acceso para los usuarios finales Decisiones con mayor informacin Toma de decisiones ms rpida Capacidad de soporte a la informacin organizacional 27/11/09 36. PROYECTO DE ELABORACION DE UN DATA WAREHOUSE Administracin de las Tecnologas de la Informacin 2 BENEFICIOS A OBTENER Para la Empresa El data warehouse hace lo posible por aprovechar el valor potencial enorme de los recursos de informacin de la empresa y volver ese valor potencial en valor verdadero. Para los Usuarios El data warehouse extiende el alcance de la informacin para que puedan accesar directamente en lnea, lo que a la vez contribuye en su capacidad para operar con mayor efectividad las tareas rutinarias o no. Para la Organizacin en Tecnologas de Informacin El data warehouse enriquece las capacidades del usuario autosuficiente y hace lo factible para ofrecer nuevos servicios a los usuarios, sin interferir con las aplicaciones cotidianas de produccin 27/11/09 37. Importante: El Modelo de Datos Es el modelo por el cual se disea el esquema de funcionamiento de la Base de Datos que provee al Data Warehouse. Existen varios enfoques en este sentido: Fbrica de informacin corporativa (CIF): incluyen ODS, data warehouse y data marts, junto con otras varias interfaces de aplicaciones y el ambiente operacional, fue desarrollada por Bill Inmon, Claudia Imhoff, y Ryan Sousa Esquema en estrella: Este mtodo replica las estructuras multidimensionales de hechos y dimensiones, pero usa tablas de RDBMS, especficamente tablas de hechos y tablas de dimensiones. Se dejan de lado las reglas de normalizacin de base de datos y se ponen los datos donde tienen ms sentido Data vault (Arquitectura de modelado fundacional comn -CFIMA): Esta es una arquitectura de integracin de datos que contiene una base de datos orientada al detalle que contiene un conjunto de tablas normalizadas nicamente enlazadas que soportan una o ms reas funcionales de las tablas de negocio con tablas satlites para rastrear cambios histricos. Este enfoque hbrido rene lo mejor del cruce entre la tercera forma normal (3NF) 27/11/09 Administracin de las Tecnologas de la Informacin 38. Page DATA WAREHOUSE VS BD OPERACIONAL 27/11/09 Administracin de las Tecnologas de la Informacin Uso de Base de Datos Operacionales Uso de Data Warehouse Muchos usuarios concurrentes Pocos usuarios concurrentes Consultas predefinidas y actualizables Consultas complejas, frecuentemente no anticipadas. Cantidades pequeas de datos resumidas. Cantidades grandes de datos resumidas. Requerimientos de respuesta inmediata Requerimientos de respuesta no crticos 39. Modelo de Estrella 27/11/09 Administracin de las Tecnologas de la Informacin 40. Extraccin, Transformacin y Carga Extraccin Multiples Fuentes Orientadas a trabajo Batch : cagas de estos sistemas son ms fuertes cuando los sistemas de produccin tienen poca carga Conectvidad a diferentes tecnologas, diferentes manejadores de BDs Transformacin Manipulacin de data compleja Reunin de diferentes fuentes Implementacin de reglas de negocio Limpiado, ordenado, eliminacin de duplicidades Optimizado para el desempeo y para grandes volmenes Carga Cargar la data en tablas de hechos y dimensiones Produce un historial en archivos o en la BD para trazabilidad Otros Controla los flujos de ejecucin: maneja las dependencias entre tareas, control de ejecucin, gestin de errores, registros histricos. 27/11/09 Administracin de las Tecnologas de la Informacin duplicamos la entrada del consumidor agregando los datos adicionales (para propsitos financieros) Clave sustituta 27/11/09 Administracin de las Tecnologas de la Informacin no queremos el valor anteiror (reemplazo) Un cambio en el valor VAT 41. Ejemplos de transformacin Transformacin de Bsqueda difusa Busca valores en las tablas usando criterios difusos Ejemplo: Para un campo de texto la data puede contener muchas variantes de la misma palabra (friend, a friend, freind, etc). La lgica difusa puede ayudar a reunir las variantes. Transformacin de dimensiones de cambio lento Ayuda a manejar la actualizacin de una dimensin de cambio lento Ejemplo : la informacin sobre los consumidores cambia constantemente, pero queremos una historia de estos Cambio de direccin 42. Control de la Ejecucin Los datos son muy sensibles, la calidad de los reportes depende la calidad de estos Cargar un Data Warehouse puede implicar reglas complejas de extraccin, transformacin y carga Los usuarios del negocio no confiarn en un DW si no confan en su carga 27/11/09 Administracin de las Tecnologas de la Informacin 43. Ejemplos de paquetes en ETL Flujo de control y flujo de datos 27/11/09 Administracin de las Tecnologas de la Informacin 44. Middleware Son Instancias intermedias a la carga y al acceso que sirven para verificar la calidad y fiabilidad de la data Estacin de transformacin interina: un rea en la cual grupos de datos extrados de alguna de las fuentes pasan por un proceso de transformacin antes de moverse hacia la base de datos del almacn. Estacin de aseguramiento de la calidad: Un rea en la cual grupos de datos pasan por un conjunto de intensas revisiones de aseguramiento de la calidad antes de pasar hacia el almacn de datos. 27/11/09 Administracin de las Tecnologas de la Informacin 45. Middleware (2) 27/11/09 Administracin de las Tecnologas de la Informacin 46. Solucin: crear almacenes de datos especializados por rea, que reciben los datos desde el almacn centralizado, estos almacenes se conocen como Data Marts. Problema : al crecer el DW. El rendimiento de las consultas decae y el modelo centralizado deja de ser optimo. 27/11/09 Administracin de las Tecnologas de la Informacin 47. Toma de decisiones Un Datamart es una base de datos departamental, especializada en el almacenamiento de los datos de un rea de negocio especfica. Se caracteriza por disponer la estructura ptima de datos para analizar la informacin al detalle desde todas las perspectivas que afecten a los procesos de dicho departamento. DATAMART 27/11/09 Administracin de las Tecnologas de la Informacin 48. Data Mart Puede ser alimentado desde los datos de un DWH, o integrar por si mismo un compendio de distintas fuentes de informacin. 27/11/09 Administracin de las Tecnologas de la Informacin 49. Data Warehouses Vs. Data Marts Data Mart Departamental Un solo tema Pocos < 100 GB Meses Data Warehouse Propiedad Alcance Tema Fuente de datos Tamao (tpico) Tiempo de implementacin Data Warehouse Empresarial Mltiples Muchas 100 GB to > 1 TB Meses a aos 27/11/09 Administracin de las Tecnologas de la Informacin Data Mart 50. Su objetivo es agilizar la consulta de grandes cantidades de datos. Caracteriza la Arquitectura necesaria para la implementacin de un sistema de ayuda en la toma de decisiones. La consultas son pocas pero son muy consumidoras de tiempo (pueden correr horas), las actualizaciones son menos frecuentes y/o la respuesta a la consulta no depende del hecho de tener actualizada la base de datos. Soporte anlisis multidimensional y procesamiento analtico en lnea ( OLAP ) 27/11/09 Administracin de las Tecnologas de la Informacin 51. Soporte anlisis multidimensional y procesamiento analtico en lnea ( OLAP ) Los datos son clasificados en diferentes dimensiones y pueden ser vistas unas con otras en diferentes combinaciones para obtener diferentes anlisis de los datos que contienen. Los Usuarios pueden formular consultas complejas, arreglar datos en un reporte, cambiar de datos resumidos a datos detall ados . CARACTERISTICAS 27/11/09 Administracin de las Tecnologas de la Informacin 52. Clasificacin segn el tipo de motor en el que estn almacenados los datos: 27/11/09 Administracin de las Tecnologas de la Informacin ROLAP (Relational OLAP) MOLAP (multidimensional OLAP) Almacena los datos en un motor relacional Almacena los datos en una base de datos multidimensional Muchas dimensiones Diez o menos dimensiones Soportan analisis OLAP contra grandes volumenens de datos Se comportan razonablemente en volumenes de datos mas reducidos (menos de 5Gb) Herramienta flexible y general Solucin particular con volmenes de informacin y numero de dimensiones mas modestos 53. Consultando un cubo Trim4 Trim1 Trim2 Trim3 Dimensin tiempo Santiago Quito Arequipa Dimensin Ciudad Manzana Paal Yogurt Lima Melon Dimensin Producto 27/11/09 Administracin de las Tecnologas de la Informacin Ventas Fact 54. LA ESTRUCTURA DE UN CUBO 27/11/09 Administracin de las Tecnologas de la Informacin 55. Hechos Principales 27/11/09 Administracin de las Tecnologas de la Informacin 56. Medidas 27/11/09 Administracin de las Tecnologas de la Informacin 57. Medida : cuenta de suscriptor x mes (para agilizar clculos) 27/11/09 Administracin de las Tecnologas de la Informacin 58. Medida: Tasa de cambio de moneda, esta se expresa en una sola, independientemente de la divisa de pago. 27/11/09 Administracin de las Tecnologas de la Informacin 59. Dimensiones La Dimensin fecha se usa ms de una vez (dimensin con rol) 27/11/09 Administracin de las Tecnologas de la Informacin 60. Relaciones Una relacin regular 27/11/09 Administracin de las Tecnologas de la Informacin 61. The cube structure Relaciones Una relacin de hecho 27/11/09 Administracin de las Tecnologas de la Informacin 62. Relaciones Una relacin referenciada 27/11/09 Administracin de las Tecnologas de la Informacin Fact Subscriber 27/11/09 Administracin de las Tecnologas de la Informacin Dim Subscriber Dim Subscriber Fact Charges Fact Charges 63. The cube structure Relaciones Una relacin de muchos a muchos Dim Product 64. DATA MINING Minera de Datos Administracin de las Tecnologas de la Informacin 27/11/09 65. Contents DATA MINING Administracin de las Tecnologas de la Informacin 1. What is Data Mining? 27/11/09 2. POR QU? 3. Data Mining un proceso 4. Importante 5. Anexos 66. What is Data Mining? El data mining es el conjunto de tcnicas y tecnologas que permiten explorar grandes BBDD, de manera automtica o semiautomtica, con el objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento de los datos en un determinado contexto. Administracin de las Tecnologas de la Informacin 27/11/09 67. What is Data Mining? Arte/Ciencia de descubrir y aprovecha en forma automtica informacin no-obvia y til en grandes bases de datos Administracin de las Tecnologas de la Informacin 27/11/09 nfasis en: no-obvia (no intuitivas) til (coste vs beneficio) grande (proceso automtico) No hay reglas siempre que el proceso sea eficiente en tiempo, dinero y recursos humanos 68. Tres pasos Preparacin de los datos Anlisis de datos Toma de decisiones Redes Neuronales 27/11/09 Administracin de las Tecnologas de la Informacin 69. Preparacin de datos Extraccin / Integracin Transformacin Seleccin Limpieza Data warehouse 50-80% tiempo del proyecto 27/11/09 Administracin de las Tecnologas de la Informacin 70. 27/11/09 Administracin de las Tecnologas de la Informacin 71. Scrubbing, selecting, cleansing, preprocessing, Eliminar redundancia Eliminar datos y variables irrelevantes Tratar datos ausentes media, substitucin astuta, interpolacin, ignorar, ? Correccin errores Outliers (datos fuera de rango) Verificar consistencia Reservar todo preprocesamiento relevante hasta el anlisis 27/11/09 Administracin de las Tecnologas de la Informacin 72. Anslisis de datos Tcnicas: rboles de decisin Reglas de asociacin Ajustes (regresiones..) Algoritmos genticos Redes neuronales Tareas conceptuales: Clasificacin Optimizacin Interpolacin Modelacin Prediccin Objetivos: Target marketing Segmentacin Control Prediccin ventas Descubrir imperfecciones 27/11/09 Administracin de las Tecnologas de la Informacin 73. Toma de decisiones Los resultados del anlisis pueden resultar inescrutables El analista debe entender el problema a fondo Los resultados deben presentarse con honestidad El post-procesamiento y la inclusin de factores subjectivos son a menudo necesarios Validacin estricta 27/11/09 Administracin de las Tecnologas de la Informacin 74. PARA QU? Las empresas de todos los tamaos necesitan aprender de sus datos para crear una relacin one-to-one con sus clientes. Las empresas recogen datos de todos lo procesos. Los datos recogidos se tienen que analizar, comprender y convertir en informacin con la que se pueda actuar y aqu es donde Data Mining juega su papel Administracin de las Tecnologas de la Informacin 27/11/09 75. Data Mining proporciona la Inteligencia El Data Warehouse proporciona los datos. La inteligencia permitir buscar en esos datos tratando de encontrar patrones, descubrir reglas, nuevas ideas que probar, y hacer predicciones acerca del futuro Se estudiarn las tcnicas y herramientas que aaden la inteligencia al datawarehouse para explotar los datos de los clientes y sacar el mximo rendimiento Administracin de las Tecnologas de la Informacin 27/11/09 76. Relacin Administracin de las Tecnologas de la Informacin 27/11/09 Relacin con el Data Mining Est asociado al escaln ms alto de la pirmide (Nivel Estratgico) y tiene por objeto eliminar los errores cometidos por las personas al analizar los datos debido a prejuicios y dejar que sean los datos los que muestren los modelos subyacentes en ellos. Mientras en Data Warehousing, se basan en estructuras multidimensionales, en las que se almacena la informacin calculando previamente todas las combinaciones de todos los niveles de todas las aperturas de anlisis. Aunque este mtodo se puede considerar como exagerado, nunca ser tan caro, como lo que le costara a la organizacin el tomar las decisiones equivocadas. 77. Como nos ayudan? Qu clientes permanecern fieles? Qu clientes estn a punto de abandonar? Dnde debemos localizar la prxima sucursal? Qu productos se deben promocionar a qu prospectos? ... Las respuestas a estas preguntas estn enterradas en los datos y se necesitan las tcnicas de Data Mining para buscarlas Administracin de las Tecnologas de la Informacin 27/11/09 78. Data Mining un proceso Administracin de las Tecnologas de la Informacin 27/11/09 Pasos 79. Data Mining un proceso Administracin de las Tecnologas de la Informacin 27/11/09 Identificar un problema Usar data mining para transformar los datos en informacin Actuar basndonos en la informacin Medir los resultados 80. 27/11/09 Administracin de las Tecnologas de la Informacin OBJETIVO Establecer la secuencia de l gica de actividades, responsables e informaci n necesaria que permita controlar, recopilar y procesar informaci n primaria y secundaria. ALCANCE El presente procedimiento permite la publicaci n de informaci n clasificada por sector, inici ndose con la coordinaci n de la disponibilidad de informaci n y finalizando con el ingreso de informaci n al sistema. El presente documento aplica para el Departamento de Informaci n y Negocios Electr nicos de la Sub Direcci n de Inteligencia y Prospectiva Comercial. 81. 27/11/09 Administracin de las Tecnologas de la Informacin 82. 27/11/09 Administracin de las Tecnologas de la Informacin 83. 27/11/09 Administracin de las Tecnologas de la Informacin 84. Importante Administracin de las Tecnologas de la Informacin 27/11/09 La promesa de Data Mining es encontrar los patrones Simplemente el hallazgo de los patrones no es suficiente Debemos ser capaces de entender los patrones, responder a ellos, actuar sobre ellos, para finalmente convertir los datos en informacin, la informacin en accin y la accin en valor para la empresa 85. Data Mining resumen Administracin de las Tecnologas de la Informacin 27/11/09 Data Mining es un proceso que se tiene que centrar en las acciones derivadas del descubrimiento de conocimiento no en el mecanismo de descubrimiento en si mismo. Aunque los algoritmos son importantes, la solucin es ms que un conjunto de tcnicas y herramientas. Las tcnicas se tienen que aplicar en el caso correcto a los datos correctos 86. Conclusiones Administracin de las Tecnologas de la Informacin 27/11/09 El concepto de DWH est teniendo una gran aplicacin en la actualidad para el desarrollo de las empresas, como almacn de datos. Sus objetivos incluyen la reduccin de los costes de almacenamiento y una mayor velocidad de respuesta frente a las consultas de los usuarios. Estos pueden ahora analizar y realizar preguntas sobre aos, ms que sobre meses de informacin. Para disear una buena arquitectura de DWH es necesario como primer paso conocer bien los requerimientos del negocio y hacer un estudio profundo de las fuentes externas que nos van a suministrar los datos. Adems, hacer un buen diseo del rea de transformacin de datos, cules son las transformaciones que se van a realizar y cmo se va a implementar el modelo dimensional con sus tablas de hechos y de dimensiones es el segundo paso a seguir. 87. Resumiendo los beneficios de la arquitectura del DWH : Administracin de las Tecnologas de la Informacin 27/11/09 Provee un esquema de organizacin cules son los componentes que la forman, cmo ellos se interrelacionan, quin es el dueo de cada parte y cules son las prioridades. Mejora la flexibilidad permite que rpidamente se aadan nuevas fuentes de datos. Desarrollo rpido y reuso los desarrolladores de DWH son ms capaces de comprender el proceso de DWH , los contenidos de las bases de datos y las reglas del negocio ms rpidamente. Herramientas de comunicaciones define y comunica la direccin y el alcance de las expectativas , identifica los roles y responsabilidades y comunica los requerimientos al proveedor. 88. Que la tecnologa no te entierre Administracin de las Tecnologas de la Informacin Thank You ! 27/11/09 89. ANEXOS REDES NEURONALES 27/11/09 Administracin de las Tecnologas de la Informacin Fuente: Jos Ignacio Latorre Universitat de Barcelona http://sophia.ecm.ub.es/latorre / 90. Por qu no se emplea el Data Mining? Explotacin bruta de las bases de datos da resultados sin sentido o no-competitivos Sentido comn y buena formacin = coste elevado S se emplea, pero poca gente es consciente Data Mining 27/11/09 Administracin de las Tecnologas de la Informacin 91. Redes Neuronales 27/11/09 Administracin de las Tecnologas de la Informacin 92. Qu es una red neuronal? Datos Datos histricos variables objetivos Datos nuevos variables ?? Las redes neuronales aprenden a partir de ejemplos Economista/Matemtico/Fsico/Analista Aproximante universal (Permiten un ajuste a partir de ejemplos en un gran espacio de funciones sin sesgo, robusto, flexible que implementa inferencia bayesiana) Economista/Empresario Herramienta de prediccin (objetivo, consolidado, adaptable a problemas complejos, integrable) Modelo del cerebro Redes neuronales 27/11/09 Administracin de las Tecnologas de la Informacin 93. Redes neuronales Para qu sirven una red neuronal? Clasificacin Clientes buenos/malos, comprometidos o no, asequibles o no Reconocimiento de patrones Interpolacin Adivinar el comportamiento de un nuevo cliente Crear una nueva pintura Prediccin Ventas, meteorologa, finanzas, control de produccin Las redes neuronales pueden ser aplicadas a cualquier problema de inferencia estadstica 27/11/09 Administracin de las Tecnologas de la Informacin 94. Cmo funciona una red neuronal? capa 1 capa 2 capa l ..... Red neuronal feedforward multicapa Redes neuronales 27/11/09 Administracin de las Tecnologas de la Informacin 95. Redes neuronales La funcin de activacin da flexibilidad para que la respuesta de cada neurona pueda ser no lineal Los pesos w y los umbrales t determinan la forma en que la informacin es procesada por cada neurona El nmero de capas y de neuronas por capa definen la arquitectura de la red neuronal El algoritmo de aprendizaje por correccin de errores hacia atrs, back-propagation (1985) establece un procedimiento eficiente para ajustar los pesos y umbrales de una red neuronal de forma que aprenda ejemplos. Hemos aprendido a aprender! 27/11/09 Administracin de las Tecnologas de la Informacin 96. Redes neuronales T vs C C T c T C T T C Entrenamiento 0. w y t aleatorios 1. Introducir un ejempo (T) Output = T bien Output = C error Propagar un cambio de w and t a travs de la red para reducir el error 4. Repetir con todos los ejemplos varias veces Aprendizaje supervisado de T / C T Robusto Universal Sin sesgo 27/11/09 Administracin de las Tecnologas de la Informacin 97. Redes neuronales Belgrado 19/04/1999 Una red neuronal es entrenada con patrones de aviones La red detecta un avin militar escondido bajo un avin comercial 27/11/09 Administracin de las Tecnologas de la Informacin 98. Finanzas Data Mining Divorcios Ciencia Banca Reconocimiento de patrones 27/11/09 Administracin de las Tecnologas de la Informacin 99. Tarjetas de crdito 50000 clientes reciben la oferta Un red neuronal es entrenada con las respuestas La red predice la respuesta de los 450000 clientes restantes Un banco desea ofrecer una nueva tarjeta a sus clientes Depsitos Salario Edad Sexo Crditos Hipotecas Educacin S / No Red neuronal Ejemplos 27/11/09 Administracin de las Tecnologas de la Informacin 100. Ejemplos Lift Chart % de clientes contactados % de Respuestas positivas retenidas 27/11/09 Administracin de las Tecnologas de la Informacin 101. Promedios sobre redes entrenadas a partir de pesos aleatorios Si existe un modelo subyacente, las redes son equivalentes Si no existe un modelo subyacente, las redes producen dispersin Lanzamos 100 redes sobre datos entrenar/validar Para cada dato tenemos un promedio y una dispersin Descartamos 3 sigma Alarmas Arbitraje . -1 sigma + 1sigma NN Real Ejemplos Series temporales de cotizaciones 27/11/09 Administracin de las Tecnologas de la Informacin 102. Ejemplos Estoy divorciado? Una red neuronal ha sido entrenada con rea del apartamento es relevante la virginidad? divorciado? salario s / no visitas de los suegros salud,.. Acierto: 88% Matemticas / Filosofa 100% 27/11/09 Administracin de las Tecnologas de la Informacin