siad curs 5 olap

Upload: cristina-tefanov

Post on 03-Apr-2018

232 views

Category:

Documents


0 download

TRANSCRIPT

  • 7/28/2019 Siad Curs 5 Olap

    1/28

    3. SIAD BAZAT PE DATE

    SIAD bazat pe date:

    OLTP vs. OLAP Motoda de proiectare multidimensionala

    Aplicatii back-end

    Aplicatii front-end

  • 7/28/2019 Siad Curs 5 Olap

    2/28

    Business Inteligence

    Termenul de Business Inteligence acoper un ansamblu de

    aplicaii i de tehnologii care asigur colectarea,

    conservarea, analiza i interpretarea datelor complexe,

    interpretare care ajut decidenii n luarea deciziilor, datele

    fiind analizate dup mai multe dimensiuni

    Termenul deBusiness Inteligencereprezint acele sistemecare ajut ntreprinderile s neleag care este situaia

    actual punnd n eviden cauzele, i s previzionezeefectele viitoare ale deciziilor actuale.

  • 7/28/2019 Siad Curs 5 Olap

    3/28

    Arhitectura SIAD bazat pe date

    .EXTRACIA

    INTEGRAR

    E

    CONSTRUCI

    A

    SG

    EXPLOATAREA

    non

    expertR

    EORGA

    NIZAR

    E

    INTEROGAR

    E

    MD2

    MD3

    MD1

    Depozitul dedate

    S1

    S2

    S3

    experi

    - interogri- analize OLAP- data mining

  • 7/28/2019 Siad Curs 5 Olap

    4/28

    Arhitectura SIAD bazat pe date

    Sursele de date sunt numeroase, variate i autonome. Ele pot fi interne (bazele de producie) sau externe (internet, bazele de parteneri etc.)ntreprinderii.

    Sistemele decizionale comportdou tipuri de spaii de stocare care sunt

    depozitele de date i magaziile de date.Un depozit de date regrupeaz ntr-un format omogen date utile pentruasistarea deciziei provenind din surse interne (baze deproducie) si/sauexterne (baze de parteneri, internet etc.).

    O magazie de date este o extragere de informaie dintr-un depozit de dateconstituit anterior, iorganizat de o manieradecvat astfel nct s

    permit o analizrapid avnd ca scop asistarea lurii de decizii.Instrumentele de analiz permit s se manipuleze datele urmrind axelede analiz. Informaia este vizualizat prin intermediul interfeeiinteractive i funcionalededicatdecidenilorcare de obicei nu suntinformaticieni (directori, efi de servicii etc.)

  • 7/28/2019 Siad Curs 5 Olap

    5/28

    Depozitul de date

    Bill Inmon n cartea sa de referin Using the DataWarehouse [1994] definete depozitul de date ca ocolecie de date integrate, orientate subiect, nonvolatile,istorice, organizate ca suport pentru procesul de asistare adeciziei

  • 7/28/2019 Siad Curs 5 Olap

    6/28

    OLTP (On-line Transactional

    Processing)OLTP (On-line Transactional Processing) : Mediu de tratare a informaiei n care rspunsul trebuie dat

    de o manierconsistenti ntr-un timp acceptabil. n acest

    cadru modelul de date trebuie s asigure o minimizare aredundanelor n scopul prezervrii fiabilitii i coereneisistemului. Conceptul de integritate este o noiune cheientr-un astfel de mediu, ea reprezentnd un ansamblu deconstrngeri aplicate actualizrii bazei de date, permindastfel o cretere a coerenei acesteia.

    Originea scopului de minimizare a informaiei decurge nprincipal din faptul c sistemele tranzacionaleefectueazactualizarea on-line eventual de-a lungul unui ansamblude aplicaii carepartajeazacelai model de date.

  • 7/28/2019 Siad Curs 5 Olap

    7/28

    OLTP (On-line Transactional

    Processing) ntr-un sistem tranzacional, concepia este orientat spre

    proces, iar modelul de date trebuie s susin aceastorientare.

    Interogrile sunt ntotdeauna previzibile. Din punctul de vedere al utilizatorului modelul de date este ntotalitate transparent; el fiind accesat n mod indirect prinintermediul aplicaiilor de obicei de tip pachet (aplicaiiinformatice predefinite) puse la dispoziia lor.

    n acest context, datele sunt n general accesate prin chei, maiales prin chei primare.

  • 7/28/2019 Siad Curs 5 Olap

    8/28

    OLAP (On-line Analytical Processing)

    OLAP (On-line Analytical Processing) : Caracterizeaz arhitectura necesar implementrii unui

    sistem informatic decizional. Se opune OLTP. Termenul OLAP desemneaz instrumentele de analiz care

    se sprijin pe baze de date multidimensionale. Informaiile sunt puse la dispoziia utilizatorului dar

    actualizarea lor nu se mai face on-line. Singureleactualizri efectuate n depozitul de date vor veni dinsistemele operationale prin intermediul procesului dencrcare.

  • 7/28/2019 Siad Curs 5 Olap

    9/28

    OLAP (On-line Analytical Processing)

    Odat efectuat procesul de achiziie de date, problemaintegritii datelor din depozitul de date nu va mai putea fi

    pus n discuie. Astfel devine evident introducerearedundanelor, ns acestea trebuie coordonate, bine

    gestionate n procesul de alimentare.

    O altcaracteristic a sistemelor decizionale este aceea cutilizatorul caut n mod frecvent s pun n relaieelemente care apriori nu au fost corelate.

  • 7/28/2019 Siad Curs 5 Olap

    10/28

    OLAP (On-line Analytical Processing)

    Spre deosebire de sistemele tranzacionale, sistemele decizionalepachet (predefinite) sunt foarte rare, aceasta datorit faptului cun depozit de date are ca scop srspundcerinelorutilizatorilorn termeni de informaiii nu n termeni de tranzacii.

    O altcaracteristic a unui sistem decizional este c de cele maimulte ori acesta trebuie spermit implementarea unui model dedate integrat avnd ca obiectiv transversabilitatea la nivel dentreprindere. Acest model se constituie de cele mai multe ori

    ntr-o manier incremental, pe msura realizrii succesive deproiecte decizionale la nivelul ntreprinderii. n acest cadru,modelul de date va evolua de o manierconstantiregulat.

  • 7/28/2019 Siad Curs 5 Olap

    11/28

    Modelarea Depozitelor de date

    Studiile au identificat cinci axe care s permit calificarea

    unui model de date decizional, iar acestea sunt [Le datawarehouse J.-M. Franco 1997] :

    Primul obiectiveste asigurarea lizibilitii din punct devedere al utilizatorului final;

    Al doilea i al treilea obiectivse refer la performane:

    performane legate de ncrcarea depozitului de date;

    performane legate de execuia interogrilor;

  • 7/28/2019 Siad Curs 5 Olap

    12/28

    Modelarea Depozitelor de date

    . Al patrulea obiectivse refer la administrareadepozituluiuna din dificultile ntlnite de multentreprinderi nu este aceea de a construi depozitul de dateci aceea de a-i asigura funcionarea;

    Un ultim obiectiv este evolutivitatea ce permite cadezvoltarea unui depozit de date s se fac de o manier

    incremental.

  • 7/28/2019 Siad Curs 5 Olap

    13/28

    Modelarea Depozitelor de date

    Modelele de date normalizate se caracterizeaz printr-o semanticslab din punct de vedere decizional. De obicei informaiileinteresante pentru utilizatori nu se regsesc n mod direct, eletrebuind s fie extrapolate, prin recalcularea dinamic la fiecareinterogare. Performanele obinute vor fi mediocre i chiarinacceptabile.

  • 7/28/2019 Siad Curs 5 Olap

    14/28

  • 7/28/2019 Siad Curs 5 Olap

    15/28

    Modelarea dimensional a depozitului

    de date Definiie :

    Modelarea multidimensional const n a

    considera un subiect de analiz ca un punct

    ntr-un spaiu cu mai multe dimensiuni.

    Datele sunt organizate n maniera de a pune

    n eviden subiectul analizat i diferitele

    perspective de analiz.

  • 7/28/2019 Siad Curs 5 Olap

    16/28

    Modelarea conceptual a depozitului

    de date

    Conceptual, aceast modelare multidimensional

    d natere conceptelor de fapti dimensiune[Kimball 1996]

  • 7/28/2019 Siad Curs 5 Olap

    17/28

    Conceptul de fapt

    Subiectul de analiz este reprezentat prin conceptul de fapt.Definiie : Faptelemodeleaz subiectul de analiz. O fapt reprezint msura

    activitii determinat la intersecia tuturor informaiilor referitoare laactivitate.

    Reprezentarea grafic la nivel conceptual a unei tabele de fapte se faceastfel:

    Fig. Reprezentarea grafic a tabelei de fapte

    Vnzri

    CantitateValoare

    Tabela defapte

    Msuri ale activitii

  • 7/28/2019 Siad Curs 5 Olap

    18/28

    Conceptul de dimensiune

    Subiectul de analiz, adic fapta este analizat deseori urmrind

    diferite perspective. Aceste perspective corespund uneicategorii utilizate pentru a caracteriza msurile activitiianalizate [Marcel 1998]. Aceste perspective le denumim ncontinuare dimensiuni.

  • 7/28/2019 Siad Curs 5 Olap

    19/28

    Conceptul de dimensiuneDefiniie : Dimensiuneamodeleaz o perspectiv de analiz. O

    dimensiune se compune din parametrii corespunzndinformaiilor care fac s varieze msurile activitii.

    Reprezentarea grafic la nivel conceptual a unei dimensiunise face astfel:

    Timp

    IDTimp

    ZiLun

    TrimestruSemestru

    An

    Este mai fin

  • 7/28/2019 Siad Curs 5 Olap

    20/28

    Ierarhia

    Definiie :Ierarhiaorganizeaz parametrii unei dimensiuni dup o

    relaie de tip este mai fin n conformitate cu nivelul lorde detaliu.

    O dimensiune normal sa nu conina nicio ierarhie sau poatecontine una sau mai multe ierarhii naturale.

  • 7/28/2019 Siad Curs 5 Olap

    21/28

    Modelul Star

    Plecnd de la procesul analizat i perspectivele deanaliz a acestuia, este posibil s se stabileasc ostructur simpl care s corespund necesitilormodelrii multidimensionale.

    Aceast structur este constituit din fapta(subiectul de analiza) care este aezat central idimensiuni.

    Acest model reprezint din punct de vedere vizualo stea, vorbim astfel de modelul stea (star schema[Kimball 1996]).

  • 7/28/2019 Siad Curs 5 Olap

    22/28

    Modelul Star

    . TimpIDTimp

    Zi

    LunTrimestruSemestru

    An

    Vnzri

    Cantitate

    Valoare

    Magazin

    IDMagazin

    Denumiremagazin

    LocalitateJude

    Regiuneara

    Produs

    IDProdus

    Denumire prod.

    Marc prod.Subcategorie

    prodCategorie prod

    Raion

  • 7/28/2019 Siad Curs 5 Olap

    23/28

    Modelul Snow-flake

    n modelarea entitate-asociere o relaie de tipul 1-nntre atributele aceleiai tabele oblig automat la

    crearea unei noi tabele. n cadrul dimensiunilorexistena ierarhiilor, din punct de vedere alabordrii clasice oblig la crearea de noi tabele.

    Normalizarea dimensiunilor va crea subdimensiuni

    dnd natere la un nou tip de model de datedenumit fulg de nea (snow-flake).

  • 7/28/2019 Siad Curs 5 Olap

    24/28

    Modelul Snow-flake

    .Timp

    IDTimp

    Zi

    LunTrimestruSemestru

    An

    Vnzri

    CantitateValoare

    Magazin

    IDMagazinDenumiremagazin

    Produs

    IDProdus

    Denumire prod.

    Marc prod.Subcategorie

    prodCategorie prod

    Raion

    Adres

    IDLocalitateJude

    Regiuneara

  • 7/28/2019 Siad Curs 5 Olap

    25/28

    Modelul Multi-star

    O alt tehnic de modelare, derivat din cele doutipuri de model amintite anterior este modelareamulti-star (constelaie).

    Aceasta se caracterizeaz prin fuzionarea mai multormodele stari/sau snow-flake care utilizeazdimensiuni comune.

    Deci un model n constelaie cuprinde mai multefapte i dimensiuni care pot fi partajate de dousau mai multe tabele de fapte sau doar de osingur tabel de fapte.

  • 7/28/2019 Siad Curs 5 Olap

    26/28

    Modelul Multi-star

    .

    Serviciu

    IDServiciu

    Denumire serv.Subcategorie

    serv.Categorie serv.

    Vnzri serv

    Valoare serv.

    Magazin

    IDMagazin

    Denumiremagazin

    LocalitateJude

    Regiuneara

    Timp

    IDTimp

    ZiLun

    TrimestruSemestru

    An

    Vnzri prod.

    CantitateValoare prod.

    Produs

    IDProdus

    Denumire prod.Marc prod.Subcategorie

    prodCategorie prod

    Raion

  • 7/28/2019 Siad Curs 5 Olap

    27/28

    Modelarea logic

    La nivel logic mai multe posibiliti sunt disponibile pentru modelareamultidimensional. Exist posibilitatea s se utilizeze:

    un sistem de gestiune de baze de date (SGBD) relaional; un SGBD orientat obiect.

    Abordarea cea mai des utilizat const n a utiliza sisteme de gestiune abazelor de date relaionale. Modelul multidimensional este transpus demaniera urmtoare:

    Fiecare fapt corespunde unei tabele, denumit tabel de fapte Fiecare dimensiune corespunde unei tabele, denumite tabel de

    dimensiuni Tabela de fapte este constituit din atributele ce reprezint msurile

    activitii i atributele chei externe ale fiecrei tabele de dimensiuni.

    Tabelele de dimensiuni conin parametrii i cheia primar care permites se fac legtura cu tabela de fapte

  • 7/28/2019 Siad Curs 5 Olap

    28/28

    Modelarea logic

    Vnzri (IDProdus, IDMagazin, IDTimp,Cantitate, Valoare)

    Timp (IDTimp, Zi , Lun, Trimestru, Semestru,An)

    Magazin (IDMagazin, DenMagazin, Localitate,Jude Regiune, ar)

    Produs (IDProdus, Denumire prod., Marc prod.,Subcategorie prod., Categorie prod., Raion)