Metodologies de Data Warehouse

Hi ha diferents metodologies per seguir a l’dissenyar una solució de Data Warehouse i referent a la funció dels requisits del seu projecte pot triar la que millor s’adapti al seu requeriment. Ets metodologies van ser dissenyades per Ralph Kimball, Bill Inmon i Dan Linsted.

Dimensional

La metodologia dimensional o metodologia de Ralph Kimball, se centra en un enfocament ascendent, principalment en el valor de l’ emmagatzematge de dades per als usuaris el més ràpid possible. Segons Kimball, un emmagatzematge de dades és la còpia de les dades transaccionals específicament estructurats per a consultes analítiques i informes per tal de donar suport al sistema de suport a la presa de decisions. Amb base a la seva metodologia, es creen primer els data marts per proporcionar capacitats analítiques i d’informes per a processos específics de negoci i funcionals, per tant poden establir junts per aconseguir un emmagatzematge de dades complet.

Kimball, proposa crear una matriu de negoci que contingui els elements comuns que són utilitzats pels data marts, com conformed-shared dimensió, measures, etc., tenint aquesta informació, l’usuari podrà desenvolupar solucions que donin suport l’anàlisi a través dels processos de negoci per a la venda creuada.

Relational

la metodologia de Bill Inmon comença amb el disseny de el model de dades empresarials, s’identifiquen les principals àrees i entitats amb què treballa l’empresa, ja sigui com a client, producte, proveïdor, etc.

l’enfocament de el disseny d’aquesta metodologia utilitza la forma normalitzada per crear l’estructura d’entitats, evitant la repetici ó de dades, tant com sigui possible. En poques paraules, una identificació clara dels requisits empresarials i la prevenció de qualsevol irregularitat en l’actualització de dades.

A continuació, es construeix el model físic, que segueix l’estructura normalitzada. Aquest model crea una única font de veritat per a tot el negoci. La càrrega de dades es torna menys complexa a causa de l’estructura normalitzada de el model. No obstant això, l’ús d’aquesta disposició per fer consultes, és complicat, ja que inclou gran quantitat de taules i vincles.

Aquest model proposa la construcció d’data marts per separat per a cada departament. Totes les dades que entren al magatzem de dades estan integrats. Per garantir la integritat i la coherència en tota l’empresa, l’emmagatzematge de dades actua com un únic origen de dades per a diversos data marts.

Data Vault

És una metodologia de seguiment històric orientat als detalls i conjunt de taules normalitzades vinculades de forma única que admeten un o més àrees funcionals de negocis. És un model de dades que està dissenyat específicament per complir les necessitats d’un o diversos data warehouse empresarials d’avui dia.

Avantatges

  • Dissenyat especialment per emmagatzemar registres. Fa que el procés de registre de dades sigui més senzill.
  • Amb aquesta metodologia, és més fàcil afegir un nou origen de dades sense modificar el ja existent.
  • Automatitza fàcilment els processos ETL .

Arquitectura de Data Vault

Data Vault conté tres taules bàsiques:

  • Hub
  • Links
  • Satellites

Què metodologia de Data Warehouse és la millor?

tot i les diferències d’enfocament i idees de cada metodologia és impossible dir que una és millor que l’altra. Ja que la que s’adequa per a les organitzacions sempre serà la que millor encaixi a les necessitats de la seva organització segons la infraestructura de l’magatzem de dades o de la galleda.

Deixa un comentari

L'adreça electrònica no es publicarà. Els camps necessaris estan marcats amb *