Metodoloxías de almacén de datos

Existen diferentes metodoloxías para continuar ao deseñar unha solución de almacén de datos e referirse á función dos requisitos do seu proxecto que pode escoller o único que mellor se adapte á túa esixencia. Estas metodoloxías foron deseñadas por Ralph Kimball, Bill Vacon e Dan Linsted.

dimensional

A metodoloxía dimensional ou metodoloxía de Ralph Kimball, céntrase nun enfoque ascendente, principalmente no valor do Almacenamento de datos para os usuarios o máis rápido posible. Segundo Kimball, o almacenamento de datos é a copia dos datos transaccionais estructurados específicamente para consultas analíticas e informes para soportar o sistema de soporte de toma de decisións. Con base na súa metodoloxía, os datos de Marts son creados por primeira vez para proporcionar capacidades analíticas e informes para procesos específicos e funcionais, polo tanto, poden configurarse para acadar o almacenamento de datos completos.

Kimball, propón crear unha matriz de negocios que contén os elementos comúns que son utilizados pola Martes de datos, como dimensión compartida, medidas, etc., con esta información, o usuario será capaz de desenvolver solucións que apoien a análise a través de procesos comerciais para a venda cruzada.

Relacional

A metodoloxía de Bill Vacon comeza co deseño do modelo de datos empresariais, as principais áreas e identificáronse entidades coas que traballa a empresa, xa sexa como cliente, produto, provedor, etc.

O enfoque de deseño desta metodoloxía utiliza a forma estandarizada para crear a estrutura das entidades, evitando a repetición Datos sobre datos, tanto como sexa posible. En definitiva, unha clara identificación dos requisitos comerciais e a prevención de calquera irregularidade na actualización de datos.

A continuación, o modelo físico está construído, o que segue a estrutura estandarizada. Este modelo crea unha única fonte de verdade para todo o negocio. A carga de datos faise menos complexa debido á estrutura estandarizada do modelo. Non obstante, o uso desta disposición para consulta é complicado, xa que inclúe unha gran cantidade de táboas e enlaces.

Este modelo propón a construción de datos de datos por separado para cada departamento. Todos os datos que entran no almacén de datos están integrados. Para garantir a integridade e coherencia en toda a empresa, o almacenamento de datos actúa como unha única fonte de datos para varias martes de datos.

bóveda de datos

É unha metodoloxía de seguimento histórico orientada aos detalles e conxunto de táboas normalizadas ligadas de forma única que admite unha ou máis áreas de negocio funcionais. É un modelo de datos que está deseñado especialmente para satisfacer as necesidades dun ou máis almacén de datos de negocios hoxe.

Vantaxes

  • especialmente deseñado para almacenar rexistros. Fai que o proceso de gravación de datos sexa máis sinxelo.
  • Con esta metodoloxía, é máis fácil engadir unha nova fonte de datos sen modificar o existente.
  • automatiza facilmente os procesos de ETL.

Arquitectura de bóveda de datos

Vault de datos contén tres táboas básicas:

  • Hub
  • ligazóns
  • Satélites

Que almacén de datos é o mellor?

A pesar das diferenzas en foco e ideas de cada metodoloxía, é imposible dicir que un é mellor que o outro. Dado que o que é apto para organizacións sempre será o que mellor se adapte ás necesidades da súa organización segundo a infraestrutura do almacén de datos ou o cubo.

Deixa unha resposta

O teu enderezo electrónico non se publicará Os campos obrigatorios están marcados con *