In dit blog beschrijf ik kort wat Data Vault en Data Mesh is. Daarnaast ga ik dieper in op waarom je deze twee technieken goed kunt combineren.

Wat is Data Vault?

Data Vault data modelering is een specifieke manier van datamodellering die zich richt op het opbouwen van een flexibele, schaalbare en gemakkelijk te onderhouden datawarehouse. Het is een hybride architectuur die bestaat uit drie soorten tabellen: hub-tabellen, link-tabellen en satellite-tabellen.

  • Hub-tabellen bevatten de kerngegevens, zoals klant- en productgegevens.
  • Link-tabellen bevatten de relaties tussen de hub-tabellen, zoals welke klant welk product heeft gekocht.
  • Satellite-tabellen bevatten aanvullende gegevens, zoals de historische wijzigingen van een klantadres.

Met Data Vault modeling wordt aandacht besteed aan het behoud van historische gegevens en het gemakkelijk kunnen traceren van gegevens. Dit maakt het mogelijk om snel en efficiënt te reageren op veranderingen in de gegevens, zoals bijvoorbeeld veranderingen in de klantgegevens.

Wat is Data Mesh?

Een Data Mesh organisatie is een soort organisatie die data-architectuur gebruikt als de belangrijkste manier om de verantwoordelijkheid voor gegevens te verdelen. Dit betekent dat er geen centrale autoriteit is die verantwoordelijk is voor de gegevens. Daarentegen is elk team of afdeling verantwoordelijk voor de gegevens die zij verzamelen en gebruiken. Dit helpt bij het verminderen van de afhankelijkheid van een enkele, centrale data-architectuur. Daarnaast draagt het bij aan het creëren van een meer flexibele en schaalbare organisatie.

Conclusie

Samenvattend, Data Vault modeling is een manier om een flexibele, schaalbare en gemakkelijk te onderhouden datawarehouse te bouwen. Dit door het gebruiken van hub-, link- en satellite-tabellen. Een Data Mesh organisatie is een organisatie waarbij data-architectuur wordt gebruikt als de belangrijkste manier om de verantwoordelijkheid voor gegevens te verdelen. Dit draagt bij aan het creëren van een meer flexibele en schaalbare organisatie. De combinatie van deze twee concepten kan organisaties helpen bij het bouwen van een flexibele en schaalbare datawarehouse. Dit datawarehouse is gemakkelijk te onderhouden en elke afdeling of team is verantwoordelijk voor de gegevens die zij verzamelen en gebruiken.

Binnen The Information Lab zien we dat deze twee technieken goed passen bij de wensen en eisen gesteld door onze klanten aan een moderne business intelligence data stack. We helpen je graag als je meer wilt weten of deze technieken wilt implementeren.