Halten Sie Verbindung mit uns:

Data Vault

Was ist Data Vault 2.0?

Data Vault 2.0 beschreibt einen Designparadigma zur Bereitstellung von Daten. Ein Wichtiger Vorteil in Data Vault 2.0 liegt darin, sehr flexibel auf Änderungen in Geschäftsprozessen reagieren zu können, ohne unterliegende Strukturen tiefgreifend anzupassen. Um dies zu erreichen ist ein Data Vault 2.0, in Abgrenzung zum klassischen DWH, nicht die definierte, aggregierte Wahrheit aller Daten sondern lediglich die wertfreie Bereitstellung aller vorhandenen Daten. Eine Aggregation der Daten findet aufbauend, beispielsweise in Data Marts, statt.

Im Kern besteht ein Data Vault 2.0 aus 3 Elementen:

  • Hubs, zur eineindeutigen Definition eines Geschäftsobjektes
  • Links, zur Darstellung von Interaktion/Transaktion zwischen Geschäftsobjekten
  • Satelliten, zur inhaltlichen Ausgestaltung von Hubs oder Links Optional kann man Reference-Tables für statische Daten, z.B Währungsangaben, Ländercodes, hinzuziehen.

Durch die Trennung ist es möglich jeden Satelliten einzeln zu beladen. Hierdurch sind hohe Parallelisierungen oder Anpassungen an die jeweilige Datenquelle möglich. Des Weiteren kann so die Integrität bzgl. Zeit und Quelle jedes Satelliten durch entsprechende Metadaten garantiert werden. Ein Hub stellt nur eine eineindeutige, unveränderliche Identifizierung eines Elements dar, z.b. ein dedizierter Kunde, ein Produkt, oder eine Bestellung. Die inhaltliche Ausgestaltung eines Elements geschieht über einen oder mehrere Satelliten.
So kann ein Hub Kunde z.b. mehrere Satelliten haben. Einer mit Daten zu Ansprechpartnern, einer mit Lieferadressen, ein weiterer für Rechnungsadressen. Auch wenn, technisch betrachtet, Adressen für Lieferung und Rechnung identisch sein könnten werden diese unabhängig voneinander im jeweiligen Satelliten gespeichert, da sie sich unabhängig voneinander ändern können und es Aufgabe des jeweiligen Satelliten die zu einem dedizierten Zeitpunkt gültigen Daten bereit zu stellen. Links stellen direkte Beziehungen zwischen Hubs dar, ihre Satelliten liefern die Details der Transaktion. Im Vorliegendem Beispiel könnte ein Link „Bestellvorgang“ eine Verbindung zwischen Bestellung, Kunde und Produkt liefern, ein Satellit des Links vorgangsbezogene Details.