Question 1

Was enthält die DVPD?

Accepted Answer

Tabellenstruktur und Beziehungen des Data Vault Model
Struktur und Zuordnung von Quellfeldern zu Tabellen und Spalten des Data Vault-Modells
Erklärungen zu den Spalten- und Zeilenreihenfolge in den Hash-Berechnungen
Parameter, um quelltechnologieabhängige Verfahren auszuwählen und zu konfigurieren
(z.B. technologiespezifisches Ausführungsmodul – DB, REST, FILE …)
vom Quelldatenformat abhängige Erläuterungen
(z. B. Schleifenelement in einem hierarchischen Dokumentenformat, Positionsindex einer Spalte, Json Pfad für eine Spalte)
Parameter zum inkrementellen Verhalten der Quelle (z.B. zu verfolgende Indexwerte)
Verfahren zur Erkennung von Löschvorgängen
(z. B. Vergleich der vollständigen Stufe mit dem Tresor beim Laden)
allgemeine Einstellungen wie Hash-Algorithmen, Namen für Meta-Spalten, spezielle Werte (z.B. weit in der Zukunft liegende Daten, Ghost-Record-Werte) und mehr

Question 2

Wie ist die DVPD zu lesen?

Accepted Answer

Die Syntax orientiert sich an den Bedürfnissen von Data Vault und ist bei entsprechender Kenntnis der Methode in vielen essenziellen Elementen selbsterklärend. Dabei wird der Ansatz verfolgt, den Deklarationsaufwand für die häufigsten Modellszenarien so knapp wie möglich zu halten.

Dieses Vorgehen stützt sich auf die Tatsache, dass beim Einsatz der Data Vault Methode schon wenige Anhaltspunkte genügen, um alle daraus resultierenden Schritte und Vorgehen zu schlussfolgern.

Das vollständige Vorgehen zur Interpretation einer DVPD ist in einer ausführlichen Konzeptdokumentation und der Syntaxreferenz beschrieben.

Question 3

Was enthält die Veröffentlichung?

Accepted Answer

Das DVPD-Konzept wird als Git Repository veröffentlicht unter:
https://github.com/cimt-ag/data_vault_pipelinedescription

Das Projekt bietet eine Konzept-Dokumentation, die Syntax-Referenz, sowie die Referenzimplementierung eines DVPD-Compilers (DVPDC) zur syntaktischen und semantischen Prüfung und die Interpretation einer DVPD nach dem vorgegebenen Regelwerk enthält.
Das Regelwerk umfasst die
Ableitung von Tabellendefinitionen für den Data Vault (Meta-, Hash- und Inhaltsspalten je Tabelle)
Liste der Ladeoperationen für jede Tabelle, inklusive der jeweiligen Abbildung der Quellfelder auf die Zieltabelle und Zusammenstellung der Hashwerte
Tabellendefinition für notwendigen Staging Tabellen

Question 4

Wie kann man das Konzept im eigenen Projekt umsetzen?

Accepted Answer

Hier zuerst einmal die üblichen Analysefragen:

Wie sieht Ihre bisherige Werkzeugkette aus?
Welche Ziel und Ergebnisse möchten Sie mit dem Projekt erreichen?
Welchen aktuellen Herausforderungen begegnen Sie aktuell?

Ein paar Beispiele:

Kein Datenmodellierungswerkzeug, DDL’s werden manuell erstellt.
⇒ DVPD als zentralen Speicher für das Modell einführen und DDL’s aus der DVPD generieren
Modellspezifikation erfolgt mit Excel für einen selbstentwickelten Codegenerator, ist aber fehleranfällig und kann bestimmte Szenarien nicht abbilden.
⇒ Excel mittels Transformationsscript in DVPD übersetzen. Nicht abbildbare Szenarien manuell als DVPD ergänzen. Input für Codegenerator aus der DVPD erzeugen oder Codegenerator für DVPD als Input umstellen. So kann später das Excel Tool ersetzt werden.
Geplantes Modellierungswerkzeug hat keinen direkten Output für die verwendeten Codegenerator und benötigt extra Eingaben, um korrekte DDL’s zu generieren.
⇒ Übersetzung des Outputs in DVPD implementieren. Die Eingaben im Modellierungswerkzeug auf das Wesentliche beschränken (Tabellen, Mapping). DDL’s aus der DVPD generieren und Codegenerator über Konverter aus der DVPD bedienen.

Weitere ausführliche Einsatzszenarien sind in der Dokumentation im Git Repository verfügbar. Gerne unterstützen wir Sie auch bei der Evaluierung und Einführung eines DVPD-Konzeptes für Ihre Data Warehouse Plattform.

Data Vault Pipeline Description - Eine Lösung für die Data Vault Automatisierung

Nutzen Sie einen universellen Bauplan für Ihr Data Warehouse!

Was ist DVPD?

Motivation zur Nutzung

Unsere Beratung für Ihre Data Vault Automatisierung

Kontakt

Erklärvideo

Open Source

Ihre Vorteile

Das könnte interessant für Sie sein

WO SIE UNS FINDEN

Hamburg

An der Alster 64

20099 Hamburg

Tel: +49 40 533 02-0

Berlin

Bundesallee 39-40a

10717 Berlin

Tel: +49 30 834 098-0

Düsseldorf

Steinstraße 4

40212 Düsseldorf

Tel: +49 211545907-0

Frankfurt

Hanauer Landstrasse 121

60314 Frankfurt

Tel: +49 69 9150 687-0

KÖLN

Lichthaus

Oskar-Jäger-Straße 170

50825 Köln

Tel: +49 221 367 986-0

Vught, NL

SparrendaalseWeg 5

NL-5262 LR Vught

Tel: +31 73 30304-58

Granada, ES

Av. del
conocimiento, 41

18016 Granada