Frameworks als rettende Helfer Data Vault: mehr Agilität im Data Warehouse (Teil 3)

0

Data Vault

Mehr Agilität durch Data Vault

Wer bislang noch nicht mit der Modellierungstechnik Data Vault gearbeitet hat, fragt sich häufig, wie diese in die bestehende Data Warehouse-Architektur integriert werden kann. Data Vault Frameworks sind hier die Lösung, weil sie einen Layer zwischen Data Warehouse und Entwickler ziehen und somit die Komplexität bei der Umsetzung verringern.

Um eines vorwegzunehmen: Es ist nicht notwendig, die Data Warehouse-Architektur komplett neu aufzusetzen. Die neuen Funktionen können mit Konzepten und Methoden des Data Vaults aufgebaut werden. Dabei ist ein paralleles Anwenden von Data Vault möglich und bereits existierende Bestandteile gehen nicht verloren.

Dieser Beitrag ist dem Whitepaper Mit Data Vault zu mehr Agilität im Data Warehouse entnommen.

Das Pentaho Data Vault Framework

Um Unternehmen bei der Entwicklung, Bereitstellung und dem Betrieb von Data Vaults zu unterstützen, haben wir das Pentaho Data Vault Framework entwickelt. Das Framework erlaubt einfaches Anbinden neuer Datenquellen, ohne selbst ETL-Strecken entwickeln zu müssen. Die ETL-Jobs zum Beladen von Hubs, Links und Satelliten sind dazu vollständig parametrisiert. Dabei werden auch knifflige Fälle berücksichtigt, etwa, wie man mit fehlenden Datensätzen, multiaktiven Satelliten oder der fachlichen Gültigkeit von Daten umgeht.

Komfortable Konfiguration

Das Framework verfügt über ein intuitiv bedienbares, grafisches Interface, mit dem Anwender das Data Vault komfortabel konfigurieren können. Hier können Anwender Satelliten an beliebiger Stelle in das Data Vault einfügen, ohne dabei das Modell zu verändern. Das Konfigurations-Cockpit ermöglicht eine bequeme Steuerung und eine einfache Anbindung neuer Datenquellen.

Darüber hinaus haben wir Werkzeuge entwickelt, mit denen historisierte Daten einfach zusammengefügt und in den Data Marts zur Analyse zur Verfügung gestellt werden können. Schließlich wollen Unternehmen auf die Daten bedarfsgerecht zugreifen können. Durch den PIT Merge Join Step können zum Beispiel Daten aus verschiedenen Satelliten chronologisch korrekt zusammengebracht werden, ohne dass dafür unflexible Point-In-Time-Tabellen benötigt werden.

Praxisbeispiel Financial Services

Wie sieht nun Data Vault in der Praxis aus? Ein Beispiel eines unserer Kunden, ein Automobilhersteller: die Financial Services für die Länderorganisationen Schweiz und Österreich mussten bislang Berichte für das Reporting manuell zusammenstellen. Deshalb sollte eine zentrale, konsolidierte Datenplattform geschaffen werden, die von den beiden Länderorganisationen genutzt werden konnte.

Die umgesetzte Lösung umfasst ein zentralen Reporting, das auf einem Data Warehouse mit Pentaho basiert. Das Data Warehouse ist mit Hilfe von Data Vault agil aufgebaut und erlaubt damit das schnelle und flexible Einbinden neuer Datenquellen. Durch die Historisierung der im Data Warehouse gehaltenen Daten sind „Zeitreisen“ möglich, d.h. die Auswertung von historisierten Daten.

Verbesserungen und Vorteile:

  • Automatisierte Erstellung von Reports
  • Durch Historisierung durchgängige Sicht auf Daten und Geschäftsprozesse
  • DWH flexibel erweiterbar durch agile Architektur
  • Daten revisionssicher auditierbar

Eine Zusammenfassung dieser Blogserie findet sich im Whitepaper Mit Data Vault zu mehr Agilität im Data Warehouse.

Diese Artikel könnten Sie auch interessieren:

Tags: , ,

Stefan Müller - Director Big Data Analytics
Nach mehreren Jahren Tätigkeit im Bereich Governance & Controlling und Sourcing Management ist Stefan Müller bei it-novum gelandet, wo er den Bereich Big Data Analytics aufgebaut hat. Stefans Herz schlägt für die Möglichkeiten, die die BI-Suiten von Pentaho und Jedox bieten, er beschäftigt sich aber auch mit anderen Open Source BI-Lösungen. Seine Begeisterung für Business Open Source im Bereich Datenintelligenz gibt Stefan regelmäßig in Fachartikeln, Statements und Vorträgen weiter.
Webprofile von Stefan: Twitter, LinkedIn, XING