Skip to main content

Best Practice: Open Data Warehouse. Aufbau eines Data Warehouse mit Pentaho

Unternehmen und ihr Umfeld produzieren immer schneller, immer größere Datenmengen. Die anfallenden Daten bergen ein riesiges wirtschaftliches Potenzial. Diese Best Practice zeigt, wie sich mit Open Source-Produkten ein leistungsfähiges Data Warehouse realisieren lässt.

Die anfallenden Daten bergen ein riesiges wirtschaftliches Potenzial – wenn sie richtig verarbeitet und analysiert werden. Ein Data Warehouse bietet die optimale Grundlage dafür.

Diese Best Practice zeigt, wie Sie mit Open Source ein leistungsfähiges Data Warehouse realisieren lässt. Dazu wird eine prototypische Beispielarchitektur konzipiert und aufgebaut. Zum Einsatz kommen die Lösungen Pentaho und Infobright.

Die Best Practice deckt alle wichtigen Punkte bei der Konzeption und Implementierung eines Data Warehouse ab:

  • allgemeiner Aufbau eines Data Warehouse
  • Anbindung der Datenquellen
  • Aufbau des ETL-Prozesses
  • Datenhaltung
  • Datenanalyse
  • Datenpräsentation

Die Best Practice ist interessant für Sie, wenn Sie

  • über die Einführung eines Data Warehouse im Unternehmen nachdenken und auf der Suche nach einer
  • geeigneten Lösung sind.
  • lieber in Software-Anpassungen investieren als in Software-Lizenzen.
  • eine offene und anpassbare Lösung haben wollen, die schnell aufzusetzen ist und mit Ihren Anforderungen mitwächst.
  • bereits Open Source-Lösungen ins Auge gefasst haben, aber noch nicht wissen, wie Sie das Projekt angehen sollen.
  • ein begrenztes Projektbudget haben.

Sie profitieren vom Lesen dieses Best Practice, weil es Ihnen

  • eine Beispielarchitektur für ein Open Source-basiertes Data Warehouse aufzeigt und nachvollziehbar beschreibt,
  • Tipps für die Konzeption und Implementierung gibt,
  • ein Konzept zur Verfügung stellt, dass Sie an Ihre eigenen Bedürfnisse anpassen können,
  • Empfehlungen für Software-Produkte beinhaltet, die sich im Praxiseinsatz bewährt haben.
Aufbau eines Data Warehouse mit Pentaho

Inhalt

1    Zielsetzung und Nutzen

2    Management Summary

3    Aufbau des Data Warehouse-Systems

4    Datenquellen

5    Datenerfassung

    5.1    Aufbau des ETL-Prozesses

        5.1.1    Best Practices-Ansatz zum Umgang mit Lookup- und Join-Operationen

    5.2    Praktische Umsetzung

    5.3    Datenhaltung

        5.3.1    Optimierung der Performance

    5.4    Datenanalyse

    5.5    Datenpräsentation

6    Resümee und Ausblick

7    Anhang

Whitepaper anfordern