MongoDB und Pentaho – Teil 2: BI-Analysen der nächsten Generation

0
Datendschungel: weniger undurchdringlich mit MongoDB und Pentaho

Datendschungel: weniger undurchdringlich mit MongoDB und Pentaho

Big Data bietet Unternehmen jede Menge neuer Möglichkeiten, stellt aber auch neue Anforderungen an Datenhaltung und Analyse. Im ersten Teil habe ich euch die Vorteile vorgestellt, die eine NoSQL-Datenbank wie MongoDB hinsichtlich der horizontalen Skalierbarkeit und Performance großer Datenmengen bietet. In Kombination mit der Business Analytics Suite von Pentaho lassen sich diese Daten verständlich aufbereiten und in geschäftsrelevante Informationen verwandeln – was die Wertschöpfung von Geschäftsprozessen deutlich erhöht.

Das Bedürfnis der Anwender nach Verständlichkeit und ansprechender Darstellung steigt parallel zur Datenflut. MongoDB und Pentaho im Unternehmenseinsatz zusammenzubringen, ist deshalb ein äußerst vielversprechender Ansatz. Die Kombination beider Tools ermöglicht Anwendern, operative Unternehmensdaten durch echtzeitnahe Analyse und grafische Aufbereitung zu strategisch relevanten Kennzahlen zu veredeln. Der native Datenzugriff verknüpft die Vorteile eines Document-DBs mit den grafischen und benutzerfreundlichen Verwaltungs- und Analysewerkzeugen der Pentaho Business Analytics Suite. Das reduziert den Schulungs- und Wartungsaufwand, erlaubt neue Formen der Datenanalyse und -modellierung und ermöglicht auch nicht-technischen Nutzergruppen, direkt mit der Datenbank zu interagieren.

Nahtlose Integration und leistungsstarke Analysen
MongoDB kann auf Grund des Shardings mehrerer Server auch eine sehr große Anzahl strukturiert und unstrukturiert vorliegender Daten sehr schnell bereitstellen. Um diese Daten in kurzen Intervallen analysieren und bewerten zu können, bedarf es einer geeigneten Software. Pentaho Business Analytics ist solch eine Datenanalysesoftware. Sie besteht aus verschiedenen Modulen und deckt unterschiedliche Bereiche der Business Intelligence ab. Dazu zählen u.a. der ETL-Bereich, Reporting, OLAP und Data Mining, die das gesamte Spektrum von Operational Intelligence bis hin zu Self-Service-BI bedienen.

Pentaho nutzt zur Interaktion grafische Drag&Drop-Oberflächen, die das Arbeiten mit einer technischen Anwendung wie MongoDB erleichtern. Pentaho integriert MongoDB nativ. Das heißt: Pentaho greift direkt auf die von MongoDB bereitgestellten Funktionen und Inhalte wie das Aggregation Framework, die Tag Sets und die Replikationen zu. Das beschleunigt die Verfügbarkeit von Unternehmensdaten für alle Nutzergruppen und hilft, die Produktivität zu verbessern.

Integration der Datenbank MongoDB in die Pentaho BA Suite (Quelle: Pentao).

Integration der Datenbank MongoDB in die Pentaho BA Suite (Quelle: Pentaho).

Direkte Datenverarbeitung aus NoSQL-Speichern
Eine zentrale Aufgabe im BI-Umfeld sind Extraktions-, Transformations- und Ladeprozesse (ETL). Um die von MongoDB bereitgestellten Daten direkt zu integrieren, nutzt Pentaho seine umfassende Datenintegrationsplattform Pentaho Data Integration (PDI). PDI ist ein grafisches ETL-Tool zum Laden und Verarbeiten der in MongoDB hinterlegten Daten. Mittels Data Blending und interaktiven Visualisierungen lassen sich Kodierung und Komplexität deutlich reduzieren. Das ermöglicht beispielsweise auch dem Marketing, Big Data-Analyselösungen auf den Features von MongoDB aufzubauen. Weil kein aufwändiger MapReduce-Code zu schreiben ist, sparen IT-Experten wegen der wegfallenden manuellen Programmierarbeiten ebenfalls viel Zeit.

Verknüpfung von Pentaho Data Integration (PDI) und MongoDB (Quelle: Pentaho).

Verknüpfung von Pentaho Data Integration (PDI) und MongoDB (Quelle: Pentaho).

OLAP-Auswertung mit dem Analyzer-Modul
Nachdem alle relevanten Daten und Kennzahlen in einem Mondrian-Schema hinterlegt und zu OLAP-Würfeln zusammengefasst sind, geht es an die Analyse. Hierfür verwendet Pentaho den Analyzer – ein Tool zur Visualisierung und Auswertung von Daten. Bis vor kurzem war der Pentaho Analyzer nur in Verbindung mit relationalen Datenbanksystemen einsetzbar. Doch mit Version 5.1 der Pentaho BA-Suite lassen sich Ad-Hoc-Analysen, Dashboards und Reports nun auch aus MongoBD erzeugen. Damit liefern Pentaho und MongoDB eine Rund-um-Unternehmensansicht und bieten kleinen wie großen Unternehmen die Möglichkeit, die Wertschöpfungspotentiale von Big Data voll zu nutzen. Die neue Funktionalität zeigen wir auch in einer Demoanwendung, die unter http://www.pentaho.com/analytics-for-mongodb zum Download zur Verfügung steht.

Visualisierung schafft Wissen
MongoDB bietet eine effiziente und leistungsstarke Möglichkeit, besonders große und stark variierende Daten zu verwalten. Gerade durch die Techniken der In-Memory-Verarbeitung, der horizontalen Skalierung und dynamischer Schemata ist MongoDB sehr gut auf die Anforderungen und Einsatzszenarien im Big Data-Bereich abgestimmt. Aber auch traditionelle Anwendungen lassen sich zuverlässig umsetzen, weshalb MongoDB im professionellen Unternehmenseinsatz verstärkt als Alternative zu relationalen Datenbanken genutzt wird.

Mit der Pentaho BA-Suite lassen sich Berichte, Dashboards und Analysen direkt aus MongoDB erstellen und mit einer Vielzahl anderer Datenquellen zu interaktiven Visualisierungen kombinieren. Im Unternehmenseinsatz bringen beide Tools ihre individuellen Stärken in die Business Intelligence ein, sodass sich eine Vielzahl von Use Cases und Anwendungen abdecken lässt.

Diese Artikel könnten Sie auch interessieren:

•    MongoDB und Pentaho, Teil 1: Real-Time Analytics mit NoSQL
•    Ein Einblick in „Pentaho und Jedox“, Teil 1
•    Es funkt: Pentaho integriert Spark
•    Die vier Big Data Musketiere

Tags: , , , ,

Stefan Müller - Director Business Intelligence & Big Data
Nach mehreren Jahren Tätigkeit im Bereich Governance & Controlling und Sourcing Management ist Stefan Müller bei it-novum gelandet, wo er den Bereich Business Intelligence aufgebaut hat. Stefans Herz schlägt für die Möglichkeiten, die die BI-Suiten von Pentaho und Jedox bieten. Er beschäftigt sich aber auch mit anderen Open Source BI-Lösungen. Seine Begeisterung für Business Open Source für Datenanalyse und -aufbereitung gibt Stefan regelmäßig in Fachartikeln, Statements und Vorträgen und als Experte der Computerwoche weiter.
Webprofile von Stefan: Twitter, XING, Google+

Kommentar schreiben

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.