Die Pentaho-Community in Frankfurt

0
Ganz schön voll: der Veranstaltungsraum im Meet/n/Work

Ganz schön voll: der Veranstaltungsraum eine Minute nach dem Beginn

12.00 Uhr: Wir sind gerade in Frankfurt angekommen, um das Pentaho Community Meeting vorzubereiten, das um 14 Uhr beginnen soll. Von Fulda aus ist das nur ein Katzensprung, viele der Teilnehmer werden einen wesentlichen weiteren Anfahrtsweg haben als wir. Wir sind jedoch keine Sekunde zu früh da: der erste Teilnehmer betritt noch vor uns die Räume des Meet/N/Work gegenüber dem Hauptbahnhof – wie wir kann er es wohl kaum erwarten 🙂 Heute trifft sich die deutschsprachige Anwendergemeinde von Pentaho und wir sind sehr gespannt, wer alles kommen und welche Beiträge es geben wird.

Die Vorbereitungszeit (Kaffeemaschine testen, Toilettenräume finden) stellt sich als fast zu kurz heraus, ab 13.15 Uhr schneien die Teilnehmer im Minutentakt herein. Von Pentaho ist Pedro Alves der Erste, man sieht, er nimmt seinen Job als Pentaho Community Manager ernst. Ein wenig später darf ich Christian Kolodziej begrüßen, der den empfehlenswerten OSBI-Blog schreibt. Dann kommen Matt Casters und Jens Bleuel, die Hauptentwickler der Datenintegrationskomponente von Pentaho. Mittlerweile ist es schon ziemlich voll, gut, dass wir zwei Kaffeemaschinen zur Verfügung haben! Bis auf einen Platz hinten rechts sind alle 45 Stühle besetzt, obwohl wir gestern noch ein paar Absagen bekommen haben. Das nennt man gute Raumkalkulation 🙂

Ctools, Sparkl und... Pedro Alves bei seinem Vortrag

Ctools, Sparkl und… Pedro Alves bei seinem Vortrag

Ich begrüße kurz die Anwesenden, dann ist auch schon Pedro an der Reihe. Er redet, um mit den Twitterworten von Matt zu sprechen, über „Ctools, Sparkl, the meaning of life, everything… in 20 minutes“. Tatsächlich gibt Pedro viele Einsichten in Pentaho, u.a. einen Überblick über den Pentaho Marketplace, der zentralen Sammel- und Verteilungsstelle für alle Pentaho-Plugins. Fehlen Erweiterungen oder Funktionalitäten, lassen sie sich hier einreichen. Dann stellt er die Ctools, Community-Projekte für Datenvisualisierungen, und Sparkl vor. Spannend auch die Sektion über den JCR Synchronizer, bevor er nach exakt 20 Minuten den Stab weiter gibt an Matt Casters.

Matt Casters über Pentaho Data Integration

Matt Casters über „all kinds of data problems“

Matt stellt – nicht weiter überraschend – Kettle bzw. Pentaho Data Integration vor. Pentaho Data Integration ist laut Matt dazu da, um alle Arten von Datenproblemen zu lösen (in Gesprächen in der Pause bekommt man eine Ahnung davon, WAS alles mit PDI möglich ist…). Das Anbinden von verschiedenen Datenquellen, ob SQL oder NoSQL, geht über PDI genauso wie das Zusammenführen von unterschiedlichen Datenbeständen und das anschließende Transformieren. Kettle war schon in seinen alten Zeiten berühmt für seine umfangreichen ETL-Funktionalitäten, heute beherrscht es aber auch alle neuen Technologien, vor allem im Big Data-Bereich. Matt stellt einige der neusten Entwicklungen im PDI-Bereich vor, woran Jens Bleuel in seinem darauffolgenden Vortrag anknüpft.

Es ist 15.00 Uhr, das heißt, wir liegen außerordentlich gut im Zeitplan. Jens Bleuel, federführend für Pentaho Data Integration tätig, stellt die Produkt-Roadmap vor. Momentan liegt der Fokus auf Big Data-Funktionalitäten, u.a. soll das Deployment zusammengesetzter oder sehr komplexer Datenbestände vereinfacht werden, u.a. durch InstaView. Jens beschäftigt sich daneben mit einer Auswertung der Nutzung von Steps. Dazu soll es möglich sein, Statistikdateien hochzuladen, aus denen ersichtlich wird, welche und wie viele Steps genutzt werden. Das Ganze wird anonym erfasst, Jens bietet aber an, individuell Feedback zu geben, wenn das gewünscht ist. Die Ergebnisse möchte Jens in zwei, drei Wochen in seinem Blog veröffentlichen. Mitmacher sind sehr willkommen! Nach so viel Input zu den geplanten Entwicklungen haben wir uns eine Pause verdient oder um es mit Jens´ Worten zu sagen: „Ansonsten haben wir jetzt glaube ich Pause… Stefan, möchtest du etwas dazu sagen?“

Marcus Schablack von BOS, die Pentaho als Controllingplattform einsetzen

Marcus Schablack von BOS, die Pentaho als Controllingplattform einsetzen

Gestärkt geht es in die zweite Runde der Vorträge. Marcus Schablack, der den Bereich Application Development bei BOS leitet, stellt ein sehr spannendes Projekt (eigentlich sind es mehrere spannende Projekte) mit Pentaho vor. Der Automobilzulieferer aus Ostfildern in der Nähe von Stuttgart setzt Pentaho für diverse Anwendungsszenarien ein. Die Anforderungen an die Software waren erhältliche Schnittstellen für vorhandene Systeme wie SAP, Oracle DB, PostgreSQL, die im Unternehmen bereits eingesetzt werden, die Möglichkeit, die Software individuell anpassen zu können, geringe Hardwareanforderungen und eine gegebene Skalierbarkeit, sodass die Software auch bei komplexen Themen handhabbar bleibt. Das Herausfordernde an dem Projekt war unter anderem, dass vorher viele Kennzahlen gar nicht definiert oder unklar waren, die Datenqualität teilweise nicht ausreichte und das Wissen über die relevanten Daten, Informationen und Prozesse fehlte – also so wie in vielen Unternehmen. Das Projekt wurde daher unternehmensweit ausgerollt und umfasste neben der IT auch das Qualitätsmanagement, den Einkauf und das Projektmanagement.

BOS nutzt Pentaho in verschiedenen Bereichen: das sogenannte PEP+ Cockpit bietet eine aggregierte Sicht auf relevante Informationen von Kundenprojekten: Projektstammdaten, Kosten und Stunden sowie Meilensteine. In das PEP+ Cockpit fließen über Pentaho Data Integration Daten aus dem Bestellwesen, dem Contolling und dem Projektmanagement. Daraus werden Berichte mit dem Pentaho Report Designer für verschiedene Empfänger erstellt.

Das zweite Projekt, für das BOS Pentaho einsetzt, ist die Supplier Score Card. Diese Anwendung erstellt automatisiert Beurteilungen von Lieferanten und verfügt über eine integrierte Mailingfunktion. Ziel der Supplier Score Card war es, die bislang manuell erfolgte Erstellung der Lieferantenbewertungen abzulösen. Die Daten kommen aus dem SAP-System und Exceltabellen, welche die verschiedenen Werke schicken, werden mit PDI zusammengefügt und im Report Designer automatisiert als Berichte ausgegeben. Neuestes Projekt bei BOS ist ein Qualitätsmanagement-Reporting, das automatisiert Reports zur Visualisieung der Qualitätsmeldungen und Kundenreklamationen erzeugt. Dadurch wird die bestehende Excel-Anwendung abgelöst, manueller Aufwand verringert und Prozesse vereinheitlicht – bei 17 Werken kommt da eine ganz schöne Anzahl zusammen. Für die Zukunft ist ein Ctools-Projekt geplant – mit so vielen Projekten dürfte BOS zu den derzeit aktivsten Pentaho-Anwendern gehören 🙂 Den Projektbericht findet man übrigens auf unserer Seite: Automobilzulieferer führt Pentaho für Controlling und Reporting ein.

Was macht ein solches Projekt erfolgreich? Laut Marcus Schablack sind es vier Faktoren: der Status als unternehmensweites Projekt, an dem alle beteiligt sind, motivierte Projektteammitglieder, ein agiler Ansatz, der der sehr hohen Komplexität des Projekts gerecht wird, und die Erarbeitung eines Glossars, das die fachbereichsübergreifende Kommunikation erleichtert. Die vielen Bereiche, für die BOS Pentaho einsetzt, ziehen eine Latte von Fragen und interessanten Diskussionsbeiträgen nach sich, die ich zum Glück nicht nach der Hälfte abschneiden muss, denn wir haben mehr Zeit als ursprünglich geplant: Zwei Referenten sind leider abgesprungen. Marcus´ Beitrag bleibt daher der einzige Projektvortrag, was ein wenig schade ist.

Wie schneiden analytische Datenbanken ab?

Wie schneiden analytische Datenbanken ab?

Wir machen weiter mit zwei Beiträgen, die aus den ITN Labs kommen: Maximilian Post hat sich in seiner Abschlussarbeit an der Hochschule Fulda mit analytischen Datenbanken beschäftigt. Analytische Datenbanken zeichnen sich dadurch aus, dass sie größere Datenmengen auswerten können (dadurch verbesserte Erfolgskontrolle und Transparenz), eine hohe Abfrageperformance besitzen, die Echtzeitanalytik erst möglich macht, und einen geringeren Optimierungsaufwand haben, indem die entsprechende Fachabteilung entlastet wird. Als Untersuchungsobjekte hat Maximilian Infobright, InfiniDB und Vertica gewählt. Die Datenbankabfragen wurden mit Mondrian mit dem Star Schema durchgeführt. Bei allen Testszenarien schnitt Infobright am Besten ab, gefolgt von InfiniDB. Bei nativen Abfragen hängt die Performance des genutzten Schemas (Star vs. Flat Schemas) von der eingesetzten Datenbank ab.

Ein Beispiel für ein gelungenes Dashboard

Aufgeräumt, übersichtlich, farblich zurückhaltend, aber gut akzentuiert: Ein Beispiel für ein gelungenes Dashboard (Quelle: Pentaho)

Pentaho Ctools und Dashboard-Erstellung sowie der Aufbau eines Vertriebsdashbaords stehen im Zentrum des zweiten ITN Labs-Vortrags. Christoph Scheib betont zu Beginn, dass ein Dashboard nur geforderte Kennzahlen enthalten sollte (also vom Management oder der Fachabteilung) – alles andere lenkt nur von den relevanten Daten ab. Die Hauptbestandteile eines Dashboards sollten Grafiken und Diagramme sein, keine reinen Datenlisten. Verzichtet werden sollte aber auf 3D-Diagramme, da sie schwerer interpretierbar sind als 2D-Diagramme. Das Dashboard sollte sich über den kompletten Bildschirm erstrecken, aber nicht darüber (Daten, zu denen gescrollt werden muss, werden vom Anwender nachweislich als weniger wichtig erachtet). Der vollständige Beitrag findet sich auf dieser Seite. Dann präsentiert Christoph ein sehr ansprechendes Dashboard für den Vertrieb, das bei Pedro sichtlich für Begeisterung sorgt.

Gruppenbild Pentaho Community Meeting Deutschland

Danke an alle Teilnehmer für das spannende Treffen!

17.30 Uhr – Zeit für den inoffiziellen Teil des Community Meetings: Gespräche, Austausch, Bier und Pizza! Wir danken allen Teilnehmern ganz herzlich für die spannenden Beiträge und interessanten Fragen und die langen Anfahrtswege, die sie teilweise auf sich genommen haben! Wir werden hier in den nächsten Tagen Bilder vom Meeting und inhaltliche Ergänzungen veröffentlichen. Wer nicht dabei sein konnte: wir planen eine Wiederholung des Treffens auf dem Linuxtag in Berlin im Mai. Nähere Infos folgen noch.

Bildergalerie Pentaho Community Meeting



Social Media-Aktivitäten im Vorfeld und während des Meetings:

Tags: , ,

Stefan Müller - Director Business Intelligence & Big Data
Nach mehreren Jahren Tätigkeit im Bereich Governance & Controlling und Sourcing Management ist Stefan Müller bei it-novum gelandet, wo er den Bereich Business Intelligence aufgebaut hat. Stefans Herz schlägt für die Möglichkeiten, die die BI-Suiten von Pentaho und Jedox bieten. Er beschäftigt sich aber auch mit anderen Open Source BI-Lösungen. Seine Begeisterung für Business Open Source für Datenanalyse und -aufbereitung gibt Stefan regelmäßig in Fachartikeln, Statements und Vorträgen und als Experte der Computerwoche weiter.
Webprofile von Stefan: Twitter, XING, Google+

Kommentar schreiben

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.