Usecases für Data Warehousing und Analytics: das Pentaho User Meeting

4
Mit 130 Teilnehmern war das Pentaho User Meeting bis auf den letzten Platz besetzt

Mit 130 Teilnehmern war das PUM bis auf den letzten Platz besetzt

120 Teilnehmer, 13 Vorträge, 6 Usecases: das war das Pentaho User Meeting 2017. Zum inzwischen vierten Mal hatten wir als Pentaho-Partner die deutschsprachigen Anwender der BI-Plattform zum Erfahrungsaustausch und Kennenlernen eingeladen. Dieses Jahr gab es besonders spannende Anwendervorträge und ich habe mich sehr gefreut, dass Eurofunk, Bosch, Swissport, die Bundespolizei, STIWA und Compex dazu bereit waren, von ihren Projekten zu erzählen. Und zwar nicht nur davon, wie sie Pentaho erfolgreich implementierten, sondern auch, welche Herausforderungen dabei zu bewältigen waren.

Zur Fotogalerie geht es hier

Die vorgestellten Usecases machten eines klar: Die Einsatzgebiete von Pentaho sind praktisch unbeschränkt – vom klassischen Datenintegrations- und Data Warehouse-Projekt wie bei der Bundespolizei oder Swissport über eingebettete Analyselösungen (Compex, Eurofunk, STIWA) bis zu innovativen Anwendungen für Industrie 4.0, Smart Factory und Smart City (STIWA, ITN Labs). Die Usecases stammten aus den Branchen öffentliche Verwaltung, Dienstleistung, Produktion und IT und zeigten auf beeindruckende Weise die große Einsatzbreite von Pentaho: der modulartige Charakter der BI-Plattform erlaubt es, dass sich einzelne Komponenten, z.B. für Datenintegration, Analysen oder Dashboards, herauslösen und als Embedded-Komponente in anderen Anwendungen verwenden lassen. Das macht deutlich, dass für Anwender nicht nur wirtschaftliche Aspekte im Vordergrund stehen, sondern zuerst technische: wenn ich Zugriff auf den Code habe und mich aus einem Pool ausgereifter ETL- und Analytics-Werkzeuge bedienen kann, kann ich mich schnell an sich ändernde Rahmenbedingungen anpassen.

Die Beiträge im Überblick:
Matt Casters (Pentaho): Webspoon und Realtime Data Streaming
PDI-Chef und Kettle-Erfinder Matt Casters stellte die neuesten Entwicklungen im Bereich Datenintegration vor sowie drei nützliche Plugins für Pentaho Data Integration (PDI): Data Sat, WebSpoon und PDI Streaming.
Zum Vortrag

Pedro Alves (Pentaho): Was ist neu in Pentaho 7.0?
Pentaho 7.0 schafft erstmals die Trennung von Business und IT ab. Ziel des revolutionären Ansatzes ist es, die klassischen Datensilos durch ein unternehmensweites Datenökosystem abzuschaffen. Dadurch sollen Anwender Daten an jedem Punkt der Informationsverarbeitungskette auswerten können, auch im Stadium der Datenintegration und -aufbereitung. Zudem unterstützt Pentaho 7.0 noch besser die Auswertung von Big Data.
Zum Vortrag

Jens Bleuel (Pentaho): Was ist neu in Pentaho 7.0 und Metadata Injections
Als Senior Product Manager Data Integration stellte Jens Bleuel auf die neuen Funktionen in Pentaho 7.0 ein und spezielle Szenarios für Metadata Injections.
Zum Vortrag

Wael Elrifai (Pentaho): Industry of Things, Big Data und Machine Learning
Industry of Things, Big Data und Maschinenlernen sind keine Buzzwords, sondern sich gegenseitig ergänzende Konzepte. Pentaho hilft, sie umzusetzen, indem sie die Themen Data Engineering, Maschinenlernen und Data Science aufgreift.
Zum Vortrag

Bundespolizei: ein Data Warehouse für die Bundesbehörde
Data Warehousing at its best: die Bundespolizei erstellt mit Pentaho die Polizeiliche Eingangsstatistik, die zuvor in ca. 72 Excelsheets erfasst wurde. Im neuen Data Warehouse werden die Daten aus 160 Revieren, 80 Inspektionen, 10 Direktionen und dem Präsidium aufbereitet, sodass sie innerhalb kurzer Zeit für die Beantwortung von Anfragen aus Parlament oder Bundesinnenministerium zur Verfügung stehen.
Zum Vortrag

STIWA: Pentaho als Industry 4.0- Lösung
AMS Analysis-CI ist eine auf Pentaho Mondrian basierende Analysesoftware für Montageanlagen, mit der Probleme in der Produktion bis auf Einzel-Messwertebene aufgespürt werden können. Mit Dashboards lässt sich der Zustand der Gesamtanlage auf einen Blick erfassen, zur Problemidentifizierung kann aus dem Dashboard heraus bis auf Komponentenebene gezoomt werden. Dadurch lassen sich neue Anlagen um bis zu 30% schneller hochfahren.
Zum Vortrag

BOSCH: Globales Kundenprojekt-Reporting
Mehr als 1.500 Kundenprojekte erfasst BOSCH in Pentaho. Das „Global Reporting System“ des Unternehmens basiert auf Pentaho, integriert zahlreiche Quelldatensysteme und steht nicht nur internen Abteilungen und Mitarbeitern zur Verfügung, sondern auch BOSCH- Kunden, um Berichte erstellen und abrufen zu können.
Zum Vortrag

Eurofunk: Pentaho als Embedded-Lösung für Rettungskräfte
Ebenfalls als Embedded-Komponente nutzt Eurofunk Pentaho: die Statistik- und Reporting-Software des österreichischen Unternehmens basiert auf Pentaho und ermöglicht Leitstellen der Polizei oder Feuerwehr, ihre Reaktionszeiten bei Rettungseinsätzen zu überwachen und auszuwerten, um daraus wichtige Maßnahmen zur Verbesserung der Rettungsleistungen abzuleiten.
Zum Vortrag

Compex: Web-Applikationen mit Mondrian
Das dritter Embedded-Beispiel stammte von Compex, die Mondrian als Analysekomponente für die Entwicklungsumgebung OS.bee vor, mit der sich Webanwendungen innerhalb weniger Minuten erstellen lassen. Dank Mondrian enthält die Anwendung auch ein Tool für die Echtzeitauswertung von Business-Daten.
Zum Vortrag

Swissport: Pentaho schließt die Kluft zwischen Business und IT
Die PDI-basierte Business Rules Engine von Swissport trennt IT-Prozesse von Geschäftsregeln, sodass nicht nur die Datenprozesse schlanker werden, sondern auch Verantwortlichkeiten zwischen der IT und dem Business besser getrennt werden können. Die Business Rules Engine ist als Plugin für Pentaho erhältlich.
Zum Vortrag

ITN Labs I: Report- und Dashboard-Integration in Unternehmensportalen
Durch die Integration in Unternehmensportalen lassen sich Reports und Dashboards, die mit Pentaho erstellt wurden, einem größeren Nutzerkreis zur Verfügung stellen, z.B. Kunden oder Zulieferern. Im vorgestellten Beispiel kamen Liferay als Portalsystem und Pentaho als Grundlage für die Datenvisualisierungen zum Einsatz.
Zum Vortrag

ITN Labs II: Smart City durch Realtime-Datenverarbeitung
Pentaho lässt sich auch für Realtime-Anwendungen nutzen: ein von it-novum entwickeltes Dashboard zeigt den Verkehrsfluss in Frankfurt/Main in Echtzeit an. Zwei Karten visualisieren dabei den Verkehrsfluss mit Ort und Ursache von Straßensperrungen oder blockierten Fahrspuren und Parkmöglichkeiten im Stadtgebiet mit der aktuellen Belegung der Parkhäuser. Durch integrierte Webcams kann man sich per Kamera ein Bild vom aktuellen Verkehrsfluss machen.
Zum Vortrag

ITN Labs III: Der International Business Communication Standard mit Pentaho
IBSC (International Business Communication Standard) ist ein Notationsstandard, der auch von den Pentaho CTools eingesetzt wird. Pentaho kann daher die Anforderungen von IBCS umsetzen.
Zum Vortrag

Matt Casters: Webspoon und Realtime Data Streaming
Um es mit Pedros Worten zu sagen: „Matt Casters starts the PUM in hardcore demo mode“. Matt stellte drei neue Plugins für Pentahos Datenintegrationskomponente PDI (Pentaho Data Integration) vor: das Data Set Plugin ermöglicht eine einfachere Entwicklung bei langsamen, schwer erreichbaren oder nicht vorhandenen Datenquellen und einen testbezogenen Entwicklungsprozess und stellt zudem Investitionsschutz durch kontinuierliches Testen aller Unit Tests bereit. WebSpoon ist ein PDI-Plugin, das als Addon im Browser laufen kann. Das PDI Streaming Plugin ermöglicht Realtime Data Streaming sowie ETL-Prozesse gegen gestreamte Datenquellen.

Mit Blick auf die Skyline Frankfurts eröffnete Matt Casters das Pentaho User Meeting mit einem Vortrag zu PDI, Webspoon und Realtime Data Streaming

Mit Blick auf die Skyline Frankfurts eröffnete Matt Casters das Pentaho User Meeting mit einem Vortrag zu PDI, Webspoon und Realtime Data Streaming

Pedro Alves: Pentaho 7.0
Um den neuen Ansatz von Pentaho 7.0 ging es in Pedro Alves´ Vortrag, „dem Mann mit den Ctools“. Pentaho 7.0 versucht, die Trennung von Business und IT zu überwinden. Die heutige Datenlandschaft ist voller verschiedener und getrennter Tools und Prozesse, die nicht miteinander verbunden sind. Ziel von Pentaho es, das Geschäft mit verwendbaren, richtigen und jedem zugänglichen Analysen im gesamten Unternehmen zu unterstützen. Die Pentaho-Plattform soll ein komplettes Datenökosystem ermöglichen, in dem die klassischen Datensilos verschwunden sind. Es soll keine getrennten Tools und Prozesse mehr geben, sondern Datenauswertungen an jedem Punkt der Datenpipeline möglich sein. Die Grundlage ist ein einziges Data Warehouse als Grundlage für alle datenbezogenen Aktivitäten. Auswertungen sollen bereits während des Datenaufbereitungsprozesses möglich und sichtbar sein, sodass Fachanwender schneller und flexibler mit Daten arbeiten können.
Auch der Umgang mit Big Data-Beständen ist in Pentaho 7.0 einfacher. Pedro erwähnte nur einige wichtige Neuerungen, u.a. eine bessere Unterstützung von Technologien wie Spark (u.a. können Spark-Anwendungen jetzt direkt in PDI-Jobs ausgeführt werden). Für Hadoop bietet Pentaho via des Authentifizierungsdienstes Kerberos eine größere Sicherheit beim Betrieb von Hadoop-Clustern an.

Bundespolizei: Datenwaschmaschine und Data Warehouse
Michael Becker und Henry Liebrenz stellten das Data Warehouse-Projekt bei der Bundespolizei vor. Früher wurde die Polizeiliche Eingangsstatistik in ca. 72 Excelsheets erfasst, in die jeder statistisch polizeilich relevante Vorgang manuell eingetragen werden musste. Die Dienststellen vor Ort erfassten die Daten und übersandten die Exceltabellen an die jeweilig übergeordneten Direktionen. Diese prüften die erfassten Daten und führten die Daten wiederum zusammen und übersandten sie an das Präsidium. Das Präsidium wiederum prüfte die Daten und fasste sie bundesweit zusammen. Daraus ergab sich eine Verzugszeit von einem Monat, bis die Daten offiziellen Stellen zur Verfügung gestellt werden konnten.

Anmerkung: Die Polizeiliche Eingangsstatistik ist kein Fahndungssystem, sondern eine reine Statistik zur Erstellung des aktuellen Lagebilds. Sie enthält keinerlei personenbezogene Daten, sondern nur Angaben zur Nationalität, Geschlecht, Einreisedatum, Herkunftsland etc. Die Bundespolizei benötigte daher eine Vorgangsweise, wie man die vielen Anfragen (durchschnittlich 3-4 pro Tag aus Parlament, Polizeipräsidium, Bundesinnenministerium, EU oder Frontex) effizienter handhaben konnte. Nötig war außerdem eine „Datenwaschmaschine“ zur Qualitätssicherung, da die angelieferten Daten aus den einzelnen Polizeiinspektionen immer anders erhoben bzw. nicht vollständig und daher nicht immer vergleichbar waren.

Um den Grad der Vereinfachung zu verdeutlichen, nannte Michael Becker als Beispiele eine parlamentarische Anfrage nach der Anzahl der Personen mit einer bestimmten Nationalität, die aus einem bestimmten Herkunftsland in einem bestimmten Zeitraum eingereist sind. Früher waren für die Antwort mehrere Leute beschäftigt, welche die Daten händisch zusammentragen und in Excel einpflegen mussten. Heute steht die entsprechende Auswertung schon nach wenigen Klicks zur Verfügung und kann damit ohne großen Zeitverzug der anfragenden Stelle zugeschickt werden.

Wie Henry Liebrenz betonte, liegt der Vorteil von Pentaho darin, dass die Daten sauber aufbereitet sind, dadurch vergleichbar und auf Knopfdruck ausgewertet werden können. Vor dem Hintergrund der politischen Brisanz mancher Anfragen ist der Aspekt der Datenqualität von großer Bedeutung, da (supra)staatliche Stellen verlässliche Daten brauchen.

Mehr Infos zu dem Projekt gibt es in diesem Interview mit Michael Becker und in diesem Hintergrundartikel im Datacenter-Insider.

Werner Fragner und Alexander Meisinger von STIWA

Werner Fragner und Alexander Meisinger von STIWA

STIWA: Pentaho als Grundlage für Analysesoftware für Produktionsanlagen
Einen spannenden Industry 4.0 Usecase präsentierten Alexander Meisinger und Werner Fragner von der STIWA Group. Ihre Analysesoftware AMS Analysis-CI für Montageanlagen basiert auf dem Pentaho Analyzer und Mondrian. Damit wird eine Problemidentifizierung bis zur Einzel-Achsbewegung bzw. zum Einzel-Messwert möglich. Wie die beiden Referenten mehrfach betonten wäre die Erstellung des Analysesoftware ohne die bereits verfügbare Basisfunktionalität und die Erweiterbarkeit mit anderen Analysetools nur schwer möglich gewesen.

In vielen Produktionsanlagen sind noch zahlreiche verborgene Schätze mit Optimierungspotential in Form von ungenutzten Daten verfügbar. Aus diesem Grund hat STIWA die Analysesoftware AMS Analysis-CI entwickelt. Ziel ist es, alle verfügbaren Signale und Daten zu erfassen, zu verarbeiten und zu vernetzen. Mit gezielten Problemanalysen lassen sich um bis zu 30 % kürzere Hochlaufzeiten bei der Inbetriebnahme neuer Anlagen erzielen oder bis zu 15 % Verbesserung der Gesamtanlageneffektivität erreichen.

Konkret hilft die verwendete Komponente Pentaho Analyzer dabei,

  • Shopfloor Meetings mit Reports zu unterstützen,
  • Ursachen- und Korrelationsanalysen zur Problemidentifizierung durchzuführen,
  • Qualitätsanalysen und eventuelle Reklamationen auszuwerten, um gegebenenfalls Optimierungsbedarf zu erkennen.

Die Analysesoftware AMS Analysis-CI vereint bisher zwei getrennten Produkte in eine integrierte Lösung. Beispiele für die umgesetzten Features sind:

  1. Adhoc-Analysen:
    Adhoc-Analysen waren bisher nicht möglich. Sie lassen sich jetzt bequem über Pentaho Analyzer erstellen. Die Pentaho User Console dient als Applikationsrahmen. Werner Fragner hob hervor, dass der Pentaho Analyzer sehr gute Basis bietet. Zusätzlich wurde dieser um notwendige Funktionalitäten für die diskrete Produktion erweitert.
  2. AMS Dashboard Framework:
    Basierend auf Pentaho Analyzer nehmen die interaktiven AMS Dashboards den Anwender bei der Hand, indem sie mit ihm immer tiefer in die Auswertungen eindringen, um die Ursache eines Problems zu identifizieren. Ein Ausgangspunkt ist die Kennzahl OEE (Overall Equipment Effectiveness), die dann immer weiter aufgelöst wird, um die Ursachen für das Problem weiter einzugrenzen. So lässt sich einfacher entscheiden, ob die Instandhaltung, Prozesstechnik oder Logistik mit der Lösung des Problems beauftragt werden soll.
  3. Integration Qualitäts- und Traceability-Daten
    Die neue Software führt die früher getrennten Sichten aus dem Anlagenbau und dem Anlagenbetrieb zusammen. Dadurch ist es möglich, integrierte Gesamtauswertungen durch die Verknüpfung der Daten dieser beiden Bereiche zu realisieren. Da die Datenmenge in der Automotive-Branche sehr umfangreich werden kann und die Datenvorhaltezeit mindestens 15 Jahre beträgt, erweiterte STIWA die Pentaho-Komponente Mondrian. Dadurch werden die Datenvolumina auswertbar und AMS Analysis-CI mit Pentaho zum Standardprodukt für technische Analysen in der diskreten Produktion.

Weitere Informationen zur Software der STIWA finden sich hier

Rolf Petry stellte das Globale Reporting System bei BOSCH vor

Rolf Petry stellte das Globale Reporting System bei BOSCH vor

BOSCH: Reporting für 1.500 Kundenprojekte
Weltmarktführer BOSCH setzt Pentaho für das weltweite Kundenreporting ein. Die Hauptgründe für Pentaho waren, dass es sich um eine Standardsoftware handelte, dessen Basisystem durch Externe aufsetzbar war, das aber von eigenen Mitarbeitern weiterentwickelt werden konnte. Zudem ließ sich Pentaho mit zahlreichen Quellsystemen verbinden und konnte für Externe (Kunden) geöffnet werden, ohne Sicherheitsrisiken in Kauf nehmen zu müssen. Kosteneffizienz und der Open Source-Aspekt spielten ebenfalls eine Rolle. Begünstigend kam hinzu, dass Pentaho bereits im Unternehmen in anderen Bereichen eingesetzt wurde und dadurch Synergien genutzt werden konnten (Erfahrung mit dem Aufbau von Reports etc.).

Im Globalen Reporting System pflegt BOSCH ca. 1.500 Kundenprojekte. Angebunden sind verschiedenste Quelldaten (darunter verschiedene Telefonanlagen, Zeiterfassungssysteme, Emailsysteme, SAP-Systeme für die HR-Daten) sowie einige externe Kundendatenbanken. Die Kennzahlen umfassen unter anderem eingegangene Anrufe, beantwortete Anrufe, aufgelegte Anrufe durch den Kunden, Umsatz, Kosten und Gewinn, tagesaktuell und pro Projekt.

BOSCHs Kunden können auf das System und die Reports zugreifen. Neben standardisierten Reports, die für alle Projekte verwendet werden können, gibt es auch Spezialreports. Mit Self-Service-Cubes können die Mitarbeiter eigenständig Analysen durchführen, ohne die IT hinzuziehen zu müssen. Zur Berechnung der verschiedensten Preismodelle nutzt BOSCH eine Anbindung an Excel, sodass der Finanzbereich weiterhin mit Exceldateien arbeiten kann, die über einen nächtlich laufenden PDI-Prozess eingelesen werden und so die Umsätze für alle Projekte berechnen. Wie Rolf Petry betonte, können die Kollegen so eigenständig ihre Preismodelle erstellen und die IT muss, solange sie im Grundmodell bleiben, nicht tätig werden. Mit 10 Grundmodellen lassen sich so hunderte Preismodellvarianten abbilden.

Weitere Informationen zum Vortrag von BOSCH gibt es hier.

Jens Bleuel: Was ist neu in Pentaho 7.0 und Metadata Injections
Neben Matt Casters ist Jens Bleuel ein weiteres „Pentaho-Urgestein“. Seit gefühlten Jahrzehnten entwickelt er die Datenintegrationskomponente von Pentaho weiter. In seinem Vortrag ging er auf die neuen Funktionen in Pentaho 7.0 ein und spezielle Szenarios für Metadata Injections – beides kann in seinem Blog nachgelesen werden.

Wael Elrifai: Industry of Things, Big Data und Machine Learning
Dass Industry of Things, Big Data und Maschinenlernen nicht nur Buzzwords sind, sondern im Gegenteil wichtige Konzepte, die sich gegenseitig ergänzen, zeigte der Vortrag von Wael Elrifai, Director for Enterprise Solutions EMEA bei Pentaho. Dabei ist ausschlaggebend, das wir von der reinen Suche nach Anomalien wegkommen (entspricht unbeaufsichtigtem Lernen) und dahin gelangen, wo sich Scheitern oder Verschlechtern vorhersagen lassen (beaufsichtigtes Lernen). Durch den Einsatz von Pentaho lässt sich dabei sowohl Data Engineering als auch Maschinenlernen und Data Science umsetzen. Wer mehr zu dem Thema wissen möchte, dem sei Waels Blogbeitrag empfohlen.

Stellte die Eurofunk-Software für Einsatzleitstellen vor: Christian Ripaski

Stellte die Eurofunk-Software für Einsatzleitstellen vor: Christian Ripaski

Eurofunk: Pentaho im Einsatz bei Feuerwehr und Polizei
Ebenfalls aus dem Bereich der öffentlichen Sicherheit kam der Vortrag von Eurofunk. Das österreichische Familienunternehmen entwickelte 2015 sein Statistik- und Reporting-Tool neu und entschied sich, als Grundlage Pentaho zu verwenden. Dafür sprachen hauptsächlich zwei Gründe: zum einen konnten in das Tool nicht nur Karten von Google eingebunden werden, sondern auch Kartendaten von Kunden (die oft über weitaus mehr Informationen verfügen als Google Maps). Zum anderen konnten damit die umfangreichen Berechtigungen innerhalb einzelner Leitstellen abgebildet werden (meistens sind mehrere Leitstellen miteinander vernetzt, greifen aber auf das gleiche System zu).

Mit der Software überwachen Leitstellen der Feuerwehr, Polizei oder Rettungsdienste unter anderem ihre gesetzlich festgesetzten Reaktionszeiten auf Notrufe (wird ein Notruf abgesetzt, darf nur eine bestimmte Zeit verstreichen – je nach Land ca. sieben bis zwölf Minuten – bis die Rettungskräfte vor Ort eintreffen). Fragen sind dabei: Wie lange dauert es, bis ein Anruf von einer Leitstelle angenommen wurde? Wie lange hat es von der Annahme des Notrufs bis zum Ausrücken gedauert? Um welche Einsätze hat es sich dabei gehandelt? Bei wie vielen Einsätzen konnte die Hilfsfrist nicht eingehalten werden? Aus den Auswertungen können die Leitstellen gegebenenfalls Maßnahmen zur Optimierung ableiten, z.B. für eine effizientere Planung von Einsatzkräften oder Dienststellenstandorten.

Eurofunk erstellt mit Pentaho Data Integration die Datenwürfel, auf die ihre Kunden für Analysen webgestützt für die Erstellung von Reports und Analysen zugreifen. Meistens handelt es sich um Adhoc-Reports. Da sich im Einsatzleitsystem sensible Daten befinden, ist dieses abgeschottet. Nach dem Abschluss eines Einsatzes werden die Daten in ein sogenanntes Verwaltungssystem übertragen und dort nachbearbeitet und ergänzt. Anschließend werden sie über den Data Integration Server in das Data Warehouse geladen. Auf dieses greifen die Kunden von Eurofunk zu, wobei es sich um mehrere tausend User handelt.

Als Hürden bei der Einführung von Pentaho nannte Christian Repaski die Auswahl der zu analysierenden Werte und Festlegung der Datenwürfel. Die Einbindung externer Kartendaten gestaltet sich momentan noch schwierig, ebenso wie die Abbildung des Berechtigungskonzepts. Für die Zukunft möchte Eurofunk Predictive Analytics-Funktionen anbieten, damit Leitstellen ihre Einsatzkräfte besser planen können.

Weitere Informationen zur Eurofunk-Software finden Sie in diesem Interview.

Christophe Loetz von Compex stellte OS.bee vor, das mit Mondrian arbeitet

Christophe Loetz von Compex stellte OS.bee vor, das mit Mondrian arbeitet

Compex: Web-Applikationen auf Knopfdruck erzeugen
Ein drittes Embedded-Beispiel stammte von Compex. Geschäftsführer Christophe Loetz stellte das die Softwareentwicklungsumgebung OS.bee vor, mit der sich Web-Applikationen schnell und einfach erstellen lassen. Durch den Einsatz von Mondrian enthalten sie ein Analysetool, mit dem sich multidimensionale Abfragen von Business-Daten in Echtzeit erstellen lassen. OS.bee wird derzeit als Open Source-Projekt bei der Eclipse Foundation unter dem Namen OSBP (Open Standard Business Plattform) veröffentlicht.

OS.bee basiert auf dem Eclipse Modeling Framework und verschiedenen domänenspezifischen Sprachen sowie einem etwa 30 Frameworks umfassenden Technologie-Stack. Als OLAP Engine kommt Mondrian zum Einsatz. Dadurch sind OS.bee-Applikationen in der Lage, Datenauswertungen vorzunehmen, und das in Echtzeit.

In einer Demo zeigte Christophe Loetz, wie sich in beeindruckend kurzer Zeit aus einem Excel-Sheet eine Web-Applikation mit einem Mondrian-Reporting automatisiert erzeugen lässt. Um CRUD Applikationen zu erstellen, gibt es eine Abkürzung. Dazu muss ein Datenblatt im CSV-Format abgespeichert und danach in Eclipse gewechselt werden. Über Drag&Drop wird die Datei in OS.bee geladen – schon steht die fertige Web-Applikation inklusive Benutzeroberfläche mit Tabellen, Dialogen, Reporting und einer Schnittstelle für den Datenaustausch.

Mehr Infos zu dem Projekt gibt es in diesem Interview.

Swissport: Vereinfachung von Datenintegrationsprozessen
Von einem weltweit führenden Unternehmen im Logistikbereich stammte der nächste Usecase. Uwe Geercken von Swissport stellte seine selbstentwickelte Business Rules Engine vor, mit der er die ETL-Prozesse bei der Integration von SAP-Daten rationalisiert hat.

Die Business Rules Engine ist als Plugin für Pentaho auf Github erhältlich und trennt IT-Prozesse von Geschäftsregeln, sodass sich Fachanwender und IT-Abteilung unabhängig voneinander um ihre Prozesse kümmern können. Die IT sorgt dabei zwar für die Bereitstellung der Prozesse, die Ausgestaltung der Geschäftsregeln und -logik liegt aber bei den Business-Usern. Das sorgt nicht nur für schlankere Prozesse, sondern auch für eine bessere und genauere Trennung der Verantwortlichkeiten.

Alle Infos zu Uwes Lösung (die übrigens auch von dem US-Unternehmen Vership eingesetzt wird) finden sich in diesem Artikel, technische Details stehen in Uwes empfehlenswerten Datamelt-Blog. Wie groß der Bedarf nach tragfähigen Ansätzen im ETL-Bereich ist, zeigte der Andrang bei dem kleinen Workshop, den Uwe spontan im Anschluss an das PUM abhielt.

Brian Kurbjuhn stellte Unternehmensportale mit integrierten Pentaho-Dashboards vor

Brian Kurbjuhn stellte Unternehmensportale mit integrierten Pentaho-Dashboards vor

ITN Labs I: Report- und Dashboard-Integration in Unternehmensportalen
Im Teil „ITN Labs“ stellen wir Weiterentwicklungen vor, die wir bei der it-novum im Pentaho-Umfeld erstellt haben. Im ersten Lab-Vortrag zeigte Brian Kurbjuhn, wie sich mit Pentaho erstellte Berichte und Dashboards einem größeren Nutzerkreis zur Verfügung stellen lassen, indem sie in Unternehmensportale eingebunden werden. Unternehmensportale bringen Lieferanten, Kunden, Partner und Mitarbeiter zusammen, um gemeinsam an Projekten oder Dokumenten zu arbeiten. Ziel solcher Portale ist es, eine nahtlose Integration zu bieten und den verschiedenen Bezugsgruppen unkompliziert Informationen unter einer einheitlichen Oberfläche zur Verfügung zu stellen.

Portalsysteme wie Liferay bieten zugleich ein solides und erprobtes Gerüst für die Integration von unterschiedlichsten Geschäftsanwendungen. Einzelne Integrationen werden in kleine Applikationen (sog. Portlets) gekapselt und können anschließend einfach verwaltet und feingranular berechtigt werden. Im vorgestellten Beispiel ermöglichen die von it-novum entwickelten Pentaho-Portlets eine einfache und zielgruppengerechte Bereitstellung von in Pentaho erstellten Berichten und Dashboards.

Zu Beginn des Projekts standen folgende Fragen:
– Welche Funktionstiefe brauche ich? (z.B. reine Darstellung)
– Welche Formate möchte ich anzeigen? (z.B. PRPT, CDA, CDF)
– Sind umfangreiche und offene Schnittstellen vorhanden? (z.B. Pentaho REST API)
– Ist eine gemeinsame Authentifizierung möglich? (z.B. Single-Sign-On via CAS für Pentaho und Liferay)

Brian schilderte, wie sein Team gemeinsam mit meiner Abteilung BI & Big Data eine Anbindung von Pentaho an Liferay realisiert hat. Das Resultat (siehe Dashboard unten) fügt sich nun nahtlos in das Liferay-Portalsystem ein und lässt sich einfach verwalten (inklusive Berechtigungen, die rollenbasiert vergeben und feingranular gesteuert werden können).

Mit Pentaho erstellte Reports und Dasboards lassen sich mit überschaubarem Aufwand im Liferay-Portalsystem darstellen und so auch Usern außerhalb des Unternehmens zur Verfügung stellen

Mit Pentaho erstellte Reports und Dasboards lassen sich mit überschaubarem Aufwand im Liferay-Portalsystem darstellen und so auch Usern außerhalb des Unternehmens zur Verfügung stellen

Der Aufwand für die Umsetzung war überschaubar, was vor allem auf die offenen und einfach anzubindenden Schnittstellen von Liferay und Pentaho zurückzuführen war. Allerdings haben wir gemerkt, dass eine vollumfängliche Nutzbarkeit doch mehr Funktionstiefe erfordert als die reine Darstellung der Inhalte. Eine sinnvolle Weiterentwicklung stellt daher das Hinzufügen weiterer Funktionen, z.B. Tabbed Views und das Scheduling dar. Ebenso sind weitere Authentifizierungsmöglichkeiten sinnvoll, sodass beide Lösungen bestmöglich in die bestehende IT-Infrastruktur des Kunden integriert werden können.

ITN Labs II: Smart City dank Realtime-Datenverarbeitung
Ein zweites Projekt aus den ITN Labs kam aus dem Bereich Smart City. Dazu hatte mein Kollege Nicolai Ernst ein Pentaho-basiertes Dashboard gebaut und mit Verkehrsdaten der Stadt Frankfurt via Pentaho Data Integration befüllt. Die Stadt Frankfurt pflegt einen im Netz frei verfügbaren Open Data-Bestand mit Informationen zum Verkehr und Verkehrsfluss im Großraum Frankfurt, die Realtime (im Minutentakt) aktualisiert werden.

Für das Dashboard hatte Nicolai zwei Karten erstellt, eine für die Parkhäuser und eine für die Verkehrsmeldungen. Sie sind mit je einem Marker auf der Karte visualisiert. Per Mausklick können Benutzer Informationen wie die Anzahl der freien Parkplätze, der Kurzzeit- oder Langzeitparkplätze oder der Behindertenparkplätze abgerufen werden. Die Verkehrsmeldungskarte liefert Daten zu Straßensperrungen, Sperrungsgrund und -dauer sowie blockierten Fahrspuren oder Kommentaren von Verkehrsteilnehmern. Zudem sind Webcams integriert, sodass sich der Nutzer auch über Kamera ein Bild vom momentanen Verkehrsfluss machen kann.

So sieht Smart City aus: ein mit Echtzeitdaten gefülltes Dashboard zeigt den aktuellen Verkehrsfluss im Großraum Frankfurt an.

So sieht Smart City aus: ein mit Echtzeitdaten gefülltes Dashboard zeigt den aktuellen Verkehrsfluss im Großraum Frankfurt an.

Derartige in Echtzeit gepflegte Datenbestände besitzen ein großes wirtschaftliches Potenziel. Beispielsweise können mit ihnen Parkhausbetreiber Apps erstellen, über die Autofahrer gegen eine Gebühr einen Parkplatz reservieren können, um Wartezeiten zu vermeiden. Zusammen mit den Kartenvisualisierungen kann das zu einem besseren Verkehrsfluss beitragen, weil Bürger rechtzeitig informiert werden und sich so für ein alternatives Verkehrsmittel eintscheiden können.

ITN Labs III: Der International Business Communication Standard mit Pentaho
Der dritte Lab-Beitrag kam von Stefan Schött und stellte den International Business Communication Standard (IBCS) vor. IBCS basiert auf dem ursprünglichen SUCCESS-Regelwerk von Prof. Dr. Rolf Hichert und wurde in Version 1.0 im Juni 2015 unter der Creative-Commons-Lizenz veröffentlicht. Der IBCS legt unter anderem fest, wie ein Notationsstandard aussehen sollte. Die Visualisierungs-API von Pentaho verwendet neben einer großen Bandbreite an Webtechnologien auch das Grafik-Tool Protovis als Grundlage für Diagramme. Neben den vielfältigen Standardkonfigurationen lassen sich hier noch weitere Konfigurationsmöglichkeiten ergänzen. Komplexere Fälle können mit dem Grafik-Tool und Protovis-Nachfolger D3 (Data-Driven-Documents) umgesetzt werden, wofür die CTools eine eigene Komponente bereitstellen. Pentaho ist deshalb in Kombination mit den CTools in der Lage, die vielfältigen und detaillierten Anforderungen des IBCS-Notationsstandards umzusetzen. Der untenstehende Screenshot zeigt ein Beispiel-Dashboard, das mit IBCS und CTools umgesetzt wurde.

Beispiel für ein mit CTools und nach IBCS-Standard erstelltes Dashboard

Beispiel für ein mit CTools und nach IBCS-Standard erstelltes Dashboard

Vor allem dank der spannenden Usecases war das vierte Pentaho User Meeting ein voller Erfolg. Ich bedanke mich bei allen Teilnehmern für´s Kommen und den Referenten für ihre engagierten Beiträge und große Zeitdisziplin. Wir sehen uns auf dem #PUM18!

 

Tags: , , ,

Stefan Müller - Director Business Intelligence & Big Data
Nach mehreren Jahren Tätigkeit im Bereich Governance & Controlling und Sourcing Management ist Stefan Müller bei it-novum gelandet, wo er den Bereich Business Intelligence aufgebaut hat. Stefans Herz schlägt für die Möglichkeiten, die die BI-Suiten von Pentaho und Jedox bieten. Er beschäftigt sich aber auch mit anderen Open Source BI-Lösungen. Seine Begeisterung für Business Open Source für Datenanalyse und -aufbereitung gibt Stefan regelmäßig in Fachartikeln, Statements und Vorträgen und als Experte der Computerwoche weiter.
Webprofile von Stefan: Twitter, XING, Google+

4 Gedanken zu „Usecases für Data Warehousing und Analytics: das Pentaho User Meeting

  1. Pingback: Internationales Pentaho-Anwendertreffen 2017 in Deutschland!

  2. Pingback: "The amazing vibe of the community has never changed" - Business Open Source Blog

  3. Pingback: "Being part of the open source ecosystem is of great value for me"

  4. Pingback: AutoML and Pentaho help to leverage Machine Learning

Kommentar schreiben

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.