Die vier Big Data-Musketiere: Cloudera, Infobright, MongoDB und Pentaho auf den Big Data Analytics Days

0

Die Big Data Analytics Days finden in Berlin und Hamburg stattZu den spannendsten und aktivsten Big Data-Projekten gehören momentan Cloudera, Infobright, MongoDB und Pentaho. Da wir seit Beginn des Jahres Partner aller vier Anbieter sind, lag die Idee einer gemeinsamen Veranstaltung nahe. Die Big Data Analytics Days waren schnell aus der Taufe gehoben, das erste Event mit den „vier Big Data-Musketieren“ fand gestern in Berlin statt.

Davy Nys von Pentaho über die Bedeutung von kombinierten Daten

Davy Nys von Pentaho über die Bedeutung von kombinierten Daten

“Even big data needs to play well with others” – diesen Satz machte Davy Nys zum Zentrum seines Vortrags über Big Data Analytics mit Pentaho. Davy Nys ist Vice President EMEA & APAC bei Pentaho, dem Unternehmen, das schon vor Jahren massiv auf Big Data setzte. Aus dem Open Source-Bereich kommend hat Pentaho schon immer die Bedeutung offener Schnittstellen betont. Auch Davy Nys kam in seinem Beitrag immer wieder auf den „Mash-up“-Ansatz zurück: Die wertvollsten Erkenntnisse erhält man dann, wenn man Daten verschiedener Arten und aus verschiedenen Quellen miteinander kombiniert. Nicht Kosteneinsparungen stellten den größten Mehrwert von Big Data dar, sondern die Resultate des Daten-Mash-up. Erforderlich sei also, beide Welten zusammenzubringen, die Datenseite und die Auswertungsseite. Als Beispiele nannte Davy Nys Predictive Analytics, z.B. um durch die Auswertung verschiedener Kundendaten Aussagen über das zukünftige Kaufverhalten zu erhalten. Die Customer Experience, also die Erfahrung des Kunden beim Kontakt mit dem Unternehmen, ließe sich durch das Angebot von personalisierten und angepassten Produkten und Leistungen verbessern.

Mark Lewis von Cloudera stellte Cloudera Hadoop vor

Mark Lewis von Cloudera stellte Cloudera Hadoop vor

Von Hadoop-Anbieter Cloudera war Mark Lewis angereist, der seinen Vortrag mit der lapidaren Frage begann, wer heute sein Smartphone dabei habe. Neue Technologien müssten verwendet werden, um sie wirklich nutzen zu können, das sei beim Smartphone genauso wie bei Big Data. Die Reise zur Ausschöpfung des gesamten Potenzials von Unternehmensdaten führt laut Lewis von der IT zum Business, von der Erlangung reiner operationaler Effizienz bis zu echten informativen Vorteilen. Mark Lewis, der bei Cloudera das Marketing verantwortet, betonte die Bedeutung des Enterprise Data Hubs, eines Datenverwaltungskonzeptes, mit dem sich alle Daten an einem Ort aufbewahren ließen. Hier werden die Informationen so lange in ihrer ursprünglichen Form vorgehalten, wie es nötig ist. Ein Enterprise Data Hub integriert sich in die bestehende Infrastruktur und ermöglicht verschiedene Arten der Datenverarbeitung, z.B. Stapelverarbeitung über interaktives SQL oder fortgeschrittene Auswertungen.

Global: die Community von MongoDB

Global: die Community von MongoDB

Gert Paczynski, Senior Account Director für Norddeutschland und die Niederlande bei MongoDB, bekannte gleich zu Beginn seines Vortrags, dass er den Begriff NoSQL als Abkürzung für „kein SQL“ verstanden habe. Der Irrtum habe sich mittlerweile aber aufgeklärt. Dann stellte er mehrere spannende Praxisbeispiele für Big Data vor: Bosch setzt MongoDB im Bereich Field Data Capturing ein. Dabei geht es um die strukturierte Erfassung von Felddaten, die bei Bosch z.B. von Autobremsen oder Kraftsteuerelementen kommen (Temperatur, Stromstärke etc.). Auch Fahrsimulatoren sammeln riesige Mengen an Informationen an: innerhalb weniger Minuten kommen hier mehrere Millionen Daten zusammen. Bosch wertet die Informationen aus, um eine Datengrundlage für Produktverbesserungen und sogenannte Predictive Maintenance zu erhalten (weniger vornehm ausgedrückt handelt es sich dabei darum, vorher zu wissen, was kaputt geht :)). Als dritten Anwendungsfall brachte Gert Paczynski das Beispiel eines Agrarmaschinenherstellers, der durch die Einführung von MongoDB in der Lage ist, eine Verfügbarkeit von 100% bei seinen Landmaschinen zu garantieren. Eine so weitreichende Garantie sei laut Paczynski nur möglich, wenn kontinuierlich riesige Datenmengen gesammelt und ausgewertet werden.

Speziell für die Verarbeitung von Maschinendaten entwickelt: Infobright

Speziell für die Verarbeitung von Maschinendaten entwickelt: Infobright

Unser Partner Infobright war leider verhindert, weshalb ich die Vorstellung des Datenbankenprojekts übernahm (das Interview mit Infobright-Chef Don DeLoach lesen Sie hier). Während die meisten Datenbanken darauf ausgerichtet sind, möglichst viele Anwendungsfälle abzudecken, ist Infobright für die Verarbeitung und Auswertung maschinengenerierter Daten entwickelt worden. Infobright beweist, dass man auch als relationale Datenbank im Big Data-Umfeld bestehen kann. Die analytische Datenbank setzt auf MySQL auf und leistet performante Abfragen auch gegen große Datenbestände. Auf diese Weise können BI-Tools wie z.B. auch Pentaho genutzt werden, um Fachanwendern Adhoc-Abfragen und OLAP-Features für Maschinendaten & Co zu bieten. Durch eine geschickte Komprimierung der Daten sowie das Open Source-Lizenzmodell lassen sich Kosten sparen. Mit dem Hadoop-Connector lassen sich Daten sehr schnell in die Infobright-Datenbank laden, um sie dort für Analysen und Reportings nutzen zu können. Die Kombination aus Hadoop und Infobright halte ich für sehr interessant, weil sie die Stärken der „alten“ und der „neuen“ Welt sinnvoll nutzt.

Die Big Data Analytics Days finden erneut am 2. Juli in Hamburg statt. Die Teilnahme ist kostenfrei, zur Anmeldungen und den Veranstaltungsdetails gelangen Sie hier.

Tags: , , , , , , , ,

Stefan Müller - Director Business Intelligence & Big Data
Nach mehreren Jahren Tätigkeit im Bereich Governance & Controlling und Sourcing Management ist Stefan Müller bei it-novum gelandet, wo er den Bereich Business Intelligence aufgebaut hat. Stefans Herz schlägt für die Möglichkeiten, die die BI-Suiten von Pentaho und Jedox bieten. Er beschäftigt sich aber auch mit anderen Open Source BI-Lösungen. Seine Begeisterung für Business Open Source für Datenanalyse und -aufbereitung gibt Stefan regelmäßig in Fachartikeln, Statements und Vorträgen und als Experte der Computerwoche weiter.
Webprofile von Stefan: Twitter, XING, Google+

Kommentar schreiben

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.