Es funkt: Pentaho integriert Spark

0
03.06.2015ǀ ǀ Big Data
Spark wird zukünftig von Pentaho unterstützt

Spark wird zukünftig von Pentaho unterstützt

Da hat es wohl gefunkt: Pentaho hat angekündigt, das Big Data-Tool Apache Spark unterstützen zu wollen. Damit können zukünftig Spark-Jobs direkt aus Pentaho gesteuert werden. Was die Liaison für Pentaho-Anwender und den Big Data-Markt bringt, beleuchte ich in diesem Artikel.

Spark ist ein Open Source-Framework für Cluster Computing. Im Vergleich zu Hadoop MapReduce kann Spark Jobs im In-Memory-Modus 100 Mal schneller und auf Festplatte zehnmal schneller verarbeiten. Unterstützt Pentaho zukünftig Spark, heißt das für Pentaho-Anwender, dass sie

  • von einer höheren Produktivität profitieren können,
  • geringere Kosten beim Betrieb ihrer BI- und Big Data-Anwendungen haben werden und
  • es niedrigere Hürden beim Einstieg in Big Data-Projekte geben wird aufgrund der geringeren fachlichen Anforderungen an Mitarbeiter.

Bei Pentaho ist man gerade dabei, mit sogenannten Big Data Blueprints zu experimentieren, um Use Cases für den Einsatz von Spark zu entwickeln. Das soll Unternehmen dabei helfen, die richtigen Einsatzbereiche für Spark und Pentaho zu identifizieren und leichter Big Data-Projekte umzusetzen. Dazu gehören unter anderem direkt auf Spark SQL ausgeführte Abfragen und parallel durchgeführte Spark-Abfragen (Spark Parallel Execution).

Auf den Big Data-Markt bezogen unterstreicht die Integration laut Matt Aslett, Research Director für Data Platforms and Analytics beim Analysten 451 Research, dass der Open Source-Ansatz es Pentaho ermöglicht, in einem schnell wachsenden Marktsegment rasch zu reagieren, wenn innovative Technologien an Bedeutung gewinnen. Spark gehört zu den aktivsten entwickelten Projekten im Big Data-Bereich und besitzt daher strategische Bedeutung für einen Open Source-Anbieter wie Pentaho.

Pentaho Data Integration für Apache Spark ist momentan über die Pentaho Labs erhältlich.

Tags: , , ,

Stefan Müller – Director Business Intelligence & Big Data
Nach mehreren Jahren Tätigkeit im Bereich Governance & Controlling und Sourcing Management ist Stefan Müller bei it-novum gelandet, wo er den Bereich Business Intelligence aufgebaut und in Richtung Big Data weiterentwickelt hat. Stefans Herz schlägt für die Möglichkeiten, die die BI-Suiten von Pentaho und Jedox bieten, er beschäftigt sich aber auch mit anderen Open Source BI-Lösungen. Seine Begeisterung für Business Open Source im Bereich Datenintelligenz gibt Stefan regelmäßig in Fachartikeln, Statements und Vorträgen weiter.

Webprofile von Stefan: Twitter, LinkedIn, XING

Kommentar schreiben

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.