Video: Turboschnelle Big Data-Auswertungen mit GPU Power

1
25.10.2016ǀ ǀ Big Data
Turboschnell Big-Data-Analyse

Turboschnell Big-Data-Analyse

Wie Controller mit hohem Bedarf an Rechenpower große Datenmengen extrem schnell analysieren können, zeigen wir in unserem Screencast „Big Data für Controller“. Die Kombination von Hadoop mit der BI-Suite von Jedox lässt eine um hundertmal schnellere Cube-Befüllung und Auswertungen zu.

Unser Cube-on-Demand-Ansatz erlaubt es Anwendern, in Jedox-Berichten durch simples “Zusammenklicken” der gewünschten Abfrageelemente einen neuen Analyse-Cube aufzubauen und darauf extrem schnell Auswertungen auszuführen. Dabei kommt eine GPU-Karte vom Typ NVIDIA Tesla K40m (2880 Cores) zum Einsatz, die die Berechnung von komplexen Cubes bis zu 100-mal schneller durchführt. Das Video finden Sie hier.

Datenintegration (Jedox Hadoop Package)
Ermöglicht wird das Zusammenspiel von Jedox und Hadoop durch das Jedox Hadoop Package. Dadurch steht die Datenextraktion aus Hive oder HDFS zur Verfügung. Um Hive on Spark anstelle von MapReduce zu nutzen, kann eine GenericDB-Verbindung verwendet werden. Der Einsatz von Spark empfiehlt sich, da die Datenverarbeitung in Spark dank der In-Memory Technologie deutlich schneller als bei MapReduce ist. Die untenstehende Abbildung zeigt die Architektur der Anwendung.

Cube-on-Demand-Ansatz zur einfachen Erstellung von Datenwürfeln
Der Cube-on-Demand-Ansatz von it-novum erlaubt es Anwendern, aus einem Bericht heraus ETL-Jobs zu starten. Dabei kann der Anwender seine gewünschten Dimensionselemente über Auswahlboxen markieren. Die Auswahl wird dann über ein Makro automatisch in eine Hive-Query umgewandelt und an den Jedox Integration Manager übergeben. Der Nutzer benötigt also keinerlei IT-Knowhow oder tieferes Verständnis von ETL-Prozessen.

Jedox und Hadoop Architecture

Jedox und Hadoop Architecture

Beschleunigung von Analysen durch Jedox OLAP Accelerator
Bei der Auswertung großer Datenmengen werden leistungsfähige Ressourcen benötigt, um Berechnungen schnell durchführen zu können. Mit dem Jedox OLAP Accelerator lassen sich Analysen um ein Vielfaches beschleunigen: Teilausschnitte eines Würfels werden in eine GPU geladen, die rechenintensive Operationen – wie z.B. Aggregationen, Business Rules, Datenfilter oder Cube-Writebacks – parallel verarbeitet.

Jedox und Hadoop Dashboard

Jedox und Hadoop Dashboard

Die Vorteile für den Anwender sind:

  • Speicherung und Verwaltung von großen Datenbeständen in Hadoop
  • Einfacher Zugriff auf Daten mit SQL-ähnlicher Syntax (Hive)
  • Erstellung von Datenwürfeln aus Berichten heraus (Cube on Demand)
  • Kein IT-Knowhow notwendig
  • Schnellere Analyse von großen Datenbeständen dank GPU-Beschleunigung

Weitere Informationen gibt es in unserem Research Paper „Big Data: Hive on Spark mit Jedox nutzen“

Diese Artikel könnten Sie auch interessieren:

Tags: , , ,

Stefan Müller - Director Business Intelligence & Big Data
Nach mehreren Jahren Tätigkeit im Bereich Governance & Controlling und Sourcing Management ist Stefan Müller bei it-novum gelandet, wo er den Bereich Business Intelligence aufgebaut hat. Stefans Herz schlägt für die Möglichkeiten, die die BI-Suiten von Pentaho und Jedox bieten. Er beschäftigt sich aber auch mit anderen Open Source BI-Lösungen. Seine Begeisterung für Business Open Source für Datenanalyse und -aufbereitung gibt Stefan regelmäßig in Fachartikeln, Statements und Vorträgen und als Experte der Computerwoche weiter.
Webprofile von Stefan: Twitter, XING, Google+

Ein Gedanke zu „Video: Turboschnelle Big Data-Auswertungen mit GPU Power

  1. Pingback: Personaldienstleister setzt auf Self-Service Reporting

Kommentar schreiben

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.