Analytische Datenbanken

0
Fachbegriffe aus der Geschäftswelt erklären wir in der Wikireihe

Sinn und Zweck von analytischen Datenbanken erklärt dieser Wiki-Artikel

Mit Maximilian Post – Der Begriff Big Data ist in aller Munde. Damit sollen die riesigen Datenmengen, die heute in vielen Unternehmen anfallen, unkompliziert und schnell auswertbar werden. Ein Begriff, der immer wieder in diesem Zusammenhang fällt, ist der der analytischen Datenbank. Das ist kein Zufall, denn diese Unterart von Datenbanken spielen für Big Data eine wichtige Rolle. Da aber den meisten Leuten nicht klar ist, worum es sich dabei genau handelt, wollen wir in diesem Wiki-Artikel erklären, was analytische Datenbanken sind und welche Bedeutung sie für Big Data haben.

Unter dem Begriff „Analytische Datenbanken“ versteht man Datenbankmanagementsysteme, deren Architektur, Arbeitsweise und Funktionen auf analytische Anwendungen ausgerichtet sind. Analytische Datenbanken sind abfrageorientiert, das heißt, sie sind auf das sehr schnelle Lesen und Verarbeiten von Daten ausgerichtet. Aus diesem Grund sind sie im Zusammenhang mit Big Data wichtig.

Eigentlich gibt es Datenbanken, die riesige Datenmengen verarbeiten, schon seit langem. Doch erst durch das starke Datenwachstum der letzten Jahre und der Notwendigkeit, große Mengen an Daten auswerten zu können sind sie unter dem Begriff Analytische Datenbanken in den Fokus gerückt. Der Unterschied zu traditionellen Transaktions- und OLTP-Datenbanken ist, dass sie nicht wie diese den Schwerpunkt auf die Transaktionsverarbeitung gemäß des ACID-Prinzips legen. Auf dem Markt gibt es mehrere Vertreter analytischer Datenbanken, darunter HP Vertica, Infobright und InfiniDB.

Ziel analytischer Datenbanken ist es, überdurchschnittlich große Mengen strukturierter Daten in sehr kurzer Zeit und nach bestimmten Abfragemustern zu analysieren. Dazu werden verschiedene Techniken eingesetzt und miteinander kombiniert: Spaltenorientierung, massive parallele Verarbeitung (MPP), Datenkompression und In-Memory Speicherung.

Die größte Stärke dieser Datenbanken liegt in der hohen Abfrageperformance und einfachen Skalierbarkeit. Dadurch ist es möglich, große Datenmengen zu nutzen und schnell auszuwerten. Das eröffnet eine Vielzahl neuer Möglichkeiten, die Unternehmen dabei helfen können, kostensenkend und gewinnsteigernd zu arbeiten:

  • Es lassen sich Daten verwenden, deren Nutzung über traditionelle Datenbankmanagementsysteme zu teuer oder zu zeitintensiv wäre.
  • Analytische Datenbanken erhöhen auf Grund ihrer Beschaffenheit die Transparenz im Unternehmen. Gründe sind die größere Datenvielfalt, die neue Muster und Zusammenhänge erkennen lässt.
  • Stichwort Erfolgskontrolle: Getroffene Maßnahmen lassen sich anhand neuer Faktoren noch genauer analysieren und spezifizieren. Ein Beispiel dafür ist der QR-Code auf Plakaten oder Flyern: Durch die Auswertung von Geo-Daten, die beim Scannen des QR-Codes erhoben werden, sieht man die genaue Kundennutzung jeder Werbetafel.
  • Dank der schnellen Abfrageperformance ist Echtzeitanalytik möglich. Dadurch lässt sich Analytik nicht nur bei der strategischen Planung einsetzen, sondern auch bei kurzfristigen operativen Entscheidungen. Echtzeitanalytik bzw. Beinahe-Echtzeitanalytik wird heute schon genutzt, um in sozialen Netzwerken auf Basis von Kundenpräferenzen Freundschaftsanfragen zu generieren oder personalisierte Werbung anzuzeigen.
  • Analytische Datenbanken helfen auch bei der fortschreitenden Automatisierung und Überwachung von Arbeitsprozessen. Mittels Echtzeitanalytik und der Auswertung historischer Daten ist es möglich, Missstände zu erkennen, noch bevor sie auftreten, und sie durch präventive Maßnahmen zu umgehen. Ein Beispiel: Durch die Kombination von Sensorinformationen lassen sich heute große Produktionsstraßen besser automatisch überwachen.
  • Schließlich sind analytische Datenbanken hoch automatisiert, was den manuellen Tuning- und Wartungsaufwand gegenüber einer traditionellen Datenbank auf ein Minimum beschränkt. Das kann zu einer Entlastung der verantwortlichen Abteilung führen.

Analytische Datenbanken ermöglichen komplexe analytische Abfragen auf große Datenmengen bei geringer Resonanzzeit. Sie können also alles – fast. Traditionelle Systeme können sie (auf Grund des CAP-Theorems nach Brewer) nicht ersetzen. Sie eignen sich aber sehr gut dazu, bestehende Datenbanken- oder Business Intelligence-Systeme zu ergänzen.

Die Bedeutung analytischer Datenbanken wird auf Grund immer größerer Datenmengen und der steigenden Nachfrage nach Analysemöglichkeiten weiter steigen. Eine wichtige Rolle spielt dabei die Echtzeitanalytik, die eine Grundvoraussetzung für ehrgeizige Projekte wie künstliche Intelligenz oder maschinelles Lernen darstellt.
Der Artikel ist im Rahmen einer Abschlussarbeit von Maximilian Post für das Fach der Wirtschaftsinformatik bei der it-novum entstanden.

Tags: ,

Stefan Müller - Director Business Intelligence & Big Data
Nach mehreren Jahren Tätigkeit im Bereich Governance & Controlling und Sourcing Management ist Stefan Müller bei it-novum gelandet, wo er den Bereich Business Intelligence aufgebaut hat. Stefans Herz schlägt für die Möglichkeiten, die die BI-Suiten von Pentaho und Jedox bieten. Er beschäftigt sich aber auch mit anderen Open Source BI-Lösungen. Seine Begeisterung für Business Open Source für Datenanalyse und -aufbereitung gibt Stefan regelmäßig in Fachartikeln, Statements und Vorträgen und als Experte der Computerwoche weiter.
Webprofile von Stefan: Twitter, XING, Google+

Kommentar schreiben

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.