In fünf Schritten zum sicheren Hadoop-Cluster

1
01.03.2017ǀ ǀ Big Data
Hadoop-Cluster sicher machen ist nicht schwer. Wir zeigen Ihnen, wie es geht.

Hadoop-Cluster sicher machen ist nicht schwer. Wir zeigen Ihnen, wie es geht.

Momentan gibt es wieder vermehrt Hacker-Angriffe auf Hadoop-Cluster. Opfer sind Anwender von Hadoop-Distributed-File-System-Installationen (HDFS). Bei den Attacken wird die Hadoop-Datenbank „geleert“. Wer seine Daten wieder haben möchte, muss Lösegeld zahlen. Schätzungsweise sind 8.000 bis 10.000 HDFS-Installationen weltweit betroffen. Dabei ist es recht einfach, seine Hadoop-Installation gegen Angriffe zu sichern. Wie das geht, zeige ich hier.  zum Artikel

Big Data-Trends 2017: Hadoop als Defacto-Standard und Datenanalysen aus der Cloud

2
Welche Big Data Trends werden 2017 aktuell?

Welche Big Data Trends werden 2017 aktuell?

2017 werden zunehmend mehr Unternehmen die mit Big Data-Lösungen gewonnenen und analysierten Daten als Basis für reguläre Geschäftsprozesse und -entscheidungen nutzen. Fünf Trends werden den Bereich Big Data im nächsten Jahr vornehmlich prägen.

Die Bedeutung von Big Data-Lösungen im unternehmerischen Alltag nimmt kontinuierlich zu. 2017 werden sich die Unternehmen vor allem mit diesen Themen auseinandersetzen müssen:  zum Artikel

Hadoop Yarn – Big Data beschleunigen

0
Hadoop Yarn sorgt für eine effiziente Clusterauslastung

Hadoop Yarn sorgt für eine effiziente Clusterauslastung

Der MapReduce-Algorithmus, der in Hadoop zur Datenanalyse eingesetzt wird, ist für die vielfältigen Anwendungsgebiete nicht immer optimal, da er ursprünglich für die Batch-Verarbeitung entwickelt wurde. Um eine größere Skalierbarkeit, Teilbarkeit und Zuverlässigkeit eines Hadoop-Clusters zu erreichen, haben die Entwickler mit Hadoop Yarn deshalb eine hierarchische Modifizierung am Cluster-Framework vorgenommen.  zum Artikel

Apache Hive – das Data Warehouse für Hadoop

1
Die wichtigsten zehn Big Data-Technologien

Apache Hive hilft, den Durchblick im Datenwald zu behalten

Für Unternehmen ist die Verlagerung ihrer Daten nach Hadoop eine Herausforderung, weil die vorhandenen Daten üblicherweise in relationalen Datenbanken mit der Structured Query Language (SQL) gespeichert sind. In Teil 3 unserer Big Data-Serie geht es daher um Apache Hive, das auf dem MapReduce-Algorithmus beruht und den SQL-Dialekt Hive Query Language gleich mit liefert.  zum Artikel

Apache Hadoop – ein bewährtes Open Source-Framework

2
Die wichtigsten zehn Big Data-Technologien

Apache Hive hilft, den Durchblick im Datenwald zu behalten

Viele Unternehmen stehen vor dem Problem, dass ihnen einfach die Zeit fehlt, um ihre Daten zu analysieren. Ein System wie Hadoop organisiert die Verarbeitung und den Datenfluss dergestalt, dass die Verarbeitungszeit bei zunehmendem Datenvolumen sinkt. Im Big Data-Bereich spielt Hadoop mittlerweile bei vielen Lösungen eine zentrale Rolle.

 zum Artikel

10 Big Data-Technologien, die Sie kennen sollten

3
Die wichtigsten zehn Big Data-Technologien

10 Technologien, die man kennen sollte, um sich nicht im Daten-Dschungel zu verirren

Daten gehören heute zu den wichtigsten Ressourcen in jedem Unternehmen. Aus ihnen lassen sich Erkenntnisse gewinnen, mit denen neue Geschäftsmodelle entwickelt, Produkte individualisiert und Strategien verbessert werden können. Am Anfang stehen die meisten Unternehmen jedoch vor der Herausforderung, ihre Use Cases zu identifizieren: denn je nach Anwendungsszenario kommen meist individuell zugeschnittene Technologiekonzepte aus dem Big Data-Umfeld zum Einsatz.

 zum Artikel

Strata + Hadoop World: Make Data Work

0
Roger Magoulas (O'Reilly Media), Doug Cutting (Cloudera), Alistair Croll (Solve For Interesting) bei der Eröffnung der Strata+Hadoop World

Die Strata+Hadoop World ist die größte Konferenz zu Hadoop

Unter dem Motto „Make Data Work“ fand vom 5. bis 7. Mai die Strata+Hadoop World in London statt. Mit 1.500 Teilnehmern war die Konferenz bis auf den letzten Platz ausverkauft. Neben vielen Vorträgen und Workshops, welche die neuesten Trends im Big Data- und Data Science-Bereich behandelten, kam dabei auch ein Selfie zum Einsatz.  zum Artikel