Skip to main content

Pentaho Data Integration Fundamentals

  • 26. Juni 2017 - 28. Juni 2017
  • 09:00 - 17:00
  • Fulda

Pentaho-Kurs-ID

DI1000

Dauer

3 Tage

Kursbeschreibung

Mit kontinuierlich wachsenden Datenmengen brauchen Unternehmen schnelle und einfache Möglichkeiten, um ihre Daten nutzen und Einblicke gewinnen zu können. Die größte Herausforderung ist es, eine konsistente, einheitliche Version von Informationen über alle Quellen in einem analysetauglichen Format zur Verfügung zu haben. Mit Pentaho Data Integration lassen sich leistungsstarke (ETL-) Ressourcen extrahieren, transformieren und laden sowie eine intuitive und professionelle, grafische Entwicklungsumgebung und eine offene und auf Standards basierende Architektur erstellen.

Pentaho Data Integration bietet eine umfassende ETL-Lösung:

  • Leistungsfähiger grafischer Prozessdesigner für ETL-Entwickler
  • Fast unbegrenzte Schnittstellen für die Integration jeder Art von Daten, einschließlich vielfältiger und großer Datenmengen
  • Hohe Skalierbarkeit und Leistung, einschließlich In-Memory-Caching
  • Big Data-Integration, Analyse und Berichterstattung (via Hadoop, NoSQL, traditionellen OLTP oder analytischer Datenbanken)
  • Moderne, offene und auf Standards basierende Architektur


Der Kurs umfasst sowohl Präsentationen als auch praktische Übungen, die Theorie, Best Practices und Design-Patterns umfassen.

Jetzt anmelden


Lernziele

Nach Abschluss dieses Kurses sind Sie in der Lage:

  • Pentaho Data Integration zu installieren
  • Grundlegende Transformationen mit Steps und Hops zu erstellen und auszuführen
  • Abbildungsergebnisse auf Metrics- und Log-Ansicht darzustellen
  • Datenbankverbindungen zu erstellen und Mithilfe des Database Explorers die Datenquelle zu nutzen
  • Durch die Konfiguration nachfolgender Schritte können komplexe Transformationen erzeugt werden: Table input, Table output, CSV file input, Insert/Update, Kontstanten hinzufügen, Filter, Value Mapper, Stream lookup, Zellen hinzufügen, Zellen verbinden, Zellen sortieren, Row normalizer, JavaScript, Dimension lookup/update, Database lookup, Daten aus XML herausnehmen, Umgebungsvariablen und analytischer Abfragen setzen
  • Transformationen zu erstellen, die parametriesierte Werte verwenden
  • die Struktur einer Online-Transaktion-Prozess-Datenbank auf die Struktur einer Online-Analyse-Prozess-Datenbank zu mappen
  • Daten zu laden und diese in verschiedene Datenbanken zu schreiben
  • ETL-Mustervorlagen zu benutzen, um ein Data Warehouse zu füllen
  • Abbildungen zu erstellen, die langsam verändernde Dimensionen bearbeiten
  • Pentaho Data Integration Jobs zu erstellen die: mehrere Abbildungen aufzeigen, Variablen benutzen, Sub-Jobs enthalten, integrierte Fehlermeldungen bieten, mehrere Textdateien laden und bearbeiten, Dateien ins Microsoft Excel-Format konvertieren
  • Protokollierungen für Transformationsschritte und für Jobeinträge zu konfigurieren und protokollierte Daten zu überprüfen
  • Die Fehlerbehebung der Transformationsschritte zu konfigurieren
  • Das Pentaho Enterprise Repository zu konfigurieren, einschließlich der grundlegenden Sicherheit
  • Das Repository zu verwenden um: Ordner zu erstellen, Transformationen und Jobs zu speichern, sperren, löschen überarbeiten sowie Artefakte wiederherzustellen
  • Ausführungen einer Transformation in Pentaho Data Integration und diese in der Pentaho Enterprise Console zu planen und zu überwachen
  • Index mit einer Transformation zu erstellen und zu löschen
  • Transformationen zu erstellen, die Schritte konfigurieren, um in einem Cluster ausgeführt zu werden, Transformation im Cluster ausführen, die Ergebnisse prüfen und die Transformation zu überwachen

Zielgruppe

Dieser Kurs ist der 3. Kurs im Bereich der Daten Analyse. Er richtet sich an Teilnehmer, die sich bereits mit der Entwicklung oder Administration von Datenbanken beschäftigt haben oder die sich neu mit Pentaho Data Integration beschäftigen möchten.

Voraussetzungen

  • Windows XP, Vista, 7 Desktop-Betriebssystem
  • RAM: mindestens 4 GB
  • Festplattenspeicher: mindestens 2 GB freier Festplattenspeicher (für Software und natürlich Dateien)
  • Prozessor: Dual-Core-AMD64 oder Intel EM64T
  • DVD-Laufwerk

Kursablauf
 
Tag 1

Modul 1: Einführung in Pentaho Data Integration
Lesson 1: Ziele
Lesson 2: Was ist Pentaho Data Integration (PDI)?

Modul 2: Grundlagen Transformation
Lesson 1: Kennenlernen des PDI User Interfaces
Lesson 2: Erstellung von Transformation
Exercise 1: Generierung von Rows, Sequences und Select Values
Lesson 3: Error Handling & Einführung ins Logging
Lesson 4: Einführung in Repositories

Modul 3: Datein lesen und schreiben
Lesson 1: Input und Output Steps
Lesson 2: Parameters & Kettle.properties
Exercise 1: CSV Input zu Multiple Outputs mit Hilfe von Switch/Case
Exercise 2: Erstellung einer serialisierbaren Datei aus mehreren Dateien
Exercise 3: Deserializere Datein

Tag 2


Modul 4: Arbeiten mit Datenbanken
Lesson 1: Verbinden und Erkunden von Datenbanken
Lesson 2: Tabellen In- und Output
Exercise 1: Lesen und Schreiben von Datenbanktabellen
Lesson 3: Schritte über einfügen, updaten und löschen
Lesson 4: Cleansing Data
Lesson 5: Using Parameters & Arguments in SQL Queries
Exercise 2: Input mit Parametern / Table Wizard

Modul 5: Data Flows und Lookups
Lesson 1: Copying und Distributing Data
Exercise 1: Working mit Parallel Processing
Lesson 2: Lookups
Exercise 2: Lookups & Datenformattierung
Lesson 3: Merging Data

Tag 3

Modul 6: Calculations
Lesson 1: Nutzung des "Group By"-Schrittes
Lesson 2: Calculator
Exercise 1: Sortieren, Groupieren und Berechnen von Bestellmengen
Lesson 3: Regular Expression
Lesson 4: User Defined Java Expression
Lesson 5: JavaScript

Modul 7: Jobs Orchestration
Lesson 1: Einführung zu Jobs
Exercise 1: Loading JVM-Data in eine Tabelle
Lesson 2: Senden von Alerts
Lession 3: Looping & Conditions
Exercise 2: Erstellung eines Jobs mit Loop
Lesson 4: Executing Jobs von einem Terminal-Window (Kitchen)

Modul 8: Scheduling
Lesson 1: Erstellung eines Schedulers
Lesson 2: Überwachung von Scheduled Tasks

Modul 9: Exploring Data Integration Repositories
Lesson 1: Die Pentaho Data Integration Repository
Exercise 1: Benutzung der Pentaho Enterprise Repository

Modul 10: Detailed Logging
Lesson 1: Detailed Logging

Jetzt anmelden

Hotelempfehlungen Fulda

Wir empfehlen Ihnen die folgenden Hotels in unmittelbarer Nähe des Schulungsortes.

HotelAdresseTelefon
Parkhotel FuldaGoethestraße 13, 36043 Fulda0661 8650-0
Hotel PlatzhirschUnterm Heilig Kreuz 3-5, 36037 Fulda0661-901 500-0
Hotel Altstadthotel ArteDoll 2, 36037 Fulda066125029880
Hotel Fulda MitteLindenstrasse 45, 36037 Fulda0661 83300
CityHotel Hessischer HofNikolausstraße 22, 36037 Fulda0661 78011

Auf Google Maps anzeigen

it-novum GmbH Deutschland

Hauptsitz: Edelzeller Straße 44, 36043 Fulda

Niederlassung: Siemensdamm 50, 13629 Berlin

Niederlassung: Ruhrallee 9, 44139 Dortmund

 

info@it-novum.com

+49 661 103 - 322

+49 661 103 - 597

it-novum Niederlassung Österreich

Office Park 7 / Top B02

1300 Wien-Flughafen

 

 

info@it-novum.at

+43 1 227 87 - 139

+43 1 227 87 - 200