Skip to main content

Data Preparation im Kontext von Data Science Projekten

Datum: 30. September 2019
Uhrzeit: 15:00 - 15:45 Uhr

Zirka 80% seiner Zeit beschäftigt sich ein Data Scientist mit dem Thema Data Preparation. Warum ist das so und kann man den Aufwand nicht reduzieren?

Daten sind die Grundlage für jedes Data Science- oder Machine Learning-Projekt. Es ist daher nicht verwunderlich, dass sich ein Data Scientist sehr intensiv mit den zugrundeliegenden Daten auseinander setzt. Die Qualität der Rohdaten muss zunächst in einer explorativen Phase bestimmt und anschließend können Transformationsmaßnahmen unternommen werden, um eine hohe Datenqualität zu gewährleisten.

Anhand dieser Datenbasis muss dann eine Selektion der relevanten Features vorgenommen werden, welche sich direkt auf die Performance des späteren Modelles auswirkt.

In diesem Webinar wollen wir zeigen, was typische Probleme im Bereich Data Preparation sind und wie man mit diesen Herausforderungen umgehen kann.

Dabei schauen wir uns auch an, wie es nach der Data Preparation Phase weiter geht, um ein passendes Modell zu identifizieren und zu validieren. Für das Deployment des fertigen Modells haben wir einige Praxistipps für Sie parat.

Jetzt kostenlos anmelden

Warum Sie teilnehmen sollten

  • Wir identifizieren Probleme im Vorfeld von Data Science Projekten und liefern Lösungsansätze, damit Sie die typischen Fallstricke vermeiden
  • Wir präsentieren eine Vorgehensweise bei der Durchführung von Data Science Projekten, die ihr Projekt zum Erfolg führt

Agenda

  1. Einleitung TDWI
  2. Daten und ihre Aufbereitung
    • Warum Data Preparation wichtig ist
    • Darstellung Standardablauf Data Preparation
    • Konkrete Lösungsansätze für typische Data Preparation Probleme
  3. Data Science
    • Modellierung
    • Evaluierung des Modells
    • Deployment des Modells