Skip to main content

Data Preparation im Kontext von Data Science Projekten

Datum: 30. September 2019
Uhrzeit: 15:00 - 15:45 Uhr

Zirka 80% seiner Zeit beschäftigt sich ein Data Scientist mit dem Thema Data Preparation. Warum ist das so und kann man den Aufwand nicht reduzieren?

Daten sind die Grundlage für jedes Data Science- oder Machine Learning-Projekt. Es ist daher nicht verwunderlich, dass sich ein Data Scientist sehr intensiv mit den zugrundeliegenden Daten auseinander setzt. Die Qualität der Rohdaten muss zunächst in einer explorativen Phase bestimmt und anschließend können Transformationsmaßnahmen unternommen werden, um eine hohe Datenqualität zu gewährleisten.

Anhand dieser Datenbasis muss dann eine Selektion der relevanten Features vorgenommen werden, welche sich direkt auf die Performance des späteren Modelles auswirkt.

In diesem Webinar wollen wir zeigen, was typische Probleme im Bereich Data Preparation sind und wie man mit diesen Herausforderungen umgehen kann.

Dabei schauen wir uns auch an, wie es nach der Data Preparation Phase weiter geht, um ein passendes Modell zu identifizieren und zu validieren. Für das Deployment des fertigen Modells haben wir einige Praxistipps für Sie parat.

Agenda

  1. Einleitung TDWI
  2. Daten und ihre Aufbereitung
    • Warum Data Preparation wichtig ist
    • Darstellung Standardablauf Data Preparation
    • Konkrete Lösungsansätze für typische Data Preparation Probleme
  3. Data Science
    • Modellierung
    • Evaluierung des Modells
    • Deployment des Modells