HMS Data Science Seminar

Machine Learning Methoden für Data Scientists

Machine Learning, Data Science und Artificial Intelligence sind mittlerweile in aller Munde: Was vor einigen Jahren noch Zukunftsmusik war wollen vielen Unternehmen inzwischen gewinnbringend für sich einsetzen.
Um erfolgreiche Data-Science-Projekte durchführen zu können, müssen jedoch einige Grundvoraussetzungen erfüllt sein. Die Data Scientist sollten außerdem über ein ausgeprägtes Daten- sowie ein solides Methodenverständnis verfügen – nur so können die Erkenntnisse gewinnbringend in Unternehmensprozesse implementiert werden.

Von der Vision zur Realität

Im Rahmen des Trainings erhalten die Teilnehmer einen weitreichenden Einblick in moderne Methoden und Prozesse prädiktiver Modellierung.
Es werden alle relevanten Bereiche erfolgreicher Data-Science-Projekte behandelt. Zusätzlich zeigt der Trainer detailliert die gängigsten Algorithmen und gibt Hilfestellung für die Wahl der richtigen Herangehensweise. Die Vermittlung methodischer Inhalte wird ergänzt durch das Angebot konkrete Anwendungsfälle der Teilnehmer zu diskutieren und mit den gelernten Inhalten zu verknüpfen.

Die Kursteilnehmer …

  • … lernen verschiedene Machine Learning-Methoden kennen.
  • … verstehen die Stärken und Schwächen der einzelnen Methoden.
  • … erhalten wichtige Hinweise für die Datenvorbereitung.
  • … lernen selbstständig mit Training und Testing umzugehen.
  • … erfahren, wie sie die Performance der Methoden korrekt evaluieren.
  • … verstehen, wie sie die Machine Learning Verfahren richtig interpretieren.

Christoph Bergen

Christoph Bergen ist Data Scientist bei der HMS Analytical Software GmbH in Heidelberg. Er beschäftigt sich mit Begeisterung mit den Themen Data Science, Machine Learning, Deep Learning und Zeitreihenanalyse. Als Trainer ist er dank seiner umfangreichen Erfahrung in der Lage relevante Inhalte zielgruppengerecht zu erläutern.

Ihr Weg zum erfolgreichen Projekt!

Sie haben Interesse an diesem Seminar?
Vereinbaren Sie einen unverbindlichen Beratungstermin! Lassen Sie uns über Ihre Wünsche zum Inhalt sowie das genaue Datum und die Uhrzeit sprechen.

Termin vereinbaren

Zukünftige Data Scientists und alle, die neue Impulse für Ihre zukünftigen Predictive-Modeling-Projekte gewinnen möchten.

Den Teilnehmern sollten die Grundbegriffe und -konzepte prädiktiver Modellierung bekannt sein, da diese im Rahmen des Seminars nur kurz vorgestellt werden. Für das Teams-Meeting benötigen die Teilnehmer einen Laptop mit installierter TEAMS Windows App oder einem der folgenden Browser: Internet Explorer 11+, Microsoft Edge 12+, Chrome 51.0+ und Firefox 47.0+.

  • Einführung in Machine Learning und Data Science
    • Literaturempfehlungen
    • Voraussetzungen und Terminologie
    • Statistical Modeling, Data Mining, Machine Learning/AI… und Predictive Modeling: Eine Abgrenzung
    • Wichtige Begriffe und Konzepte
    • Wesentliche Algorithmen für Supervised Learning
    • Die “Goldenen Regeln für Data Science” (in der echten Welt)
  • Vor dem Projekt: Die Datenvorbereitung
    • Der Umgang mit fehlenden Werten
    • Metrische und kategorielle Merkmale und deren EDA (Explorative Daten-Analyse)
    • Transformation, Ausreißer und Selbst-Prädiktoren
    • Variablenauswahl hochkorrelierter Merkmale
    • Änderungen in der Merkmalsverteilung („data drift“)
    • Sampling für unbalancierte Daten
    • Demo
  • Vorstellung verschiedener Machine Learning-Methoden
    • Was ist ein “decision tree”?
    • Was ist ein “random forest”?
    • Was ist “tree-boosting”?
    • Was ist “Lasso”?
    • Schwächen und Stärken dieser Methoden
  • Tipps zum Aufbau von Modellen
    • Training und Testen
      • Kreuzvalidierung und Holdout
      • Tuning: Empfohlene Parameterbereiche
      • Learning Curve
    • Bewertungskritieren für die Prädiktive Performance
    • Demo
  • Interpretation
    • Wie wichtig sind die Variablen?
    • Partial Dependence Plots zur Effekt-Visualisierung
    • Shapely Values
    • Tree-boosting als Diagnose-Tool
    • Demo
  • Andere Algorithmen des maschinellen Lernens
    • Boosted Generalized Linear Models (GLMs)
    • Neuronale Netze
    • Support-Vektor-Maschinen (SVM)
  • Zusammenfassung und abschließende Empfehlungen
Ihre Ansprechpartnerin für:
  • Fragen zur Anmeldung & Teilnahme
  • Seminaranfragen & Kooperationen
Christina Wedel
Inside Sales Expert