Schulungsübersicht

  1. Machine Learning Einführung
    • Arten des maschinellen Lernens - überwachtes vs. unüberwachtes Lernen
    • Vom statistischen Lernen zum maschinellen Lernen
    • Der Data Mining Arbeitsablauf:
      • Business Verstehen
      • Datenverstehen
      • Aufbereitung der Daten
      • Modellierung
      • Auswertung
      • Einsatz
    • Algorithmen für maschinelles Lernen
    • Auswahl eines geeigneten Algorithmus für das Problem
    • Überanpassung und Bias-Varianz-Abgleich in ML
  2. ML-Bibliotheken und Programmiersprachen
    • Warum eine Programmiersprache verwenden?
    • Die Wahl zwischen R und Python
    • Python Crash-Kurs
    • Python Ressourcen
    • Python Bibliotheken für maschinelles Lernen
    • Jupyter-Notebooks und interaktives Programmieren
  3. Testen von ML-Algorithmen
    • Verallgemeinerung und Überanpassung
    • Vermeiden von Überanpassung
      • Holdout-Methode
      • Kreuz-Validierung
      • Bootstrapping
    • Evaluierung numerischer Vorhersagen
      • Maße für die Genauigkeit: ME, MSE, RMSE, MAPE
      • Parameter- und Vorhersagestabilität
    • Bewertung von Klassifizierungsalgorithmen
      • Genauigkeit und ihre Probleme
      • Die Konfusionsmatrix
      • Das Problem der unausgewogenen Klassen
    • Visualisierung der Modellleistung
      • Gewinnkurve
      • ROC-Kurve
      • Lift-Kurve
    • Modell-Auswahl
    • Modellabstimmung - Gittersuchstrategien
    • Beispiele in Python
  4. Datenaufbereitung
    • Datenimport und -speicherung
    • Verstehen der Daten - Grundlagenuntersuchungen
    • Datenmanipulationen mit der Pandas-Bibliothek
    • Datentransformationen - Datenmanipulation
    • Explorative Analyse
    • Fehlende Beobachtungen - Erkennung und Lösungen
    • Ausreißer - Erkennung und Strategien
    • Standardisierung, Normalisierung, Binarisierung
    • Qualitative Datenumkodierung
    • Beispiele in Python
  5. Klassifizierung
    • Binäre vs. Multiklassen-Klassifikation
    • Klassifizierung über mathematische Funktionen
      • Lineare Diskriminanzfunktionen
      • Quadratische Diskriminanzfunktionen
    • Logistische Regression und Wahrscheinlichkeitsansatz
    • K-Nächste Nachbarn
    • Naïve Bayes
    • Entscheidungsbäume
      • CART
      • Bagging
      • Random Forests
      • Verstärkung
      • Xgboost
    • Support-Vektor-Maschinen und Kernel
      • Maximal Margin Klassifikator
      • Support-Vektor-Maschine
    • Ensemble-Lernen
    • Beispiele in Python
  6. Regression und numerische Vorhersage
    • Schätzung der kleinsten Quadrate
    • Techniken zur Variablenauswahl
    • Regularisierung und Stabilität - L1, L2
    • Nichtlinearitäten und verallgemeinerte kleinste Quadrate
    • Polynomielle Regression
    • Regressionssplines
    • Regressionsbäume
    • Beispiele in Python
  7. Unüberwachtes Lernen
    • Clustering
      • Zentroid-basiertes Clustering - k-means, k-medoids, PAM, CLARA
      • Hierarchische Clusterbildung - Diana, Agnes
      • Modellbasiertes Clustering - EM
      • Selbstorganisierende Karten
      • Bewertung und Beurteilung von Clustern
    • Dimensionalitätsreduktion
      • Hauptkomponentenanalyse und Faktorenanalyse
      • Singulärwert-Zerlegung
    • Multidimensionale Skalierung
    • Beispiele in Python
  8. Text Mining
    • Vorverarbeitung von Daten
    • Das Bag-of-Words-Modell
    • Stemming und Lemmisierung
    • Analyse von Worthäufigkeiten
    • Sentiment-Analyse
    • Erstellen von Wortwolken
    • Beispiele in Python
  9. Empfehlungsmaschinen und kollaborative Filterung
    • Empfehlungsdaten
    • Benutzerbasierte kollaborative Filterung
    • Element-basierte kollaborative Filterung
    • Beispiele in Python
  10. Assoziationsmuster-Mining
    • Frequent-Itemsets-Algorithmus
    • Warenkorb-Analyse
    • Beispiele in Python
  11. Ausreißer-Analyse
    • Extremwert-Analyse
    • Distanzbasierte Ausreißererkennung
    • Dichte-basierte Methoden
    • Hochdimensionale Ausreißererkennung
    • Beispiele in Python
  12. Machine Learning Fallstudie
    • Business Problemverständnis
    • Vorverarbeitung der Daten
    • Algorithmusauswahl und -abstimmung
    • Auswertung der Ergebnisse
    • Einsatz

Voraussetzungen

Kenntnis und Bewusstsein für Machine Learning Grundlagen

 21 Stunden

Teilnehmerzahl


Price per participant (excl. VAT)

Erfahrungsberichte (3)

Kommende Kurse

Verwandte Kategorien