Schulungsübersicht
- Machine Learning Einführung
- Arten des maschinellen Lernens - überwachtes vs. unüberwachtes Lernen
- Vom statistischen Lernen zum maschinellen Lernen
- Der Data Mining Arbeitsablauf:
- Business Verstehen
- Datenverstehen
- Aufbereitung der Daten
- Modellierung
- Auswertung
- Einsatz
- Algorithmen für maschinelles Lernen
- Auswahl eines geeigneten Algorithmus für das Problem
- Überanpassung und Bias-Varianz-Abgleich in ML
- ML-Bibliotheken und Programmiersprachen
- Warum eine Programmiersprache verwenden?
- Die Wahl zwischen R und Python
- Python Crash-Kurs
- Python Ressourcen
- Python Bibliotheken für maschinelles Lernen
- Jupyter-Notebooks und interaktives Programmieren
- Testen von ML-Algorithmen
- Verallgemeinerung und Überanpassung
- Vermeiden von Überanpassung
- Holdout-Methode
- Kreuz-Validierung
- Bootstrapping
- Evaluierung numerischer Vorhersagen
- Maße für die Genauigkeit: ME, MSE, RMSE, MAPE
- Parameter- und Vorhersagestabilität
- Bewertung von Klassifizierungsalgorithmen
- Genauigkeit und ihre Probleme
- Die Konfusionsmatrix
- Das Problem der unausgewogenen Klassen
- Visualisierung der Modellleistung
- Gewinnkurve
- ROC-Kurve
- Lift-Kurve
- Modell-Auswahl
- Modellabstimmung - Gittersuchstrategien
- Beispiele in Python
- Datenaufbereitung
- Datenimport und -speicherung
- Verstehen der Daten - Grundlagenuntersuchungen
- Datenmanipulationen mit der Pandas-Bibliothek
- Datentransformationen - Datenmanipulation
- Explorative Analyse
- Fehlende Beobachtungen - Erkennung und Lösungen
- Ausreißer - Erkennung und Strategien
- Standardisierung, Normalisierung, Binarisierung
- Qualitative Datenumkodierung
- Beispiele in Python
- Klassifizierung
- Binäre vs. Multiklassen-Klassifikation
- Klassifizierung über mathematische Funktionen
- Lineare Diskriminanzfunktionen
- Quadratische Diskriminanzfunktionen
- Logistische Regression und Wahrscheinlichkeitsansatz
- K-Nächste Nachbarn
- Naïve Bayes
- Entscheidungsbäume
- CART
- Bagging
- Random Forests
- Verstärkung
- Xgboost
- Support-Vektor-Maschinen und Kernel
- Maximal Margin Klassifikator
- Support-Vektor-Maschine
- Ensemble-Lernen
- Beispiele in Python
- Regression und numerische Vorhersage
- Schätzung der kleinsten Quadrate
- Techniken zur Variablenauswahl
- Regularisierung und Stabilität - L1, L2
- Nichtlinearitäten und verallgemeinerte kleinste Quadrate
- Polynomielle Regression
- Regressionssplines
- Regressionsbäume
- Beispiele in Python
- Unüberwachtes Lernen
- Clustering
- Zentroid-basiertes Clustering - k-means, k-medoids, PAM, CLARA
- Hierarchische Clusterbildung - Diana, Agnes
- Modellbasiertes Clustering - EM
- Selbstorganisierende Karten
- Bewertung und Beurteilung von Clustern
- Dimensionalitätsreduktion
- Hauptkomponentenanalyse und Faktorenanalyse
- Singulärwert-Zerlegung
- Multidimensionale Skalierung
- Beispiele in Python
- Clustering
- Text Mining
- Vorverarbeitung von Daten
- Das Bag-of-Words-Modell
- Stemming und Lemmisierung
- Analyse von Worthäufigkeiten
- Sentiment-Analyse
- Erstellen von Wortwolken
- Beispiele in Python
- Empfehlungsmaschinen und kollaborative Filterung
- Empfehlungsdaten
- Benutzerbasierte kollaborative Filterung
- Element-basierte kollaborative Filterung
- Beispiele in Python
- Assoziationsmuster-Mining
- Frequent-Itemsets-Algorithmus
- Warenkorb-Analyse
- Beispiele in Python
- Ausreißer-Analyse
- Extremwert-Analyse
- Distanzbasierte Ausreißererkennung
- Dichte-basierte Methoden
- Hochdimensionale Ausreißererkennung
- Beispiele in Python
- Machine Learning Fallstudie
- Business Problemverständnis
- Vorverarbeitung der Daten
- Algorithmusauswahl und -abstimmung
- Auswertung der Ergebnisse
- Einsatz
Voraussetzungen
Kenntnis und Bewusstsein für Machine Learning Grundlagen
Erfahrungsberichte (3)
Even with having to miss a day due to customer meetings, I feel I have a much clearer understanding of the processes and techniques used in Machine Learning and when I would use one approach over another. Our challenge now is to practice what we have learned and start to apply it to our problem domain
Richard Blewett - Rock Solid Knowledge Ltd
Kurs - Machine Learning – Data science
I like that training was focused on examples and coding. I thought that it is impossible to pack so much content into three days of training, but I was wrong. Training covered many topics and everything was done in a very detailed manner (especially tuning of model's parameters - I didn't expected that there will be a time for this and I was gratly surprised).
Bartosz Rosiek - GE Medical Systems Polska Sp. Zoo
Kurs - Machine Learning – Data science
It is showing many methods with pre prepared scripts- very nicely prepared materials & easy to traceback