Schulungsübersicht
Einführung
Überblick über Daten Access Ansätze (Hive, Datenbanken, etc.)
Überblick über die Funktionen und Architektur von Spark
Installieren und Konfigurieren von Spark
Verstehen von Dataframes in Spark
Definieren von Tabellen und Importieren von Datensätzen
Abfragen von Datenframes mit SQL
Ausführen von Aggregationen, JOINs und verschachtelten Abfragen
Hochladen und Accessing von Daten
Abfragen verschiedener Datentypen
- JSON, Parquet, etc.
Abfragen von Data Lakes mit SQL
Fehlersuche
Zusammenfassung und Fazit
Voraussetzungen
- Erfahrungen mit SQL Abfragen
- Programmiererfahrung in einer beliebigen Sprache
Publikum
- Datenanalysten
- Datenwissenschaftler
- Dateningenieure
Erfahrungsberichte (5)
Viele praktische Beispiele, verschiedene Wege, das gleiche Problem anzugehen, und manchmal nicht so offensichtliche Tricks, wie man die aktuelle Lösung verbessern kann
Rafal - Nordea
Kurs - Apache Spark MLlib
Maschinelle Übersetzung
very interactive...
Richard Langford
Kurs - SMACK Stack for Data Science
Sufficient hands on, trainer is knowledgable
Chris Tan
Kurs - A Practical Introduction to Stream Processing
Get to learn spark streaming , databricks and aws redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Kurs - Apache Spark in the Cloud
practice tasks