Apache Spark hat die Entwicklung komplexer Daten-Pipelines stark vereinfacht und sich damit zu einer der am weitesten verbreiteten Technologien im Big Data Bereich in den letzten Jahren entwickelt. Dies ist zum einen auf Sparks Programmierschnittstellen zurückzuführen, welche die prägnante Formulierung komplexer Datenverarbeitungslogiken ermöglichen und zum anderen auf die hohe Automatisierung bei der verteilten Ausführung durch die Engine von Apache Spark.
Diese Schulung richtet sich an Entwickler mit Programmiererfahrung und bietet einen umfassenden Einstieg in die Entwicklung von Daten-Pipelines mit Apache Spark.
Im Fokus steht dabei der Umgang mit Sparks DataFrame API. Angefangen von den grundlegenden Operationen, über erweiterte Konzepte wie Fensterfunktionen, bis hin zur Definition von benutzerdefinierten Funktionen, lernen die Teilnehmer alle wichtigen Bestandteile kennen. Darauf aufbauend werden Best Practices für Entwicklung, Debugging und Profiling von Spark Applikationen besprochen. Abschließend erhalten die Teilnehmer einen Einblick in die Funktionsweise der Spark Engine und die daraus resultierenden Konsequenzen für die Entwicklung von Daten-Pipelines mit Apache Spark.
Das theoretisch vermittelte Wissen der Schulung wird anhand mehrerer praktischer Übungen vertieft und gefestigt.
Hallo, ich bin Claudia Djukic-Müller.
Ich helfe Ihnen gerne weiter. Sie erreichen mich telefonisch unter +49 (0) 89 – 323 731 32
Entwickler mit Programmiererfahrung
Die Spark Foundation Schulung findet täglich von 10:00 Uhr bis 18:00 Uhr in München statt. Es gibt ein gemeinsames Mittagessen mit allen Seminar Teilnehmern und dem Dozenten im Leib&Seele, das sich direkt neben dem Data Science Hub befindet. Hier haben Sie in entspannter Atmosphäre Gelegenheit, im gemeinsamen Gespräch mit dem Dozenten Themen und offene Fragen zu vertiefen.
Die Teilnehmerzahl der Spark Trainings ist auf 10 begrenzt, um Ihnen einen optimalen Lernerfolg zu ermöglichen.
Der eintägige Data Science Kurs findet in unserem Data Science Hub im Sapporobogen 6-8 in München statt. Mit den öffentlichen Verkehrsmitteln erreichen Sie uns innerhalb von 15 Minuten vom Hauptbahnhof. Gerne lassen wir Ihnen Hotelempfehlungen in der Nähe zukommen.
Simon Kaltenbacher ist Experte für Datenarchitektur, verteilte Systeme und Stream Processing. Er berät Kunden beim Aufbau von Datenplattformen und unterstützt sie bei der Implementierung von Daten-Pipelines.
Er verfolgt das Apache-Spark-Projekt intensiv seit Version 0.9 und hat bereits mehrere Schulungen und Vorträge zu dieser Technologie gehalten.
Sie haben Fragen zu den Inhalten, zur Organisation oder interessieren sich für ein Inhouse-Seminar zu unterschiedlichen Themen um Data & AI? Ich helfe Ihnen gerne weiter. Sie erreichen mich telefonisch unter +49 (0) 89 – 323 731 32