Apache Spark Grundlagen
|
Preis pro Teilnehmer:
EUR 1.390,00 nettoEUR 1.654,10 inkl. 19.00% MwSt. |
Kurzbeschreibung:
Wir leben in einer Zeit, in der immer mehr Daten in immer kürzerer Zeit gespeichert und verarbeitet werden müssen. Klassische Frameworks und Algorithmen stoßen hier schnell an ihre Grenzen. Eine Lösung bietet Apache Spark - ein Framework zur verteilten Verarbeitung und Berechnung großer Datenmengen. In diesem Seminar bekommen Sie einen Überblick über die wichtigsten Spark-Komponenten und die Architektur einer Spark-Applikation. In praktischen Übungen wenden Sie das Erlernte an und schreiben Ihre ersten eigenen Spark-Jobs in Python. Unter anderem verwenden Sie dabei Spark Core - die Grundlage der parallelen Verarbeitung in Spark -, analysieren Daten mit Spark SQL und lernen die wichtigsten Konfigurationen, auch im Zusammenhang mit YARN, kennen. Des Weiteren erhalten Sie eine kurze Einführung in die Bibliotheken für Streaming (Spark Streaming), Machine Learning (MLlib) und Graph-Verarbeitung (GraphX).
Wir leben in einer Zeit, in der immer mehr Daten in immer kürzerer Zeit gespeichert und verarbeitet werden müssen. Klassische Frameworks und Algorithmen stoßen hier schnell an ihre Grenzen. Eine Lösung bietet Apache Spark - ein Framework zur verteilten Verarbeitung und Berechnung großer Datenmengen. In diesem Seminar bekommen Sie einen Überblick über die wichtigsten Spark-Komponenten und die Architektur einer Spark-Applikation. In praktischen Übungen wenden Sie das Erlernte an und schreiben Ihre ersten eigenen Spark-Jobs in Python. Unter anderem verwenden Sie dabei Spark Core - die Grundlage der parallelen Verarbeitung in Spark -, analysieren Daten mit Spark SQL und lernen die wichtigsten Konfigurationen, auch im Zusammenhang mit YARN, kennen. Des Weiteren erhalten Sie eine kurze Einführung in die Bibliotheken für Streaming (Spark Streaming), Machine Learning (MLlib) und Graph-Verarbeitung (GraphX).
Infos anfordern | Seminar buchen | In den SeminarFolder | |||
Weiterführende Informationen auf der Seite des Anbieters | |||||
Ausführliche Beschreibung
- Überblick über Spark- Spark Core
- Spark-Architektur
- Spark SQL
- Spark Streaming, MLlib und GraphX
Benötigte Vorkenntnisse
Teilnahme am Seminar "Python Programmierung" (P-PYTH-01) oder gleichwertige Kenntnisse, Teilnahme am Seminar "Hadoop Grundlagen" (HADOOP-01) oder gleichwertige Kenntnisse
Zielgruppe
Anwendungsentwickler, Data Engineers, Data Scientists, Systemintegratoren, IT-Architekten, IT-Consultants
Ortsbeschreibung
ORDIX Seminarzentrum