Opleiding : Spark Java, toepassingen ontwikkelen voor Big Data

Praktijkcursus - 3d - 21u00 - Ref. SPK
Prijs : 2010 € V.B.

Spark Java, toepassingen ontwikkelen voor Big Data




Spark wordt vaak voorgesteld als de opvolger van Hadoop. Spark vereenvoudigt het programmeren van big data processing en maakt het gebruik van Scala, Python of Java mogelijk. Deze cursus leert programmeurs hoe ze een gegevensstroom in realtime kunnen verwerken en batchverwerking kunnen uitvoeren (van SQL tot machine learning).


INTER
INTRA
OP MAAT

Praktijkcursus ter plaatse of via klasverband op afstand
Disponible en anglais, à la demande

Ref. SPK
  3d - 21u00
2010 € V.B.




Spark wordt vaak voorgesteld als de opvolger van Hadoop. Spark vereenvoudigt het programmeren van big data processing en maakt het gebruik van Scala, Python of Java mogelijk. Deze cursus leert programmeurs hoe ze een gegevensstroom in realtime kunnen verwerken en batchverwerking kunnen uitvoeren (van SQL tot machine learning).


Pedagogische doelstellingen
Aan het einde van de training is de deelnemer in staat om:
Beheers de fundamentele concepten van Spark
Toepassingen ontwikkelen met Spark Streaming
Een Spark-cluster implementeren
Gegevens exploiteren met Spark SQL
Een eerste benadering van machinaal leren

Doelgroep
Projectmanagers, datawetenschappers, ontwikkelaars, architecten.

Voorafgaande vereisten
Goede kennis van Java. Kennis van big data.

Praktische modaliteiten
Praktisch werk
Praktische toepassing van de concepten die in de cursus worden behandeld met behulp van de Java-taal.

Opleidingsprogramma

1
Inleiding tot Apache Spark

  • Geschiedenis van het kader.
  • De verschillende versies van Spark (Scala, Python en Java).
  • Vergelijking met de Apache Hadoop-omgeving.
  • De verschillende Spark modules.
Praktisch werk
Spark installeren en configureren. Een eerste voorbeeld met woordentelling uitvoeren.

2
Programmeren met veerkrachtige gedistribueerde datasets (RDD)

  • Presentatie RDD.
  • RDD's maken, verwerken en hergebruiken.
  • Accumulatoren en uitzendvariabelen.
  • Gebruik partities.
Praktisch werk
Het manipuleren van verschillende datasets met behulp van RDD's en het gebruik van de API van Spark.

3
Gestructureerde gegevens verwerken met Spark SQL

  • SQL, DataFrames en datasets.
  • De verschillende soorten gegevensbronnen.
  • Interoperabiliteit met RDD's.
  • Spark SQL prestaties.
  • JDBC/ODBC-server en Spark SQL CLI.
Praktisch werk
Dataset manipulatie via SQL queries. Verbinding met een externe database via Java DataBase Connectivity (JDBC) of Open Database Connectivity (OBDC).

4
Spark op een cluster

  • De verschillende soorten architectuur: standalone, Apache Mesos of Hadoop YARN.
  • Een cluster configureren in standalone modus.
  • Een applicatie verpakken met zijn afhankelijkheden.
  • Toepassingen implementeren met Spark-submit.
  • Een cluster dimensioneren.
Praktisch werk
Een Spark-cluster opzetten.

5
Real-time analyse met Spark Streaming

  • Hoe het werkt.
  • Presentatie van gediscretiseerde streams (DStreams).
  • De verschillende soorten bronnen.
  • Omgaan met de API.
  • Vergelijking met Apache Storm.
Praktisch werk
Loggebruik met Spark Streaming.

6
Grafieken verwerken met GraphX

  • Maak kennis met GraphX.
  • De verschillende operaties.
  • Grafieken maken.
  • Vertex en Edge RDD.
  • Presentatie van verschillende algoritmen.
Praktisch werk
Omgaan met de GraphX API aan de hand van verschillende voorbeelden.

7
Machinaal leren met Spark

  • Inleiding tot machinaal leren.
  • De verschillende klassen van algoritmen.
  • Inleiding tot SparkML en MLlib.
  • Implementaties van de verschillende algoritmen in MLlib.
Praktisch werk
Gebruik van SparkML en MLlib.


Feedback van klanten
4,8 / 5
De feedback van klanten is afkomstig van eindevaluaties na de opleiding. De score wordt berekend op basis van alle evaluaties die minder dan 12 maanden oud zijn. Alleen die met een tekstcommentaar worden weergegeven.
RAPHAËL R.
08/10/25
4 / 5

Hallo, ik had moeite met het verzamelen van de informatie uit de oefeningen. Ik werk langzaam en misschien had ik niet het vereiste niveau.
CLEMENT L.
08/10/25
5 / 5

De cursus is erg interessant en komt goed overeen met het aangekondigde plan. Ik had graag wat meer gezien over hoe je een spark architectuur ontwerpt, hoe je het aantal cores en partities definieert afhankelijk van het probleem.
MOUNIR B.
09/04/25
5 / 5

De trainer was erg leerzaam en deed veel praktische oefeningen, wat erg gewaardeerd werd.



Data en plaats
Selecteer uw locatie of kies voor de les op afstand en kies vervolgens uw datum.
Klas op afstand

Dernières places
Date garantie en présentiel ou à distance
Session garantie

KLAS OP AFSTAND
2026 : 25 maa., 15 juni, 14 sep., 23 nov.

PARIS LA DÉFENSE
2026 : 25 maa., 15 juni, 14 sep., 23 nov.