> Formations > Technologies numériques > Big Data, Intelligence Artificielle > Big Data, NoSQL > Formation Traitement de données Big Data en temps réel avec Spark et Storm > Formations > Technologies numériques > Formation Traitement de données Big Data en temps réel avec Spark et Storm

Traitement de données Big Data en temps réel avec Spark et Storm

Traitement de données Big Data en temps réel avec Spark et Storm

Télécharger au format pdf Partager cette formation par e-mail 2


Le Big Data, connu pour sa capacité à traiter des données massives, intègre avec l'arrivée d'outils comme Spark et Storm la composante temps réel. Vous découvrirez dans ce cours les atouts de ces outils, leur système de calcul distribué temps réel ainsi que la notion de diffusion en continue (Streaming Big Data).


Inter
Intra
Sur mesure

Cours pratique en présentiel ou en classe à distance

Réf. DSS
Prix : 2150 € H.T.
  3j - 21h
Pauses-café et
déjeuners offerts




Le Big Data, connu pour sa capacité à traiter des données massives, intègre avec l'arrivée d'outils comme Spark et Storm la composante temps réel. Vous découvrirez dans ce cours les atouts de ces outils, leur système de calcul distribué temps réel ainsi que la notion de diffusion en continue (Streaming Big Data).

Objectifs pédagogiques
À l’issue de la formation, le participant sera en mesure de :
  • Comprendre les fondamentaux du développement d'applications Big Data en temps réel
  • Evaluer les outils Spark et Storm
  • Appliquer les systèmes de calcul distribué temps réel de Storm et de Spark
  • Traiter des grosses quantités de données en temps réel

Public concerné
Concepteurs, développeurs, architectes.

Prérequis
Bonnes connaissances en développement logiciel. Une compréhension des problèmes liés au Big Data est un plus.
Vérifiez que vous avez les prérequis nécessaires pour profiter pleinement de cette formation en faisant  ce test.

Programme de la formation

Introduction à l'architecture temps réel

  • Traitements temps réel.
  • Les architectures LAMBDA.
  • Les architectures KAPPA.
  • Les architectures SMACK.
Travaux pratiques
Etude de l'implémentation d'une architecture KAPPA pour Spark et Strom.

L'architecture Kafka

  • L'aperçu de Kafka Producers, Brokers, Consumers.
  • Les fichiers journaux de Kafka.
  • Les schémas Avro. Utilisation de ZooKeeper.
Travaux pratiques
Étude de la configuration de Kafka dans l'architecture KAPPA.

L'architecture Apache Storm

  • Définition de l'environnement de développement.
  • Création de projets basés sur Storm.
  • Définition des composants Storm (Spout et Bolt).
  • Définition des flux Storm.
  • Modèle de données (clé, valeur).
  • Rôles des Nimbus et ZooKeeper.
Etude de cas
Étude de l'implémentation de l'architecture KAPPA pour Storm.

Le traitement des messages Storm

  • Programmation de services avec Clojure, Java, Python.
  • Cycle de vie d'un message.
  • L'API Storm pour la définition de la fiabilité.
  • Stratégie de mise en place de la fiabilité pour une application utilisant le Big Data.
Travaux pratiques
Mise en œuvre d'un projet de traitement des réseaux sociaux en temps réel dans l'architecture KAPPA.

L'architecture d'Apache Spark

  • Les différentes versions de Spark (Scala, Python, R et Java).
  • Comparaison avec l'environnement Storm.
  • Les différents modules de Spark.
  • Les différents types d'architecture : Standalone, Apache Mesos ou Hadoop YARN.
Travaux pratiques
Etude de l'implémentation de l'architecture SMACK pour Spark.

Le temps réel avec Spark Streaming

  • Présentation des RDD.
  • Créer, manipuler et réutiliser des RDD.
  • Accumulateurs et variables broadcastées.
  • Principe de fonctionnement.
  • Les différents types de sources.
  • Comparaison avec Apache Storm.
Travaux pratiques
Mise en œuvre d'un projet de traitement des réseaux sociaux en temps réel.

Les autres acteurs du marché

  • Comparaison de tous les outils de streaming de l'écosystème (Storm, Spark Streaming, Flink, Samza).
  • Focus sur l'architecture Samza.
Travaux pratiques
Étude de l'implémentation de l'architecture KAPPA avec Samza.


Modalités d'évaluation
Le formateur évalue la progression pédagogique du participant tout au long de la formation au moyen de QCM, mises en situation, travaux pratiques…
Le participant complète également un test de positionnement en amont et en aval pour valider les compétences acquises.

Solutions de financement
Pour trouver la meilleure solution de financement adaptée à votre situation : contactez votre conseiller formation.
Il vous aidera à choisir parmi les solutions suivantes :
  • Le plan de développement des compétences de votre entreprise : rapprochez-vous de votre service RH.
  • Le dispositif FNE-Formation.
  • L’OPCO (opérateurs de compétences) de votre entreprise.
  • Pôle Emploi sous réserve de l’acceptation de votre dossier par votre conseiller Pôle Emploi.
  • Le plan de développement des compétences de votre entreprise : rapprochez-vous de votre service RH.
  • Le dispositif FNE-Formation.
  • L’OPCO (opérateurs de compétences) de votre entreprise.
  • Pôle Emploi sous réserve de l’acceptation de votre dossier par votre conseiller Pôle Emploi.

Avis clients
Les avis clients sont issus des évaluations de fin de formation. La note est calculée à partir de l’ensemble des évaluations datant de moins de 12 mois. Seules celles avec un commentaire textuel sont affichées.
FONTAINE P.
23/11/20
3 / 5

Cette formation permet de mettre en pratique de nombreux composants techniques et les exemples choisis sont pertinents. S’agissant de Spark, une présentation plus détaillée des notions de RDD et de Dataframe et des principes de parallélisation des traitements seraient appréciable.
YOAN H.
23/11/20
3 / 5

Plateforme virtualisée fournie par le formateur très intéressante. Exercices pratiques pertinents. On aurait pu approfondir l’utilisation de Fink en pratique sur un exemple simple de la même manière que Storm et Spark Streaming. Les nom de le formation pourrait être plus générique (et donc plus attractif)
JULIEN P.
23/11/20
5 / 5

Un formateur vraiment très professionnel et une formation très pertinente.




Horaires
En présentiel, les cours ont lieu de 9h à 12h30 et de 14h à 17h30.
Les participants sont accueillis à partir de 8h45. Les pauses et déjeuners sont offerts.
En classe à distance, la formation démarre à partir de 9h.
Pour les stages pratiques de 4 ou 5 jours, quelle que soit la modalité, les sessions se terminent à 15h30 le dernier jour.

Dates et lieux
Pour vous inscrire, sélectionnez la ville et la date de votre choix.
Du 2 au 4 novembre 2022 *
FR
Classe à distance
Session garantie
S’inscrire
Du 7 au 9 novembre 2022 *
FR
Paris La Défense
Session garantie
S’inscrire
Du 27 février au 1 mars 2023
FR
Classe à distance
S’inscrire
Du 19 au 21 avril 2023
FR
Classe à distance
S’inscrire
Du 10 au 12 juillet 2023
FR
Classe à distance
S’inscrire
Du 2 au 4 octobre 2023
FR
Classe à distance
S’inscrire