ORSYS formation
NOUS CONTACTER - +33 (0)1 49 07 73 73
NOUS CONTACTER - 📞 +33 (0)1 49 07 73 73    espace pro ESPACE PRO     inscription formation orsys S'INSCRIRE     drapeau francais   drapeau anglais
Nos domaines de formation :
Toutes nos formations Big Data, NoSQL

Formation Traitement de données Big Data en temps réel avec Spark et Storm

4,7 / 5
Stage pratique
Durée : 3 jours
Réf : DSS
Prix  2019 : 2030 € H.T.
Pauses et déjeuners offerts
  • Programme
  • Participants / Prérequis
  • Intra / sur-mesure
  • avis vérifiés
Programme

Le Big Data, connu pour sa capacité à traiter des données massives, intègre avec l'arrivée d'outils comme Spark et Storm la composante temps réel. Vous découvrirez dans ce cours les atouts de ces outils, leur système de calcul distribué temps réel ainsi que la notion de diffusion en continue (Streaming Big Data).

Objectifs pédagogiques

  • Comprendre les fondamentaux du développement d'applications Big Data en temps réel
  • Evaluer les outils Spark et Storm
  • Appliquer les systèmes de calcul distribué temps réel de Storm et de Spark
  • Traiter des grosses quantités de données en temps réel
PROGRAMME DE FORMATION

Introduction à l'architecture temps réel

  • Traitements temps réel.
  • Les architectures LAMDA.
  • Les architectures KAPPA.
  • Les architectures SMACK.

Travaux pratiques
Etude de l'implémentation d'une architecture KAPPA pour Spark et Strom.

L'architecture Kafka

  • L'aperçu de Kafka Producers, Brokers, Consumers.
  • Les fichiers journaux de Kafka.
  • Les schémas Avro. Utilisation de ZooKeeper.

Travaux pratiques
Étude de la configuration de Kafka dans l'architecture KAPPA.

L'architecture Apache Storm

  • Définition de l'environnement de développement.
  • Création de projets basés sur Storm.
  • Définition des composants Storm (Spout et Bolt).
  • Définition des flux Storm.
  • Modèle de données (clé, valeur).
  • Rôles des Nimbus et ZooKeeper.

Etude de cas
Étude de l'implémentation de l'architecture KAPPA pour Storm.

Le traitement des messages Storm

  • Programmation de services avec Clojure, Java, Python.
  • Cycle de vie d'un message.
  • L'API Storm pour la définition de la fiabilité.
  • Stratégie de mise en place de la fiabilité pour une application utilisant le Big Data.

Travaux pratiques
Mise en œuvre d'un projet de traitement des réseaux sociaux en temps réel dans l'architecture KAPPA.

L'architecture d'Apache Spark

  • Les différentes versions de Spark (Scala, Python, R et Java).
  • Comparaison avec l'environnement Storm.
  • Les différents modules de Spark.
  • Les différents types d'architecture : Standalone, Apache Mesos ou Hadoop YARN.

Travaux pratiques
Etude de l'implémentation de l'architecture SMACK pour Spark.

Le temps réel avec Spark Streaming

  • Présentation des RDD.
  • Créer, manipuler et réutiliser des RDD.
  • Accumulateurs et variables broadcastées.
  • Principe de fonctionnement.
  • Les différents types de sources.
  • Comparaison avec Apache Storm.

Travaux pratiques
Mise en œuvre d'un projet de traitement des réseaux sociaux en temps réel.

Les autres acteurs du marché

  • L'architecture d'Apache Apex.
  • Comparaison entre Samza et Storm.
  • Comparaison entre Apex et Flink.
  • L'intégration Spark Streaming à l'aide de Talend.

Travaux pratiques
Mise en œuvre d'un projet de traitement des réseaux sociaux en temps réel.

Participants / Prérequis

» Participants

Concepteurs, développeurs, architectes.

» Prérequis

Bonnes connaissances en développement logiciel. Une compréhension des problèmes liés au Big Data est un plus.
Intra / sur-mesure

Demande de devis intra-entreprise
(réponse sous 48h)

Vos coordonnées

En cochant cette case, j’atteste avoir lu et accepté les conditions liées à l’usage de mes données dans le cadre de la réglementation sur la protection des données à caractère personnel (RGPD).
Vous pouvez à tout moment modifier l’usage de vos données et exercer vos droits en envoyant un email à l’adresse rgpd@orsys.fr
En cochant cette case, j’accepte de recevoir les communications à vocation commerciale et promotionnelle de la part d’ORSYS Formation*
Vous pouvez à tout moment vous désinscrire en utilisant le lien de désabonnement inclus dans nos communications.
* Les participants inscrits à nos sessions de formation sont également susceptibles de recevoir nos communications avec la possibilité de se désabonner à tout moment.
Avis vérifiés
picto avis vérifiés
Adrien G. 14/01/2019
5 / 5
Excellent formateur !!!!!!!!! Très pédagogue et connait parfaitement son sujet !!!

Eric L. 08/10/2018
4 / 5
Intervenant compétent mais peut etre que la partie installation et parametrage a pris trop de temps

Eric P. 08/10/2018
5 / 5
Très bon pédagogue
Avis client 4,7 / 5

Les avis client sont issus des feuilles d’évaluation de fin de formation. La note est calculée à partir de l’ensemble des avis datant de moins de 12 mois.

Pour vous inscrire

Cliquez sur la ville, puis sur la date de votre choix.
[-]
PARIS
* Session garantie

Horaires

Les cours ont lieu de 9h à 12h30 et de 14h à 17h30.
Les participants sont accueillis à partir de 8h45.
Pour les stages pratiques de 4 ou 5 jours, les sessions se terminent à 15h30 le dernier jour.
En poursuivant votre navigation, vous acceptez l’utilisation de cookies nous permettant de vous proposer des offres correspondant à vos centres d’intérêt.
En savoir plus sur l’usage des cookies…   ✖ Fermer
linkedin orsys
twitter orsys
it! orsys
instagram orsys
pinterest orsys
facebook orsys
youtube orsys