> formation Technologies numériques > formation Big Data, Intelligence Artificielle > formation Big Data, NoSQL > formation Flink, développer des applications pour le Big Data

Avis loadedNote : 3,8Length : 5TotalNote : 75TotalNote20 : 1
Toutes nos formations Big Data, NoSQL

Formation Flink, développer des applications pour le Big Data

3,8 / 5
Stage pratique
Durée : 3 jours
Réf : FKB
Prix  2021 : 2240 € H.T.
Pauses et déjeuners offerts
  • Programme
  • Participants / Prérequis
  • Intra / sur-mesure
  • avis clients
Programme

Apache Flink est un Framework BigData récent. Il simplifie les traitements de flux gros débit temps réels comme les traitements batch sur d'énormes quantités de données (sur Hadoop HDFS, sur Amazon S3, sur MongoDB...). Ce cours vous permet d'installer Flink et de réaliser, en Java, des traitements variés de Big Data.

Objectifs pédagogiques

À l’issue de la formation, le participant sera en mesure de :
  • Maîtriser les concepts fondamentaux de Flink
  • Développer des applications à l'aide de DataSet et DataStream API
  • Traitement de données distribué avec Flink et Hadoop
  • Exploiter des données avec Table API
  • Avoir une première approche du machine learning

Travaux pratiques

Mise en pratique des notions vues en cours à l'aide du langage Java.
PROGRAMME DE FORMATION

Introduction à Apache Flink

  • Historique du framework.
  • Les différentes versions de Flink.
  • Comparaison avec l'environnement Apache Hadoop et Apache Spark.
  • Les différents modules de Flink.

Travaux pratiques
Installation et configuration de Flink. Exécution d'un premier exemple avec le comptage de mots.

Traitement de données à l'aide de l'API DataStream

  • Environnement d'exécution et sources de données.
  • Les transformations: Map, FlatMap, Filter, KeyBy, Reduce...
  • Les opérations sur des flux multiples : Union, Cogroup, Connect, Join, Iterate...
  • Les opérations sur Windows : Global, Tumbling, Sliding, Session...
  • Le partitionnement physique personnalisé, aléatoire, rééquilibrage et redimensionnement.
  • Les DataSink et les connecteurs : Kafka, Twitter, ElasticSerch...

Travaux pratiques
Consommation et manipulation de différents flux des données.

Traitement de données à l'aide de l'API Batch

  • Les différents types de sources de données.
  • Les transformations et agrégations.
  • L'écriture des données.
  • Les DataSink et les connecteurs : HDFS, S3, Avro, MongoDB.

Travaux pratiques
Manipulation de DataSets à partir de plusieurs sources de données.

Traitement de données à l'aide de l'API Table

  • Enregistrement et lecture des tables enregistrées.
  • Les opérateurs : sélection, filtre, jointure, orderBy...
  • Utiliser du SQL sur le flux de données.
  • Traitement des événements complexes.

Travaux pratiques
Mise en place d'une analyse avec SQL sur un flux de données.

API Flink Graph - Gelly

  • Qu'est-ce qu'un graphe ?
  • Les différentes opérations.
  • Créer des graphes.
  • Transformations de graphes.
  • Présentation de différents algorithmes.

Travaux pratiques
Manipulation de l'API travers différents exemples.

Déploiement de Flink

  • Flink sur YARN Configurations.
  • Lancement et arrêt d'un cluster.
  • Soumettre un travail à Flink.
  • Flink sur Google Cloud.
  • Flink sur AWS.

Travaux pratiques
Configurer un cluster multinœuds et déployer une application.

Participants / Prérequis

» Participants

Développeurs, architectes.

» Prérequis

Bonnes connaissances du langage Java.
Intra / sur-mesure

Demande de devis intra-entreprise
(réponse sous 48h)

Vos coordonnées

En cochant cette case, j’atteste avoir lu et accepté les conditions liées à l’usage de mes données dans le cadre de la réglementation sur la protection des données à caractère personnel (RGPD).
Vous pouvez à tout moment modifier l’usage de vos données et exercer vos droits en envoyant un email à l’adresse rgpd@orsys.fr
En cochant cette case, j’accepte de recevoir les communications à vocation commerciale et promotionnelle de la part d’ORSYS Formation*
Vous pouvez à tout moment vous désinscrire en utilisant le lien de désabonnement inclus dans nos communications.
* Les participants inscrits à nos sessions de formation sont également susceptibles de recevoir nos communications avec la possibilité de se désabonner à tout moment.
Avis clients
picto avis clients
DIDIER B. 05/10/2020
4 / 5
Beaucoup de contenu - exercices - peut être faut-il étaler la formation sur une semaine... Quelques points-sujets non praticables

MOUHAMADOU MOUSTAPHA M. 05/10/2020
4 / 5
Formateur excellant avec une très bonne pédagogie par contre le nombre de jours accordés à la formation est trop petite pour faire plus de pratiques et de pouvoir échanger avec le formateur sur certaines cas.

NICOLAS M. 05/10/2020
5 / 5
Le cours est complet sur les aspects de Flink (Batch, Streaming...) cependant, la partie ML de Flink n’est pas très utile. Les exercices sont intéressants, il s’appui sur des cas concrets avec des API qui permettent de manipuler de vrais données. Les exercices Streaming aurait pu être plus longuement abordé avec des bonnes pratiques (création des classes, configuration, optimisation...). Des squelettes de code aurait fait gagner pour la configur

NIKOLAI V. 05/10/2020
3 / 5
Les exercices mal préparés. 80% de temps dépensé aux tâches qui ne concernent pas du sujet du cours. Le formateur maîtrise pas parfaitement l’outil qu’il enseigne.

LONQUER LÉO L. 05/10/2020
4 / 5
Manque de théorie sur le fonctionnement interne de Flink. De bonnes informations données sur la partie développement. Mais demanderait une suite d’exercices axées spécifiquement sur le traitement de données avec Flink, dans lequel nous n’aurions pas à installer ou gérer l’environnement Kafka ou autre. Super énergie de présentateur.
Avis clients 3,8 / 5

Les avis clients sont issus des feuilles d’évaluation de fin de formation. La note est calculée à partir de l’ensemble des avis datant de moins de 12 mois.

CLASSE A DISTANCE

En inter et en intra-entreprise
Inscrivez-vous ou contactez-nous !

Pour vous inscrire

Cliquez sur la ville, puis sur la date de votre choix.
[+]
CLASSE A DISTANCE
[+]
PARIS

Horaires

Les cours ont lieu de 9h à 12h30 et de 14h à 17h30.
Les participants sont accueillis à partir de 8h45.
Pour les stages pratiques de 4 ou 5 jours, les sessions se terminent à 15h30 le dernier jour.
Filières métiers