Nos domaines de formation :

Formation Big Data, méthodes et solutions pratiques pour l'analyse des données

4,1 / 5
Stage pratique
meilleur vente
Durée : 5 jours
Réf : BID
Prix  2018 : 3030 € H.T.
Pauses et déjeuners offerts
  • Programme
  • Cycles certifiants
  • Participants / Prérequis
  • Intra / sur-mesure
  • avis vérifiés
Programme

Ce stage vous permettra de comprendre les enjeux et les apports du Big Data ainsi que les technologies pour le mettre en œuvre. Vous apprendrez à intégrer des volumétries massives de données structurées et non structurées via un ETL, puis à les analyser grâce à des modèles statistiques et des dashboards dynamiques.

Objectifs pédagogiques

  • Comprendre les concepts et l'apport du Big Data par rapport aux enjeux métiers
  • Comprendre l'écosystème technologique nécessaire pour réaliser un projet Big Data
  • Acquérir les compétences techniques pour gérer des flux de données complexes, non structurés et massifs
  • Implémenter des modèles d'analyses statistiques pour répondre aux besoins métiers
  • Appréhender un outil de data visualisation pour restituer des analyses dynamiques

Exercice

Mettre en place une plateforme Hadoop et ses composants de base, utiliser un ETL pour gérer les données, créer des modèles d'analyse et dashboards.
PROGRAMME DE FORMATION

Comprendre les concepts et les enjeux du Big Data

  • Origines et définition du Big Data.
  • Les chiffres clés du marché dans le monde et en France.
  • Les enjeux du Big Data : ROI, organisation, confidentialité des données.
  • Un exemple d'architecture Big Data.

Les technologies du Big Data

  • Description de l'architecture et des composants de la plateforme Hadoop.
  • Les modes de stockage (NoSQL, HDFS).
  • Principes de fonctionnement de MapReduce, Spark, Storm...
  • Principales distributions du marché (Hortonworks, Cloudera, MapR, Elastic Map Reduce, Biginsights).
  • Installer une plateforme Hadoop.
  • Les technologies du datascientist.
  • Présentation des technologies spécifiques pour le Big Data (Tableau, Talend, Qlikview ...).

Exercice
Installation d'une plateforme Big Data Hadoop (via Cloudera QuickStart ou autre).

Gérer les données structurées et non structurées

  • Principes de fonctionnement de Hadoop Distributed File System (HDFS).
  • Importer des données externes vers HDFS.
  • Réaliser des requêtes SQL avec HIVE.
  • Utiliser PIG pour traiter la donnée.
  • Le principe des ETL (Talend...).
  • Gestion de streaming de données massive (NIFI, Kafka, Spark, Storm...)

Exercice
Implémentation de flux de données massives.

Technique et méthodes Big data analytics

  • Machine Learning, une composante de l'intelligence artificielle.
  • Découvrir les trois familles : Régression, Classification et Clustering.
  • La préparation des données (data preparation, feature engineering).
  • Générer des modèles en R ou Python.
  • Ensemble Learning.
  • Découvrir les outils du marché : Jupyter Notebook, Dataïku, Amazon Machine Learning...

Exercice
Mise en place d'analyses avec une des outils étudiés.

Data visualisation et cas d'usage concrets

  • Définir le besoin de la data visualisation.
  • Analyse et visualisation des données.
  • Peut concerner tous les types de données dans la DataViz ?
  • Les outils DataViz du marché.

Exercice
Installation et utilisation d'un outil de Data Visualisation pour constituer des analyses dynamiques.

Conclusion

  • Ce qu'il faut retenir.
  • Synthèse des bonnes pratiques.
  • Bibliographie.
Cycles certifiants
Participants / Prérequis

» Participants

Dataminers, chargés d'études statistiques, développeurs, chefs de projet, consultants en informatique décisionnelle.

» Prérequis

Connaissances de base des modèles relationnels, des statistiques et des langages de programmation. Connaissances de base des concepts de la Business Intelligence.
Intra / sur-mesure
Programme standard     Programme sur-mesure
Oui / Non

Vos coordonnées

Avis vérifiés
picto avis vérifiés
Céline B. 22/10/2018
4 / 5
un peu trop de contenu on a parfois du mal à suivre

Philippe C. 22/10/2018
4 / 5
Beaucoup de choses a voir, Des fois difficile de faire le lien

Christophe V. 22/10/2018
4 / 5
Contenu intéressant, mise en pratique à revoir pour intégrer correctement le sujet

Patrick L. 22/10/2018
5 / 5
Bonne appréciation

GILLES E. 15/10/2018
4 / 5
Contenu très dense : une explication complémentaire sur l'objectif de chacun des exercices serait un +

Irina G. 15/10/2018
4 / 5
Contenu très riche et intéressant. Un peu de difficultés pour comprendre certains exercices en étant pas développeur.

Charles V. 15/10/2018
5 / 5
Très bonne formation qui permet d'obtenir une bonne connaissance des différents composant qu'une architecture Big Data peut contenir

Vanina J. 15/10/2018
3 / 5
la formation survole énormément de sujets ce qui rend la formation fastidieuse

DE S. 15/10/2018
4 / 5
Formation pour des profils très différents, chaque élève a un intérêt diffèrent

loc’h l. 15/10/2018
4 / 5
Copies d'écran peu lisibles

Christian B. 15/10/2018
5 / 5
Le manque de couleur sur le support ne permet pas d'apprécier les graphes.

Luc L. 15/10/2018
5 / 5
Rien à dire, correspondait à mon attente

de O. 08/10/2018
4 / 5
Se retrouver dans les IHM pour faire les exercices

Aline C. 08/10/2018
4 / 5
Le contenu du stage n'était pas adapté à ma problématique particulière, mais c'est une erreur de choix de stage. La pédagogie de l'animateur est très satisfaisante

Laurent V. 08/10/2018
5 / 5
Exemples variés, progression adaptée dans la découverte des outils

Gilles D. 08/10/2018
5 / 5
Formation très utile pour une approche théorique et pratique des technologies Big Data

BELLARDI M. 08/10/2018
5 / 5
Très bonne approche du sujet pour débutants, donne une bonne vision d'ensemble

Christophe D. 08/10/2018
5 / 5
correspond tout à fait à l'attendu.

Amrita V. 08/10/2018
2 / 5
Pas en adéquation avec la promesse de l'agenda, trop superficiel, pas assez pragmatique, on n'attaque pas les sujets qui nous permettent de nous projeter dans le contexte de notre travail. Pas de suite logique avec les autres modules du cycle Data Scientist. Bref a revoir en benchmark avec d'autres formations dont le e-learning des américains : moins chers et plus approfondi, mieux tutoré. Les VMs des PCs sont mal paramétrées, bcp ne fonctionnent

Guillaume B. 08/10/2018
2 / 5
le titre du cours "méthodes et solutions pratiques pour l analyse des données" ne correspond pas avec la formation. il devrait s appeler "méthode et solution pratique pour BIGDATA". Avec les mots "solutions pratiques POUR l analyse des données" je pensais trouver ces solutions et ce n'est pas le cas, tout le cours est centré sur HADOOP et le BIGDATA, seulement 30 minutes sur la semaine sont accordées sur des solutions pratiques pour l analyse de don
Avis client 4,1 / 5

Les avis client sont issus des feuilles d’évaluation de fin de formation. La note est calculée à partir de l’ensemble des avis datant de moins de 12 mois.

Pour vous inscrire

Cliquez sur la ville, puis sur la date de votre choix.
[+]
PARIS
[+]
AIX
[+]
ANGERS
[+]
BORDEAUX
[+]
BRUXELLES
[+]
DIJON
[+]
GENEVE
[+]
GRENOBLE
[+]
LILLE
[+]
LIMOGES
[+]
LUXEMBOURG
[+]
LYON
[+]
MONTPELLIER
[+]
NANCY
[+]
NANTES
[+]
NIORT
[+]
ORLEANS
[+]
REIMS
[+]
RENNES
[+]
ROUEN
[+]
SOPHIA-ANTIPOLIS
[+]
STRASBOURG
[+]
TOULON
[+]
TOULOUSE
[+]
TOURS

Horaires

Les cours ont lieu de 9h à 12h30 et de 14h à 17h30.
Les participants sont accueillis à partir de 8h45.
Pour les stages pratiques de 4 ou 5 jours, les sessions se terminent à 15h30 le dernier jour.