NOUS CONTACTER - 📞 +33 (0)1 49 07 73 73    espace pro ESPACE PRO     inscription formation orsys S'INSCRIRE     drapeau francais   drapeau anglais
Nos domaines de formation :
Toutes nos formations Big Data, NoSQL

Formation Big Data, méthodes et solutions pratiques pour l'analyse des données

4,2 / 5
Stage pratique
meilleur vente
Durée : 5 jours
Réf : BID
Prix  2019 : 3090 € H.T.
Pauses et déjeuners offerts
  • Programme
  • Cycles certifiants
  • Participants / Prérequis
  • Intra / sur-mesure
  • avis vérifiés
Programme

Ce stage vous permettra de comprendre les enjeux et les apports du Big Data ainsi que les technologies pour le mettre en œuvre. Vous apprendrez à intégrer des volumétries massives de données structurées et non structurées via un ETL, puis à les analyser grâce à des modèles statistiques et des dashboards dynamiques.

Objectifs pédagogiques

  • Comprendre les concepts et l'apport du Big Data par rapport aux enjeux métiers
  • Comprendre l'écosystème technologique nécessaire pour réaliser un projet Big Data
  • Acquérir les compétences techniques pour gérer des flux de données complexes, non structurés et massifs
  • Implémenter des modèles d'analyses statistiques pour répondre aux besoins métiers
  • Appréhender un outil de data visualisation pour restituer des analyses dynamiques

Exercice

Mettre en place une plateforme Hadoop et ses composants de base, utiliser un ETL pour gérer les données, créer des modèles d'analyse et dashboards.
PROGRAMME DE FORMATION

Comprendre les concepts et les enjeux du Big Data

  • Origines et définition du Big Data.
  • Les chiffres clés du marché dans le monde et en France.
  • Les enjeux du Big Data : ROI, organisation, confidentialité des données.
  • Un exemple d'architecture Big Data.

Les technologies du Big Data

  • Description de l'architecture et des composants de la plateforme Hadoop.
  • Les modes de stockage (NoSQL, HDFS).
  • Principes de fonctionnement de MapReduce, Spark, Storm...
  • Principales distributions du marché (Hortonworks, Cloudera, MapR, Elastic Map Reduce, Biginsights).
  • Installer une plateforme Hadoop.
  • Les technologies du datascientist.
  • Présentation des technologies spécifiques pour le Big Data (Tableau, Talend, Qlikview ...).

Exercice
Installation d'une plateforme Big Data Hadoop (via Cloudera QuickStart ou autre).

Gérer les données structurées et non structurées

  • Principes de fonctionnement de Hadoop Distributed File System (HDFS).
  • Importer des données externes vers HDFS.
  • Réaliser des requêtes SQL avec HIVE.
  • Utiliser PIG pour traiter la donnée.
  • Le principe des ETL (Talend...).
  • Gestion de streaming de données massive (NIFI, Kafka, Spark, Storm...)

Exercice
Implémentation de flux de données massives.

Technique et méthodes Big data analytics

  • Machine Learning, une composante de l'intelligence artificielle.
  • Découvrir les trois familles : Régression, Classification et Clustering.
  • La préparation des données (data preparation, feature engineering).
  • Générer des modèles en R ou Python.
  • Ensemble Learning.
  • Découvrir les outils du marché : Jupyter Notebook, Dataïku, Amazon Machine Learning...

Exercice
Mise en place d'analyses avec une des outils étudiés.

Data visualisation et cas d'usage concrets

  • Définir le besoin de la data visualisation.
  • Analyse et visualisation des données.
  • Peut concerner tous les types de données dans la DataViz ?
  • Les outils DataViz du marché.

Exercice
Installation et utilisation d'un outil de Data Visualisation pour constituer des analyses dynamiques.

Conclusion

  • Ce qu'il faut retenir.
  • Synthèse des bonnes pratiques.
  • Bibliographie.
Cycles certifiants
Participants / Prérequis

» Participants

Dataminers, chargés d'études statistiques, développeurs, chefs de projet, consultants en informatique décisionnelle.

» Prérequis

Connaissances de base des modèles relationnels, des statistiques et des langages de programmation. Connaissances de base des concepts de la Business Intelligence.
Intra / sur-mesure

Demande de devis intra-entreprise
(réponse sous 48h)

Vos coordonnées

En cochant cette case, j’atteste avoir lu et accepté les conditions liées à l’usage de mes données dans le cadre de la réglementation sur la protection des données à caractère personnel (RGPD).
Vous pouvez à tout moment modifier l’usage de vos données et exercer vos droits en envoyant un email à l’adresse rgpd@orsys.fr
En cochant cette case, j’accepte de recevoir les communications à vocation commerciale et promotionnelle de la part d’ORSYS Formation*
Vous pouvez à tout moment vous désinscrire en utilisant le lien de désabonnement inclus dans nos communications.
* Les participants inscrits à nos sessions de formation sont également susceptibles de recevoir nos communications avec la possibilité de se désabonner à tout moment.
Avis vérifiés
picto avis vérifiés
CHLIAH 18/02/2019
4 / 5
Satisfait dans l'ensemble. Le formateur est à l'écoute et au service des stagiaires. Il maitrise bien son sujet. Bravo et merci

Patrick L. 18/02/2019
5 / 5
J'ai trouvé que la méthode utilisée consistant à suivre un exercice fil rouge tout au long de la formation était très bien adaptée. J'ai préféré cette organisation même si nous étions la première formation à la tester.

A. 18/02/2019
5 / 5
Formation très condensé, mais très instructif très bonne découverte pour ma part

Hamid M. 18/02/2019
5 / 5
Bonne intro au Big Data

Emmanuel P. 18/02/2019
5 / 5
Exercice revus sur cette session. Peut être un peu trop tot car certains points n'étaient pas totalement prêts ce qui a rallongé le délai de réalisation de certains exercice malgré la bonne maitrise du sujet par le formateur. De plus, le manque de puissance des machines a rajouté de la difficulté.

Yacine B. 07/01/2019
5 / 5
Le contenu dans sa globalité a répondu à mes attentes.

MICHAUD 07/01/2019
5 / 5
peut-être un peu trop de temps passé sur le

Meyer C. 07/01/2019
5 / 5
Très bien, rien à signaler

Lionel R. 07/01/2019
5 / 5
Contenu très intéressant. Le formateur a très bien su faire vivre la formation. Un axe d'amélioration à envisager : certaines parties du support s'appuient sur des produits alors que nous en avons utilisés d'autres pour la manipulation (Cloudera / Hortonworks).

Lysa B. 10/12/2018
4 / 5
Contente d'avoir suivi cette formation avec ce formateur .

Bruno B. 10/12/2018
5 / 5
J'aurais aimé que les exercices nous laissent un peu plus chercher les solutions.

Emmanuel F. 10/12/2018
4 / 5
Les exercices sont parfois mal précisés. J'ai perdu beaucoup de temps sur des commandes linux (copie, déplacement, création de dossier) qui n'étaient pas explicitées et pas utiles pour les exercices. Ce temps perdu ne m'a pas permis d'aller aussi loin que je le souhaitais dans les exervices

Laurent J. 10/12/2018
4 / 5
Un exemple "métier" qui aurait été suivi durant la formation et étoffer progressivement par les traitements Big Data versus modèles classiques aurait été plus parlant pour moi que les petits exercices isolés.

Mary J. 10/12/2018
4 / 5
Le contenu de la formation est très dense, très orienté sur les composants de plateformes BIG DATA au détriment de présentation et d'analyses de cas d'usages.

Céline P. 10/12/2018
4 / 5
Cette formation n'est sans doute pas complètement adaptée à mon profil. Un peu trop de technique et de comparaison des différents outils entre eux au détriment d'une approche plus méthodologique à partir d'exemples de besoins métier. D'ailleurs, l'intitulé de la formation est un peu trompeur sur ce sujet. Je n'ai pas retrouvé dans le contenu du cours les aspects méthodologiques que j'a

Benoit H. 10/12/2018
5 / 5
Je voulais avoir un vernis théorique solide en Big Data a l'issue de la formation, et cet objectif est bien rempli. Peut-être que quelques exercices supplémentaires m'auraient permis d'être encore plus confiant sur la mise en oeuvre, mais j'avoue que sur une semaine, le contenu est déjà très dense.

David S. 03/12/2018
3 / 5
Le contenu théorique (encyclopédique) est de grande qualité, mais nous n'avons pas pu faire des exercices nous permettant d'appréhender concrètement une analyse "BigData" telle qu'on l'imagine. Il y avait un manque de démonstrations "pratiques" et les nombreux plantages logiciels n'ont rien arrangé pour les quelques démonstrations. Du coup, le cours théorique (je répète de très

Cyril R. 03/12/2018
4 / 5
Contenu en accord à mon attente, qui était de comprendre et de me familiariser avec l'écosystème big data, mais peut être un peu trop théorique. La partie infrastructure / architecture me semble un peu trop prépondérante par rapport à la partie logicielle. J'aurais aimé passer plus de temps sur des exercices, mais je suis conscient qu'il aurait vraisemblablement fallut prévoir plus de temps de format

fabien v. 03/12/2018
4 / 5
Cours très interessant pour comprendre le fonctionnement de l'ensemble de l'éco système big data. J'aurais aimé plus de pratique et développé plus la partie sur l'analyse de donnée (machine learning notamment)

Pierre G. 03/12/2018
4 / 5
Peu d'exercices. Cours principalement descendant, longues sessions d'informations sur logiciels/modules/etc. (mode catalogue). Quelques exercices qui consistent à recopier des lignes de codes. On ne comprend pas toujours bien l'objectif recherché. Concevoir des exercices plus interactifs avec moins de technique, la découverte d'outils que l'on puisse mettre en oeuvre et plus d'exemples d'applications. Le cours permet d'a
Avis client 4,2 / 5

Les avis client sont issus des feuilles d’évaluation de fin de formation. La note est calculée à partir de l’ensemble des avis datant de moins de 12 mois.

Pour vous inscrire

Cliquez sur la ville, puis sur la date de votre choix.
[+]
PARIS
[+]
AIX
[+]
ANGERS
[+]
BORDEAUX
[+]
BRUXELLES
[+]
DIJON
[+]
GENEVE
[+]
GRENOBLE
[+]
LILLE
[+]
LIMOGES
[+]
LUXEMBOURG
[+]
LYON
[+]
MONTPELLIER
[+]
NANCY
[+]
NANTES
[+]
NIORT
[+]
ORLEANS
[+]
REIMS
[+]
RENNES
[+]
ROUEN
[+]
SOPHIA-ANTIPOLIS
[+]
STRASBOURG
[+]
TOULON
[+]
TOULOUSE
[+]
TOURS

Horaires

Les cours ont lieu de 9h à 12h30 et de 14h à 17h30.
Les participants sont accueillis à partir de 8h45.
Pour les stages pratiques de 4 ou 5 jours, les sessions se terminent à 15h30 le dernier jour.