ORSYS formation
NOUS CONTACTER - +33 (0)1 49 07 73 73
NOUS CONTACTER - 📞 +33 (0)1 49 07 73 73    espace pro ESPACE PRO     inscription formation orsys S'INSCRIRE     drapeau francais   drapeau anglais
Nos domaines de formation :
Toutes nos formations Big Data, NoSQL

Formation Big Data, méthodes et solutions pratiques pour l'analyse des données

4,4 / 5
Stage pratique
Best
Durée : 5 jours
Réf : BID
Prix  2019 : 3090 € H.T.
Pauses et déjeuners offerts
  • Programme
  • Cycles certifiants
  • Participants / Prérequis
  • Intra / sur-mesure
  • avis vérifiés
Programme

Ce stage vous permettra de comprendre les enjeux et les apports du Big Data ainsi que les technologies pour le mettre en œuvre. Vous apprendrez à intégrer des volumétries massives de données structurées et non structurées via un ETL, puis à les analyser grâce à des modèles statistiques et des dashboards dynamiques.

Objectifs pédagogiques

  • Comprendre les concepts et l'apport du Big Data par rapport aux enjeux métiers
  • Comprendre l'écosystème technologique nécessaire pour réaliser un projet Big Data
  • Acquérir les compétences techniques pour gérer des flux de données complexes, non structurés et massifs
  • Implémenter des modèles d'analyses statistiques pour répondre aux besoins métiers
  • Appréhender un outil de data visualisation pour restituer des analyses dynamiques

Exercice

Mettre en place une plateforme Hadoop et ses composants de base, utiliser un ETL pour gérer les données, créer des modèles d'analyse et dashboards.
PROGRAMME DE FORMATION

Comprendre les concepts et les enjeux du Big Data

  • Origines et définition du Big Data.
  • Les chiffres clés du marché dans le monde et en France.
  • Les enjeux du Big Data : ROI, organisation, confidentialité des données.
  • Un exemple d'architecture Big Data.

Les technologies du Big Data

  • Description de l'architecture et des composants de la plateforme Hadoop.
  • Les modes de stockage (NoSQL, HDFS).
  • Principes de fonctionnement de MapReduce, Spark, Storm...
  • Principales distributions du marché (Hortonworks, Cloudera, MapR, Elastic Map Reduce, Biginsights).
  • Installer une plateforme Hadoop.
  • Les technologies du datascientist.
  • Présentation des technologies spécifiques pour le Big Data (Tableau, Talend, Qlikview ...).

Exercice
Installation d'une plateforme Big Data Hadoop (via Cloudera QuickStart ou autre).

Gérer les données structurées et non structurées

  • Principes de fonctionnement de Hadoop Distributed File System (HDFS).
  • Importer des données externes vers HDFS.
  • Réaliser des requêtes SQL avec HIVE.
  • Utiliser PIG pour traiter la donnée.
  • Le principe des ETL (Talend...).
  • Gestion de streaming de données massive (NIFI, Kafka, Spark, Storm...)

Exercice
Implémentation de flux de données massives.

Technique et méthodes Big data analytics

  • Machine Learning, une composante de l'intelligence artificielle.
  • Découvrir les trois familles : Régression, Classification et Clustering.
  • La préparation des données (data preparation, feature engineering).
  • Générer des modèles en R ou Python.
  • Ensemble Learning.
  • Découvrir les outils du marché : Jupyter Notebook, Dataïku, Amazon Machine Learning...

Exercice
Mise en place d'analyses avec une des outils étudiés.

Data visualisation et cas d'usage concrets

  • Définir le besoin de la data visualisation.
  • Analyse et visualisation des données.
  • Peut concerner tous les types de données dans la DataViz ?
  • Les outils DataViz du marché.

Exercice
Installation et utilisation d'un outil de Data Visualisation pour constituer des analyses dynamiques.

Conclusion

  • Ce qu'il faut retenir.
  • Synthèse des bonnes pratiques.
  • Bibliographie.
Cycles certifiants
Participants / Prérequis

» Participants

Dataminers, chargés d'études statistiques, développeurs, chefs de projet, consultants en informatique décisionnelle.

» Prérequis

Connaissances de base des modèles relationnels, des statistiques et des langages de programmation. Connaissances de base des concepts de la Business Intelligence.
Intra / sur-mesure

Demande de devis intra-entreprise
(réponse sous 48h)

Vos coordonnées

En cochant cette case, j’atteste avoir lu et accepté les conditions liées à l’usage de mes données dans le cadre de la réglementation sur la protection des données à caractère personnel (RGPD).
Vous pouvez à tout moment modifier l’usage de vos données et exercer vos droits en envoyant un email à l’adresse rgpd@orsys.fr
En cochant cette case, j’accepte de recevoir les communications à vocation commerciale et promotionnelle de la part d’ORSYS Formation*
Vous pouvez à tout moment vous désinscrire en utilisant le lien de désabonnement inclus dans nos communications.
* Les participants inscrits à nos sessions de formation sont également susceptibles de recevoir nos communications avec la possibilité de se désabonner à tout moment.
Avis vérifiés
picto avis vérifiés
Fabrice C. 15/07/2019
4 / 5
Ensemble de la formation très orienté technique. Peu de temps pour appréhender les concepts.

Nan K. 15/07/2019
4 / 5
une vision globale sur différentes phase de big data et manipulation des différents outils pendant les TPs

Stéphane M. 15/07/2019
5 / 5
Contenu très condensé, intensif et très intéressant Formateur très pédagogue et clair dans ses explications

Christophe T. 15/07/2019
5 / 5
Difficile de tout voir en 5 jours mais très bien pour un data analyst/scientist n'ayant pas cotoyé les environnement distributé.

Amandine D. 01/07/2019
5 / 5
C'était top. Réponses à toutes les questions même problématique lié à notre environnement professionnel. NB : Pour Orsys la version papier du support très mal imprimé, illisible sur les parties claires, mais heureusement version électronique

RANDA B. 01/07/2019
5 / 5
Très bonne formation, satisfaite, formateurs très pédagogues.

STEPHANE L. 01/07/2019
5 / 5
Le contenu et la pédagogie sont au rendez vous ! La formation répond aux attentes.

NGUYEN 01/07/2019
4 / 5
Exercices parfois fois pas assez documentés, nécessitant un bon niveau de développement. Décalage entre les supports de cours et les exercices.

CORINNE R. 01/07/2019
4 / 5
Préciser que les compétences Linux sont nécessaires Un correctif détaillé des codes des exercices faciliterait la pratique des profils moins techniques Actualisation de certains éléments du cours à envisager car ce domaine évolue très vite Eléments à compléter, approfondir sur les techniques accessibles dans les grandes entreprises Sécurité et RGPD à intégrer

benjamin p. 01/07/2019
5 / 5
Très bon intervenant petit bémol cependant il est compliqué de monter un cluster hadoop sans intervention extérieure après cette formation

Rémy H. 01/07/2019
5 / 5
Stage généraliste sur l'environnement du big data et suffisamment technique pour compléter une première expérience dans le domaine.

Vincent B. 01/07/2019
5 / 5
Laurent est très pédagogue et maîtrise parfaitement son sujet. Il sait très bien s'adapter à son auditoire, même hétérogène. Le sujet étant très vaste, les journées sont bien remplies. De ce fait, les exercices sont très dirigés et ne laissent pas trop la place à la réflexion, ce qui n'est pas forcément un problème, surtout pour des profiles non techniques.

Clara J. 17/06/2019
4 / 5
Trop de temps accordé à la partie Hadoop vs data science et visu Pour la partie pratique d'hadoop, n'est pas très adpaté quand on n'a pas de pre-requis en code : il faudrait une explication pour chaque étape de code (à quoi cela sert), comme cela a été fait par le deuxième formateur lors de la découverte de spark. Par ailleurs, le premier formateur regardant son portable pendant que nous devions coder,

sebastien g. 17/06/2019
5 / 5
bon panel de l'/ecosystemes autour bigdata

Aubin A. 17/06/2019
3 / 5
je pense que le big data est compris dans 4 grand domaines ( stockage, processing, machine Learning, visualisation) certaines partie mériteraient d'être plus approfondis.

Martin N. 17/06/2019
4 / 5
Trop de temps passé sur la partie Machine. Un long exercice commun aurait été idéal.

D. 17/06/2019
5 / 5
Très bonne formation. La formatrice connaît très bien son sujet et est très pédagogue.

Olivier B. 17/06/2019
5 / 5
Il manque un exercice avec de gros volumes (> 50 millions de lignes par exemple pour bine sentir l'intérêt des technos)

David P. 17/06/2019
4 / 5
La mise en œuvre des exercice nécessite 50 % de préparation (téléchargements, installation...) qui n'est pas le cœur de ce que nous sommes venus apprendre.

Laurence J. 17/06/2019
4 / 5
Beaucoup d'information dans une formation dense donc on ne rentre pas trop dans le détail de chaque sujet, d'autant que l'écosystème est large. Elle balaye un scope large donne une 1ère vision de l'état de l'art, même si elle est très (trop ?) technique pour des non développeurs. Une correction commentée des exercices serait un plus (pour les non développeurs). J'ai aussi appr[eacute
Avis client 4,4 / 5

Les avis client sont issus des feuilles d’évaluation de fin de formation. La note est calculée à partir de l’ensemble des avis datant de moins de 12 mois.

Pour vous inscrire

Cliquez sur la ville, puis sur la date de votre choix.
[+]
PARIS
[+]
AIX
[+]
ANGERS
[+]
BORDEAUX
[+]
BRUXELLES
[+]
DIJON
[+]
GENEVE
[+]
GRENOBLE
[+]
LILLE
[+]
LIMOGES
[+]
LUXEMBOURG
[+]
LYON
[+]
MONTPELLIER
[+]
NANCY
[+]
NANTES
[+]
NIORT
[+]
ORLEANS
[+]
REIMS
[+]
RENNES
[+]
ROUEN
[+]
SOPHIA-ANTIPOLIS
[+]
STRASBOURG
[+]
TOULON
[+]
TOULOUSE
[+]
TOURS

Horaires

Les cours ont lieu de 9h à 12h30 et de 14h à 17h30.
Les participants sont accueillis à partir de 8h45.
Pour les stages pratiques de 4 ou 5 jours, les sessions se terminent à 15h30 le dernier jour.
En poursuivant votre navigation, vous acceptez l’utilisation de cookies nous permettant de vous proposer des offres correspondant à vos centres d’intérêt.
En savoir plus sur l’usage des cookies…   ✖ Fermer
linkedin orsys
twitter orsys
it! orsys
instagram orsys
pinterest orsys
facebook orsys
youtube orsys