Nos solutions de formations distancielles et présentielles éligibles au dispositif FNE-Formation 100% financées En savoir plus
Une formation en toute sécurité
Vous avez le choix avec ORSYS !
La formation distancielle
1800 classes à distance,
e-learning, microlearning,
certifications...
En savoir plus
Le présentiel sécurisé
Dispositif sanitaire totalement
déployé dans tous nos centres
En savoir plus
ORSYS formation
NOUS CONTACTER - +33 (0)1 49 07 73 73
NOUS CONTACTER - 📞 +33 (0)1 49 07 73 73    espace pro ESPACE CLIENT     inscription formation orsys S'INSCRIRE     drapeau francais   drapeau anglais

Nos formations :

Toutes nos formations Big Data, NoSQL

Formation Big Data, méthodes et solutions pratiques pour l'analyse des données

4,4 / 5
Stage pratique
Best
Durée : 5 jours
Réf : BID
Prix  2020 : 3190 € H.T.
Pauses et déjeuners offerts
  • Programme
  • Cycles certifiants
  • Participants / Prérequis
  • Intra / sur-mesure
  • avis vérifiés
Programme

Ce stage vous permettra de comprendre les enjeux et les apports du Big Data ainsi que les technologies pour le mettre en œuvre. Vous apprendrez à intégrer des volumétries massives de données structurées et non structurées via un ETL, puis à les analyser grâce à des modèles statistiques et des dashboards dynamiques.

Objectifs pédagogiques

  • Comprendre les concepts et l'apport du Big Data par rapport aux enjeux métiers
  • Comprendre l'écosystème technologique nécessaire pour réaliser un projet Big Data
  • Acquérir les compétences techniques pour gérer des flux de données complexes, non structurés et massifs
  • Implémenter des modèles d'analyses statistiques pour répondre aux besoins métiers
  • Appréhender un outil de data visualisation pour restituer des analyses dynamiques

Exercice

Mettre en place une plateforme Hadoop et ses composants de base, utiliser un ETL pour gérer les données, créer des modèles d'analyse et dashboards.
PROGRAMME DE FORMATION

Comprendre les concepts et les enjeux du Big Data

  • Origines et définition du Big Data.
  • Les chiffres clés du marché dans le monde et en France.
  • Les enjeux du Big Data : ROI, organisation, confidentialité des données.
  • Un exemple d'architecture Big Data.

Les technologies du Big Data

  • Description de l'architecture et des composants de la plateforme Hadoop.
  • Les modes de stockage (NoSQL, HDFS).
  • Principes de fonctionnement de MapReduce, Spark, Storm...
  • Principales distributions du marché (Hortonworks, Cloudera, MapR, Elastic Map Reduce, Biginsights).
  • Installer une plateforme Hadoop.
  • Les technologies du datascientist.
  • Présentation des technologies spécifiques pour le Big Data (Tableau, Talend, Qlikview ...).

Exercice
Installation d'une plateforme Big Data Hadoop (via Cloudera QuickStart ou autre).

Gérer les données structurées et non structurées

  • Principes de fonctionnement de Hadoop Distributed File System (HDFS).
  • Importer des données externes vers HDFS.
  • Réaliser des requêtes SQL avec HIVE.
  • Utiliser PIG pour traiter la donnée.
  • Le principe des ETL (Talend...).
  • Gestion de streaming de données massive (NIFI, Kafka, Spark, Storm...)

Exercice
Implémentation de flux de données massives.

Technique et méthodes Big data analytics

  • Machine Learning, une composante de l'intelligence artificielle.
  • Découvrir les trois familles : Régression, Classification et Clustering.
  • La préparation des données (data preparation, feature engineering).
  • Générer des modèles en R ou Python.
  • Ensemble Learning.
  • Découvrir les outils du marché : Jupyter Notebook, Dataïku, Amazon Machine Learning...

Exercice
Mise en place d'analyses avec une des outils étudiés.

Data visualisation et cas d'usage concrets

  • Définir le besoin de la data visualisation.
  • Analyse et visualisation des données.
  • Peut concerner tous les types de données dans la DataViz ?
  • Les outils DataViz du marché.

Exercice
Installation et utilisation d'un outil de Data Visualisation pour constituer des analyses dynamiques.

Conclusion

  • Ce qu'il faut retenir.
  • Synthèse des bonnes pratiques.
  • Bibliographie.
Cycles certifiants
Participants / Prérequis

» Participants

Dataminers, chargés d'études statistiques, développeurs, chefs de projet, consultants en informatique décisionnelle.

» Prérequis

Connaissances de base des modèles relationnels, des statistiques et des langages de programmation. Connaissances de base des concepts de la Business Intelligence.
Intra / sur-mesure

Demande de devis intra-entreprise
(réponse sous 48h)

Vos coordonnées

En cochant cette case, j’atteste avoir lu et accepté les conditions liées à l’usage de mes données dans le cadre de la réglementation sur la protection des données à caractère personnel (RGPD).
Vous pouvez à tout moment modifier l’usage de vos données et exercer vos droits en envoyant un email à l’adresse rgpd@orsys.fr
En cochant cette case, j’accepte de recevoir les communications à vocation commerciale et promotionnelle de la part d’ORSYS Formation*
Vous pouvez à tout moment vous désinscrire en utilisant le lien de désabonnement inclus dans nos communications.
* Les participants inscrits à nos sessions de formation sont également susceptibles de recevoir nos communications avec la possibilité de se désabonner à tout moment.
Avis vérifiés
picto avis vérifiés
Yannick D. 12/10/2020
3 / 5
Un contenu de stage trop dense et peu de TP. Les VMs ne fonctionnaient pas et les TP n'étaient pas préparés. Le formateur maitrise son sujet mais ne maitrisait pas les TPs .

Florian D. 12/10/2020
3 / 5
Intervenant connaissant ses sujets malgré sa découverte en direct du diapo. Niveau des candidats assez bas pour les pré requis demandés et des difficultés pour vulgariser tous les termes. Très peu d'exercices fonctionnais du fait d'un mauvaise préparation des machines virtuelles. Des exercices présent sur internet aurait été plus pertinent.

m c. 12/10/2020
4 / 5
Absence de préparation des machines virtuelles correspondant au support des exercices. Perte de temps sur l'installation.

Mélissa S. 12/10/2020
4 / 5
Des soucis d'installation des applications et librairies à utiliser dans les TPs nous ont fait perdre beaucoup de temps normalement accordé à la réalisation des TPs. Dommage car le contenu était très intéressant.

Sarah D. 12/10/2020
4 / 5
Le référentiel Orsys mériterait d'être revu, un cours d'introduction ne devrait pas partir du pré-requis que java/sql/python/linux sont déjà maitrisés. Trop de techno vues, pas assez approfondies. En revanche le formateur est pédagogue et répond bien aux questions.

Cyrille M. 12/10/2020
4 / 5
Le volume théorie est très important, et une lecture simple de "slide" semble être donc rébarbative. Le formateur nous a fait partager sont expérience et cela est très bénéfique, mais les outils de BIG DATA sont nombreux, variés et pour certains libres de droit, ce qui de surcroit fait se perdre dans le méandres de ce domaine. Il se trouve également qu'une très grande majorité des TP

Guillaume P. 05/10/2020
5 / 5
Formation dense mais complète. Bravo à la formatrice pour la qualité des différentes sessions.

Andrey P. 05/10/2020
5 / 5
RAS. Nous avons eu du temps pour poser nos questions, tout était très clair. Je donne la note maximale

MARCEPOIL L. 05/10/2020
5 / 5
Contenu très complet avec beaucoup de sujets abordés. Formatrice très claire, très compétentes et agréable, merci ! Quelques fois les TP ont été réalisés rapidement voire trop rapidement lors du dernier jour faute de temps. Attention le contenu est très chargé, pourrait tenir sur 7 à 10 jours de formation.

Chimène F. 05/10/2020
4 / 5
les exercices font appel a différents cas d'usage et différents outils et langages. Pour un novice cette approche est chronophage, demande beaucoup d'effort et ne permet pas de prendre en main les concepts de bout en bout. il serait plus intéressant d'avoir un seul cas ou projet à dérouler tout au long du cours pour appréhender les différents concepts. La partie théorique peut être enrichie avec d'avantage

Bruno J. 05/10/2020
4 / 5
mes connaissances en bigdata étaient proches de zéro avant le stage et j'ai eu beaucoup de difficultés à faire certains exercices pour lesquels les étapes ne me semblent pas assez détaillée (par exemple exercice annexe 19).

BENZAZA 05/10/2020
5 / 5
Personnellement, vu la complexité et la diversité des éléments composants la formation (outils, technologies, concepts etc.), j'aurai aimé arrivé au final à un mini projet correspondant à un cas d'école complet, qui résume par la pratique l'essentiel de bout en bout.

Belkacem K. 05/10/2020
5 / 5
Les exercices sont nombreux et variés permettant d'utiliser un grand nombre d'outils liés aux technologies du big data. Le formateur vulgarise bien les concepts pour les rendre plus compréhensibles notamment pour les personnes qui ne sont pas informaticiens de base. Il est également très disponible pour répondre à nos questions et nous aider lors des exercices.

Fabien C. 05/10/2020
5 / 5
le support d'exercice pourrait être mieux structuré. Le passage entre sommaire, exercices et annexes n'est pas forcément évident

Victor M. 28/09/2020
4 / 5
Deux remarques : parfois le cours rentre trop dans les détails (la liste différents outils par exemple), on s'y perd un peu mais on comprend aussi que l'éco-système des solutions big data est très très large. L'autre c'est que les exercices ne sont pas assez "pratiques" (exemple du machine learning sur les maison où on ne peut pas tester ou visualiser le modèle, ou celui de la regression linéaire où l'

Nicolas N. 28/09/2020
4 / 5
Le contenu est conforme au descriptif de la formation. Il correspond bien à mes attentes pour cette formation.

mehdi m. 28/09/2020
5 / 5
Formation très intéressante. L'objectif personnel fixé au départ de la formation a été atteint voir dépassé.

Nathalie L. 28/09/2020
5 / 5
Parcours complet sur les méthodes et solutions, avec une approche très illustrée de cas concrets et du pourquoi des choses : très intéressant !

Benjamin F. 07/09/2020
4 / 5
Beaucoup d'informations en un temps record, difficile de tout assimiler et mettre en pratique directement lors des TP. Ces derniers sont denses et nécessitent des connaissances initiales en développement.

Florent D. 07/09/2020
5 / 5
Super formation et formatrice, très enrichissant.
Avis client 4,4 / 5

Les avis client sont issus des feuilles d’évaluation de fin de formation. La note est calculée à partir de l’ensemble des avis datant de moins de 12 mois.

CLASSE A DISTANCE

En inter et en intra-entreprise
Inscrivez-vous ou contactez-nous !

Pour vous inscrire

Cliquez sur la ville, puis sur la date de votre choix.
[+]
CLASSE A DISTANCE
[+]
PARIS
[+]
AIX
[+]
ANGERS
[+]
BORDEAUX
[+]
BRUXELLES
[+]
DIJON
[+]
GENEVE
[+]
GRENOBLE
[+]
LILLE
[+]
LIMOGES
[+]
LUXEMBOURG
[+]
LYON
[+]
MONTPELLIER
[+]
NANCY
[+]
NANTES
[+]
NIORT
[+]
ORLEANS
[+]
REIMS
[+]
RENNES
[+]
ROUEN
[+]
SOPHIA-ANTIPOLIS
[+]
STRASBOURG
[+]
TOULON
[+]
TOULOUSE
[+]
TOURS

Horaires

Les cours ont lieu de 9h à 12h30 et de 14h à 17h30.
Les participants sont accueillis à partir de 8h45.
Pour les stages pratiques de 4 ou 5 jours, les sessions se terminent à 15h30 le dernier jour.
En poursuivant votre navigation, vous acceptez l’utilisation de cookies nous permettant de vous proposer des offres correspondant à vos centres d’intérêt.
En savoir plus sur l’usage des cookies…   ✖ Fermer
linkedin orsys
twitter orsys
it! orsys
instagram orsys
pinterest orsys
facebook orsys
youtube orsys