> Formations > Technologies numériques > Big Data, Intelligence Artificielle > Big Data, NoSQL > Formation Big Data, état de l'art > Formations > Technologies numériques > Formation Big Data, état de l'art
Formation incontournable

Big Data, état de l'art

Big Data, état de l'art

Télécharger au format pdf Partager cette formation par e-mail 2


L'accroissement continuel des données numériques dans les organisations a conduit à l'émergence du Big Data. Ce concept recouvre les questions de stockage et de conservation de vastes quantités de données mais aussi celles liées au gisement potentiel de valeur que représentent ces masses d'informations. Ce séminaire présente les problèmes spécifiques du Big Data et les solutions techniques potentielles, de la gestion des données aux différents types de traitement.


Inter
Intra
Sur mesure

Séminaire en présentiel ou en classe à distance

Réf. BGA
Prix : 1990 € H.T.
  2j - 14h
Pauses-café et
déjeuners offerts




L'accroissement continuel des données numériques dans les organisations a conduit à l'émergence du Big Data. Ce concept recouvre les questions de stockage et de conservation de vastes quantités de données mais aussi celles liées au gisement potentiel de valeur que représentent ces masses d'informations. Ce séminaire présente les problèmes spécifiques du Big Data et les solutions techniques potentielles, de la gestion des données aux différents types de traitement.

Objectifs pédagogiques
À l’issue de la formation, le participant sera en mesure de :
  • Découvrir les principaux concepts du Big Data
  • Identifier les enjeux économiques
  • Évaluer les avantages et les inconvénients du Big Data
  • Comprendre les principaux problèmes et les solutions potentielles
  • Identifier les principales méthodes et champs d'application du Big Data
  • Appréhender les avantages et les contraintes du Big Data

Public concerné
Directeurs SI, Responsables SI, Chefs de projets, Architectes, Consultants ou toute personne amenée à participer à un projet Big Data.

Prérequis
Connaissances de base des architectures techniques.
Vérifiez que vous avez les prérequis nécessaires pour profiter pleinement de cette formation en faisant  ce test.

Programme de la formation

Introduction

  • Les origines du Big Data : un monde de données numériques, l'e-santé, chronologie.
  • Une définition par les quatre V : la provenance des données.
  • Une rupture : changements de quantité, de qualité, d'habitudes.
  • La valeur de la donnée : un changement d'importance.
  • La donnée en tant que matière première.
  • Le quatrième paradigme de la découverte scientifique.

Big Data : traitements depuis l'acquisition jusqu'au résultat

  • L'enchaînement des opérations. L'acquisition.
  • Le recueil des données : crawling, scraping.
  • La gestion de flux événementiels (Complex Event Processing, CEP).
  • L'indexation du flux entrant.
  • L'intégration avec les anciennes données.
  • La qualité des données : un cinquième V ?
  • Les différents types de traitement : recherche, apprentissage (Machine Learning, transactionnel, data mining).
  • D'autres modèles d'enchaînement : Amazon, e-Santé.
  • Un ou plusieurs gisements de données ? De Hadoop à l'in-memory.
  • De l'analyse de tonalité à la découverte de connaissances.

Relations entre Cloud et Big Data

  • Le modèle d'architecture des Clouds publics et privés.
  • Les services XaaS.
  • Les objectifs et avantages des architectures Cloud.
  • Les infrastructures.
  • Les égalités et les différences entre Cloud et Big Data.
  • Les Clouds de stockage.
  • Classification, sécurité et confidentialité des données.
  • La structure comme critère de classification : non structurée, structurée, semi-structurée.
  • Classification selon le cycle de vie : données temporaires ou permanentes, archives actives.
  • Difficultés en matière de sécurité : augmentation des volumétries, la distribution.
  • Les solutions potentielles.

Introduction à l'Open Data

  • La philosophie des données ouvertes et les objectifs.
  • La libération des données publiques.
  • Les difficultés de la mise en œuvre.
  • Les caractéristiques essentielles des données ouvertes.
  • Les domaines d'application. Les bénéfices escomptés.

Matériel pour les architectures de stockage

  • Les serveurs, disques, réseaux et l'usage des disques SSD, l'importance de l'infrastructure réseau.
  • Les architectures Cloud et les architectures plus traditionnelles.
  • Les avantages et les difficultés.
  • Le TCO. La consommation électrique : serveurs (IPNM), disques (MAID).
  • Le stockage objet : principe et avantages.
  • Le stockage objet par rapport aux stockages traditionnels NAS et SAN.
  • L'architecture logicielle.
  • Niveaux d'implantation de la gestion du stockage.
  • Le "Software Defined Storage".
  • Architecture centralisée (Hadoop File System).
  • L'architecture Peer-to-Peer et l'architecture mixte.
  • Les interfaces et connecteurs : S3, CDMI, FUSE, etc.
  • Avenir des autres stockages (NAS, SAN) par rapport au stockage objet.

Protection des données

  • La conservation dans le temps face aux accroissements de volumétrie.
  • La sauvegarde, en ligne ou locale ?
  • L'archive traditionnelle et l'archive active.
  • Les liens avec la gestion de hiérarchie de stockage : avenir des bandes magnétiques.
  • La réplication multisites.
  • La dégradation des supports de stockage.

Méthodes de traitement et champs d'application

  • Classification des méthodes d'analyse selon le volume des données et la puissance des traitements.
  • Hadoop : le modèle de traitement Map Reduce.
  • L'écosystème Hadoop : Hive, Pig. Les difficultés d'Hadoop.
  • OpenStack et le gestionnaire de données Ceph.
  • Le Complex Event Processing : un exemple ? Storm.
  • Du BI au Big Data.
  • Le décisionnel et le transactionnel renouvelés : les bases de données NoSQL.Typologie et exemples.
  • L'ingestion de données et l'indexation. Deux exemples : Splunk et Logstash.
  • Les crawlers Open Source.
  • Recherche et analyse : Elasticsearch.
  • L'apprentissage : Mahout. In-memory.
  • Visualisation : temps réel ou non, sur le Cloud (Bime), comparaison QlikView, Tibco Spotfire, Tableau.
  • Une architecture générale du data mining via le Big Data.

Cas d'usage à travers des exemples et conclusion

  • L'anticipation : besoins des utilisateurs dans les entreprises, maintenance des équipements.
  • La sécurité des personnes, détection de fraudes (postale, taxes), le réseau.
  • La recommandation. Analyses marketing et analyses d'impact.
  • Analyses de parcours. Distribution de contenu vidéo.
  • Le Big Data pour l'industrie automobile ? Pour l'industrie pétrolière ?
  • Faut-il se lancer dans un projet Big Data ?
  • Quel avenir pour les données ?
  • Gouvernance du stockage des données : rôle et recommandations, le Data Scientist, les compétences d'un projet Big Data.


Modalités d'évaluation
Le formateur évalue la progression pédagogique du participant tout au long de la formation au moyen de QCM, mises en situation, travaux pratiques…
Le participant complète également un test de positionnement en amont et en aval pour valider les compétences acquises.

Solutions de financement
Pour trouver la meilleure solution de financement adaptée à votre situation : contactez votre conseiller formation.
Il vous aidera à choisir parmi les solutions suivantes :
  • Le plan de développement des compétences de votre entreprise : rapprochez-vous de votre service RH.
  • Le dispositif FNE-Formation.
  • L’OPCO (opérateurs de compétences) de votre entreprise.
  • Pôle Emploi sous réserve de l’acceptation de votre dossier par votre conseiller Pôle Emploi.
  • Le plan de développement des compétences de votre entreprise : rapprochez-vous de votre service RH.
  • Le dispositif FNE-Formation.
  • L’OPCO (opérateurs de compétences) de votre entreprise.
  • Pôle Emploi sous réserve de l’acceptation de votre dossier par votre conseiller Pôle Emploi.

Avis clients
4,7 / 5
Les avis clients sont issus des évaluations de fin de formation. La note est calculée à partir de l’ensemble des évaluations datant de moins de 12 mois. Seules celles avec un commentaire textuel sont affichées.
BENOIT V.
07/04/22
5 / 5

Le contenu est parfaitement adapté à une première approche du domaine. L’intervenant apporte un éclairage lié à son expérience très intéressante.
FABRICE P.
06/04/22
5 / 5

tres bon formateur
NATHALIE C.
06/04/22
5 / 5

Correspond à ma demande initiale




Horaires
En présentiel, les cours ont lieu de 9h à 12h30 et de 14h à 17h30.
Les participants sont accueillis à partir de 8h45. Les pauses et déjeuners sont offerts.
En classe à distance, la formation démarre à partir de 9h.
Pour les stages pratiques de 4 ou 5 jours, quelle que soit la modalité, les sessions se terminent à 15h30 le dernier jour.

Dates et lieux
Pour vous inscrire, sélectionnez la ville et la date de votre choix.
Du 13 au 14 décembre 2022 *
FR
Paris La Défense
Session garantie
S’inscrire
Du 13 au 14 décembre 2022 *
FR
Classe à distance
Session garantie
S’inscrire
Du 6 au 7 avril 2023
FR
Nantes
S’inscrire
Du 13 au 14 avril 2023
FR
Toulouse
S’inscrire
Du 13 au 14 avril 2023
FR
Lyon
S’inscrire
Du 18 au 19 avril 2023
FR
Paris La Défense
S’inscrire
Du 18 au 19 avril 2023
FR
Classe à distance
S’inscrire
Du 11 au 12 mai 2023
FR
Aix-en-Provence
S’inscrire
Du 23 au 24 mai 2023
FR
Paris La Défense
S’inscrire
Du 23 au 24 mai 2023
FR
Classe à distance
S’inscrire
Du 25 au 26 mai 2023
FR
Lille
S’inscrire
Du 8 au 9 juin 2023
FR
Avignon
S’inscrire
Du 8 au 9 juin 2023
FR
Marseille
S’inscrire
Du 8 au 9 juin 2023
FR
Montpellier
S’inscrire
Du 8 au 9 juin 2023
FR
Sophia-Antipolis
S’inscrire
Du 8 au 9 juin 2023
FR
Toulon
S’inscrire
Du 8 au 9 juin 2023
FR
Angers
S’inscrire
Du 8 au 9 juin 2023
FR
Le Mans
S’inscrire
Du 8 au 9 juin 2023
FR
Nancy
S’inscrire
Du 8 au 9 juin 2023
FR
Orléans
S’inscrire
Du 8 au 9 juin 2023
FR
Reims
S’inscrire
Du 8 au 9 juin 2023
FR
Rouen
S’inscrire
Du 8 au 9 juin 2023
FR
Tours
S’inscrire
Du 15 au 16 juin 2023
FR
Bordeaux
S’inscrire
Du 15 au 16 juin 2023
FR
Limoges
S’inscrire
Du 15 au 16 juin 2023
FR
Niort
S’inscrire
Du 15 au 16 juin 2023
FR
Pau
S’inscrire
Du 15 au 16 juin 2023
FR
Brest
S’inscrire
Du 15 au 16 juin 2023
FR
Caen
S’inscrire
Du 15 au 16 juin 2023
FR
Mulhouse
S’inscrire
Du 15 au 16 juin 2023
FR
Rennes
S’inscrire
Du 15 au 16 juin 2023
FR
Strasbourg
S’inscrire
Du 29 au 30 juin 2023
FR
Clermont-Ferrand
S’inscrire
Du 29 au 30 juin 2023
FR
Dijon
S’inscrire
Du 29 au 30 juin 2023
FR
Grenoble
S’inscrire
Du 29 au 30 juin 2023
FR
Saint-Etienne
S’inscrire
Du 29 au 30 juin 2023
FR
Valence
S’inscrire
Du 4 au 5 juillet 2023
FR
Classe à distance
S’inscrire
Du 4 au 5 juillet 2023
FR
Paris La Défense
S’inscrire
Du 7 au 8 septembre 2023
FR
Toulouse
S’inscrire
Du 7 au 8 septembre 2023
FR
Lyon
S’inscrire
Du 19 au 20 septembre 2023
FR
Classe à distance
S’inscrire
Du 19 au 20 septembre 2023
FR
Paris La Défense
S’inscrire
Du 21 au 22 septembre 2023
FR
Nantes
S’inscrire
Du 5 au 6 octobre 2023
FR
Aix-en-Provence
S’inscrire
Du 19 au 20 octobre 2023
FR
Lille
S’inscrire
Du 14 au 15 novembre 2023
FR
Paris La Défense
S’inscrire
Du 14 au 15 novembre 2023
FR
Classe à distance
S’inscrire