LEARNING
FOR SUCCESS*


> formation Technologies numériques > formation Big Data, Intelligence Artificielle > formation Big Data, NoSQL > formation Cycle certifiant Data Scientist
Toutes nos formations Big Data, NoSQL

Formation Cycle certifiant Data Scientist

Cycle Certifiant
Nouvelle édition
Durée : 15 jours
Réf : KDP
Prix  2021 : 7490 € H.T.
Remises non applicables
Pauses et déjeuners offerts
  • Programme
  • Composition
  • Participants / Prérequis
  • Intra / sur-mesure
Programme

La "science des données" nécessite des compétences spécifiques afin de prévoir le comportement des clients ou anticiper des tendances. Ce cycle Data Scientist vous apportera les meilleures pratiques en vigueur, et vous permettra de mettre en œuvre les méthodes et outils destinés à "faire parler les données".

Objectifs pédagogiques

  • Comprendre l’importance stratégique des données dans l'entreprise
  • Comprendre et mettre en pratique des modèles statistiques
  • Appliquer les techniques de modélisation du Data Mining
  • Maîtriser les outils et les pratiques d'analyse des données propres au Big Data

Méthodes pédagogiques

Le socle des connaissances en statistiques est fondamental. Les stages STA et TDA doivent être suivis avant les stages DMP et BID. Pas d'autres contraintes sur le suivi des cours pendant ce cycle.
PROGRAMME DE FORMATION

La démarche qualité des données

  • Rôle stratégique des données pour l'entreprise. État des lieux sur la qualité des données.
  • Évaluer et contrôler la qualité des données des entreprises.
  • Cycle de vie des données : archivage de base de données. Confidentialité.
  • Présentation de l’offre des outils d’évaluation de la qualité.

Travaux pratiques
Arriver à un consensus sur la qualité des données. Lien qualité des données et aide à la décision.

L'essentiel des modèles statistiques

  • Fondamentaux de la statistique descriptive.
  • Démarche et modélisation d'une analyse statistique.
  • Paramètres de position et de dispersion.
  • Tests et intervalle de confiance.
  • Panorama des outils.

Travaux pratiques
Étude d'une population et dimensionnement d'un échantillon. Modélisation statistique d'un phénomène. Calcul de paramètres de position et de dispersion sur différents échantillonnages.

Environnement R pour le traitement des données

  • Présentation du logiciel R et des environnements de développement dédiés.
  • Créer des programmes d’analyse statistique avec R.
  • Gestion des objets, classes d’objets et gestion de la mémoire.
  • Les fonctions d’édition et de visualisation des données de R. Les graphes.

Travaux pratiques
Installation et manipulation de la console R. Développement de programmes. Utilisation des packages de représentation graphique.

Data Mining par la pratique

  • L'organisation d'un projet Data Mining.
  • Les techniques : classification, association, segmentation. Les grosses volumétries.
  • Méthodes descriptives, prédictives et classification. Arbres de décisions. Réseaux de neurones. Méthodes supervisées.
  • La création des tableaux de bord : le scoring, le géomarketing.
  • Le traitement des données qualitatives et textuelles.

Travaux pratiques
Mise en œuvre de la démarche : analyse de données et construction de reporting pour l’aide à la décision.

Big Data, analyse des données massives

  • Origines et définition du Big Data : la BI face à la croissance et à la diversité des données.
  • Les technologies du Big Data.
  • Gérer les données structurées et non structurées.
  • Les méthodes d'analyse des données pour le Big Data.
  • Data visualisation et cas d'usage concrets.

Travaux pratiques
Installation d'une plateforme Big Data. Talend For Big Data, implémentation de flux de données. Mise en place d'analyses avec le logiciel R.


Journée de certification

Cette journée est destinée à valider les connaissances acquises au cours du cycle certifiant Data Scientist. Les compétences validées portent sur la modélisation statistique pour réaliser la fouille des données (Data Mining) et sur les connaissances connexes en matière de "Data Quality" et de technologies "Big Data".

Certification

Dans le cadre de cette journée, les participants auront une étude de cas à analyser, des conclusions à choisir sur les questionnaires proposés et des travaux pratiques à réaliser.
PROGRAMME DE FORMATION

Présentation des épreuves

  • Rappels sur les points essentiels vus pendant le cycle certifiant et sur le rôle du Data Scientist.
  • Présentation des épreuves écrites, orales et des travaux pratiques (documents ressources, durée, plan de passage etc.).
  • Echanges avec l'intervenant.

Epreuve écrite

  • Connaissances sur l’ensemble des stages du cycle certifiant.
  • Étude de cas à partir d'une problématique d'entreprise faisant appel aux différents aspects du cycle certifiant.
  • Épreuve sous forme de questionnaire à choix multiple.

Travaux pratiques

  • Mise en œuvre d’un programme R avec R-Studio.
  • Manipulation de bibliothèques statistiques.
  • Représentation graphique.
Composition
Participants / Prérequis

» Participants

Data Miner, Data Scientist, analyste, statisticien, tout acteur ayant à consolider et faire valider ses connaissances pour être reconnu Data Scientist.

» Prérequis

Connaissances de base en mathématiques et statistiques (ou équivalentes au cours Statistiques descriptives, introduction (réf. UES)).
Intra / sur-mesure

Demande de devis intra-entreprise
(réponse sous 48h)

Vos coordonnées

En cochant cette case, j’atteste avoir lu et accepté les conditions liées à l’usage de mes données dans le cadre de la réglementation sur la protection des données à caractère personnel (RGPD).
Vous pouvez à tout moment modifier l’usage de vos données et exercer vos droits en envoyant un email à l’adresse rgpd@orsys.fr
En cochant cette case, j’accepte de recevoir les communications à vocation commerciale et promotionnelle de la part d’ORSYS Formation*
Vous pouvez à tout moment vous désinscrire en utilisant le lien de désabonnement inclus dans nos communications.
* Les participants inscrits à nos sessions de formation sont également susceptibles de recevoir nos communications avec la possibilité de se désabonner à tout moment.

Ce parcours est composé d’un ensemble de modules. Les dates indiquées ci-dessous correspondent aux premières sessions possibles du parcours.

[-]
PARIS
04 janvier 2021
29 mars 2021
07 juin 2021

Pour vous inscrire : Nous consulter