Nos domaines de formation :

Formation Cycle certifiant Data Scientist

Cycle Certifiant
meilleur vente
Durée : 12 jours
Réf : KDS
Prix  2019 : 5770 € H.T.
Remises non applicables
Pauses et déjeuners offerts
  • Programme
  • Composition
  • Participants / Prérequis
  • Intra / sur-mesure
Programme

La "science des données" nécessite des compétences spécifiques afin de prévoir le comportement des clients ou anticiper des tendances. Ce cycle Data Scientist vous apportera les meilleures pratiques en vigueur, et vous permettra de mettre en œuvre les méthodes et outils destinés à "faire parler les données".

Objectifs pédagogiques

  • Comprendre le rôle stratégique des données dans l'entreprise et savoir maîtriser leur qualité
  • Comprendre et mettre en pratique l'essentiel des modèles statistiques
  • Mettre en pratique les techniques de modélisation du Data Mining
  • Maîtriser les outils et pratiques d'analyse des données propres au Big Data

Méthodes pédagogiques

Le socle des connaissances en statistiques est fondamental. Le stage STA doit être suivi avant le séminaire DMI et le stage BID. Pas d'autres contraintes sur le suivi des cours pendant ce cycle.
PROGRAMME DE FORMATION

Présentation de la gouvernance des données

  • Rôle stratégique des données pour l'entreprise.
  • Etat des lieux sur la qualité des données. Définition des notions "Donnée" et "Information".
  • Evaluer la qualité des données des entreprises. Réconciliation des données.
  • Contrôle de qualité et bonnes pratiques.
  • Cycle de vie des données : archivage de base de données. Confidentialité des données.
  • Présentation des offres de MDM.

Travaux pratiques
Arriver à un consensus sur la qualité des données. Lien qualité des données et solvabilité II.

L'essentiel des modèles statistiques

  • Fondamentaux de la statistique descriptive.
  • Démarche et modélisation d'une analyse statistique.
  • Paramètres de position et de dispersion.
  • Analyses prédictives : mise en place d'un modèle de régression linéaire.
  • Tests et intervalle de confiance. Valider la précision d'une estimation.
  • Panorama des outils (R, SAS...).

Travaux pratiques
Etude d'une population et dimensionnement d'un échantillon. Modélisation statistique d'un phénomène. Calcul de paramètres de position et de dispersion sur différents échantillonnages.

Data Mining, extraction de connaissances à partir de données brutes

  • Définition et finalité du Data Mining (DM).
  • Les méthodes prédictives et descriptives. Les arbres de décisions. Les réseaux de neurones.
  • La méthode descriptive du clustering.
  • Exemples d'application du DM : le scoring, le géomarketing.
  • Méthodologie de projet. Les outils du marché.

Travaux pratiques
Présentation d'applications du clustering. Mise en œuvre de la méthode de scoring. Cas pratique d'utilisation de géomarketing.

Big Data, analyse des données massives

  • Origines et définition du Big Data : la BI face à la croissance et à la diversité des données.
  • Les technologies du Big Data.
  • Gérer les données structurées et non structurées.
  • Les méthodes d'analyse des données pour le Big Data.
  • Data visualisation et cas d'usage concrets.

Travaux pratiques
Installation d'une plateforme Big Data. Talend For Big Data, implémentation de flux de données. Mise en place d'analyses avec le logiciel R.


Journée de certification

Cette journée est destinée à valider les connaissances acquises au cours du cycle certifiant Data Scientist. Les compétences validées portent sur la modélisation statistique pour réaliser la fouille des données (Data Mining) et sur les connaissances connexes en matière de "Data Quality" et de technologies "Big Data".

Certification

Dans le cadre de cette journée, les participants auront une étude de cas à analyser et des conclusions à choisir sur les questionnaires proposés.
PROGRAMME DE FORMATION

Présentation des épreuves

  • Rappels sur les points essentiels vus pendant le cycle certifiant et sur le rôle du Data Scientist.
  • Présentation des épreuves écrites et orales (documents ressources, durée, plan de passage etc.).
  • Echanges avec l'intervenant.

Epreuve écrite : savoir

  • Questionnaire de connaissances sur les principaux stages du cycle certifiant.
  • Questionnaire à choix multiple.

Epreuve écrite : savoir- faire

  • Prise de connaissance de l'étude de cas (une problématique d'entreprise).
  • Questionnaire à partir de l'étude de cas.
Composition
Participants / Prérequis

» Participants

Data Miner, Data Scientist, analyste, responsable de reporting décisionnel, statisticien, tout acteur ayant à consolider et faire valider ses connaissances pour être reconnu Data Scientist.

» Prérequis

Connaissances de base en mathématiques / logique (cumul, pourcentage, fonctions conditionnelles).
Intra / sur-mesure
Programme standard     Programme sur-mesure
Oui / Non

Vos coordonnées

Pour vous inscrire

Cliquez sur la ville, puis sur la date de votre choix.
[-]
PARIS

Horaires

Les cours ont lieu de 9h à 12h30 et de 14h à 17h30.
Les participants sont accueillis à partir de 8h45.
Pour les stages pratiques de 4 ou 5 jours, les sessions se terminent à 15h30 le dernier jour.
Thème associé