> formation Technologies numériques > formation Big Data, Intelligence Artificielle > formation Big Data, NoSQL > formation Parcours certifiant Data Scientist

ERROR Avis : La référence d'objet n'est pas définie à une instance d'un objet.
Toutes nos formations Big Data, NoSQL

Formation Parcours certifiant Data Scientist
Bloc de compétences d'un Titre RNCP

Cours de synthèse
Durée : 15 jours
Réf : XNI
Prix  2021 : 7490 € H.T.
Pauses et déjeuners offerts
Financements
CPF
  • Programme
  • Composition
  • Participants / Prérequis
Programme

Ce parcours de formation représente le quatrième bloc de compétences du titre RNCP de niveau 7 (Bac +5) "Expert en informatique et systèmes d’information" reconnu par l'État. L'ensemble de ces formations vous permettra de comprendre les statistiques descriptives et le traitement des données associées. Vous apprendrez aussi comment gérer un projet big data et à comprendre le rôle stratégique de la valeur des données pour l’entreprise.

Objectifs pédagogiques

À l’issue de la formation, le participant sera en mesure de :
  • Comprendre l'intérêt de la statistique descriptive
  • Traitement de données et analyse statistique avec R
  • Comprendre l'intérêt de l’approche data mining
  • Comprendre l'écosystème technologique nécessaire pour réaliser un projet big data
  • Comprendre le rôle stratégique de la valeur des données pour l'entreprise

CPF

Le financement de cette formation peut être assuré par votre CPF (www.moncompteformation.gouv.fr) et cofinancé par différents organismes selon votre situation (votre entreprise, Pôle Emploi, votre région...). Pour toute question, contactez-nous par mail cpf@orsys.fr.

Certification

Chaque bloc de compétences est validé au travers d'un examen écrit sous forme d'étude de cas.
PROGRAMME DE FORMATION

Traitement statistique des données à une dimension

  • Type de données : qualitative ou quantitative.
  • Données avec effectif : calcul de fréquences et interprétation.
  • Tri et traitement des données : mise en forme statistique de différents exemples de données brutes.
  • Représentations graphiques.
  • Paramètres de position : moyenne, mode, médiane.
  • Les paramètres de dispersion : étendue, quantiles, décile, variance.
  • La variance : une moyenne "d'écarts".

Exercice
Transformation, tri et représentation des données. Mesure de leur dispersion.

Objets et notions de programmation R

  • Les objets de type vecteurs, matrix, array, factor, data.frame, list.
  • Manipulation des objets, classe d'objet, fonctions spécifiques, jointure.
  • Sauvegarde, suppression de mémoire.
  • Notions de boucle (for et while), condition (if), switch.

Exercice
Manipulation des types d'objets.

Les techniques de l’approche data mining

  • Méthode basée sur la classification : identification de groupes d’individus statistiques.
  • Méthode par association : mise en évidence d’une cause et d’une conséquence.
  • Méthode de l’estimation : complément d’un effectif ou d’une fréquence d’un jeu de données.
  • Apports du data mining pour le traitement des grandes volumétries de données.
  • Méthode de segmentation : définition de critères, extension de la méthode de classification et principe des k-means.
  • Méthode de prévision : importance de la temporalité et des hypothèses.

Travaux pratiques
Appréhender les différentes méthodes en fonction des besoins exprimés

Les technologies du big data

  • Description de l'architecture et des composants de la plateforme Hadoop.
  • Les modes de stockage (NoSQL, HDFS).
  • Principes de fonctionnement de MapReduce, Spark, Storm...
  • Principales distributions du marché (Hortonworks, Cloudera, MapR, Elastic Map Reduce, Biginsights).
  • Installer une plateforme Hadoop.
  • Les technologies du data scientist.
  • Présentation des technologies spécifiques pour le big data (Tableau, Talend, Qlikview...).

Exercice
Installation d'une plateforme big data Hadoop (via Cloudera QuickStart ou autre).

Démarche de gestion de la qualité des données

  • Périmètre de la démarche qualité.
  • Niveau d'approche et de granularité.
  • La place de la qualité dans la démarche de gouvernance.
  • Les acteurs et l'organisation. L'exemple COBIT.
  • Mise en œuvre de la démarche "projet".
  • Le coût de la non qualité

Etude de cas
Les 10 actions à lancer par le comité de gouvernance.

Composition
Participants / Prérequis

» Participants

Toute personne souhaitant apprendre la sécurité des systèmes d’information.

» Prérequis

Être titulaire d'un diplôme de niveau 6 (Bac +3) certifié par l'État (licence, titre professionnel...).
Intra / sur-mesure

Demande de devis intra-entreprise
(réponse sous 48h)

Vos coordonnées

En cochant cette case, j’atteste avoir lu et accepté les conditions liées à l’usage de mes données dans le cadre de la réglementation sur la protection des données à caractère personnel (RGPD).
Vous pouvez à tout moment modifier l’usage de vos données et exercer vos droits en envoyant un email à l’adresse rgpd@orsys.fr
En cochant cette case, j’accepte de recevoir les communications à vocation commerciale et promotionnelle de la part d’ORSYS Formation*
Vous pouvez à tout moment vous désinscrire en utilisant le lien de désabonnement inclus dans nos communications.
* Les participants inscrits à nos sessions de formation sont également susceptibles de recevoir nos communications avec la possibilité de se désabonner à tout moment.

Pour vous inscrire

Ce parcours est composé d’un ensemble de modules. Les dates indiquées ci-dessous correspondent aux premières sessions possibles du parcours.

[-]
PARIS
15 novembre 2021 *
* Session garantie

Pour vous inscrire : nous consulter

Horaires

Les cours ont lieu de 9h à 12h30 et de 14h à 17h30.
Les participants sont accueillis à partir de 8h45.
Pour les stages pratiques de 4 ou 5 jours, les sessions se terminent à 15h30 le dernier jour.