> Formations > Technologies numériques > Intelligence Artificielle, Big Data > IA, Machine Learning, analyse de données > Formation Data Mining par la pratique > Formations > Technologies numériques > Formation Data Mining par la pratique

Formation : Data Mining par la pratique

Data Mining par la pratique

Télécharger au format pdf Partager cette formation par e-mail 2


Le Data Mining consiste à découvrir des modèles, des correspondances, des motifs dans un ensemble de données numériques ou qualitatives. Cette activité s'appuie sur une trousse à outils algorithmiques qui vous seront présentés dans ce cours. La démarche Data Mining sera illustrée sur plusieurs projets, en utilisant R.


Inter
Intra
Sur mesure

Cours pratique en présentiel ou en classe à distance

Réf. DMP
Prix : 2280 € H.T.
  3j - 21
Pauses-café et
déjeuners offerts




Le Data Mining consiste à découvrir des modèles, des correspondances, des motifs dans un ensemble de données numériques ou qualitatives. Cette activité s'appuie sur une trousse à outils algorithmiques qui vous seront présentés dans ce cours. La démarche Data Mining sera illustrée sur plusieurs projets, en utilisant R.

Objectifs pédagogiques
À l’issue de la formation, le participant sera en mesure de :
  • Comprendre l'intérêt de l’approche Data Mining
  • Traduire une problématique et savoir y répondre
  • Connaître les principales méthodes de Data Mining
  • Identifier et savoir utiliser les outils de Data Mining
  • Poser une problématique de Data Mining et rechercher la méthode appropriée
  • Être en capacité de restituer les résultats

Public concerné
Chargés d’études, responsables de projet analyse de données, responsables Infocentre, Marketing ou Qualité, utilisateurs et gestionnaires métiers de bases de données, futurs Data Scientist.

Prérequis
Connaissances de base en statistiques ou connaissances équivalentes à celles apportées par le stage "Statistiques descriptives, introduction" (réf. UES).
Vérifiez que vous avez les prérequis nécessaires pour profiter pleinement de cette formation en faisant  ce test.

Programme de la formation

Le projet de Data Mining

  • La problématique du Data Scientist : de la donnée à l’information.
  • Le vocabulaire et les concepts.
  • L’exploration descriptive du jeu de données.
  • Les métadonnées pour le suivi du projet de Data Mining.
  • Rappels sur le logiciel R.
Travaux pratiques
Utilisation de R. Caractérisation descriptive, définition et saisie des métadonnées d'un jeu de données.

Les techniques de l’approche Data Mining

  • Méthode basée sur la classification : identification de groupes d’individus statistiques.
  • Méthode par association : mise en évidence d’une cause et d’une conséquence.
  • Méthode de l’estimation : complément d’un effectif ou d’une fréquence d’un jeu de données.
  • Apports du Data Mining pour le traitement des grandes volumétries de données.
  • Méthode de segmentation : définition de critères, extension de la méthode de classification et principe des k-means.
  • Méthode de prévision : importance de la temporalité et des hypothèses.
Travaux pratiques
Appréhender les différentes méthodes en fonction des besoins exprimés.

Les outils statistiques

  • Méthodes descriptives : corrélation, classification, réseaux de Kohonen, règles d’association.
  • Méthodes prédictives : régression, arbres de décision, réseaux de neurones, les K plus proches voisins.
  • Mise en œuvre de classification par k-means et CAH (Classification Ascendante Hiérarchique).
  • Principe des méthodes supervisées.
Travaux pratiques
Mise en pratique des différentes méthodes sous R.

La visualisation des données

  • Les objectifs de la visualisation des données.
  • Les différents types de représentations de données quantitatives.
  • Concevoir des tableaux de bord.
Travaux pratiques
Création d’un tableau de bord avec R en utilisant des données quantitatives. Représentation de données quantitatives et de données qualitatives avec R.

Analyse de données qualitatives et textuelles

  • Spécificités de la problématique et les alternatives (Analyse Factorielle des Correspondances, table de contingence).
  • Présentation d’instanciation, de pattern, de vecteur et d’heuristique.
  • Comment utiliser un espace de vecteurs, d’indexation, de scoring.
  • Différents types de transformations et traitement d’un document textuel.
Travaux pratiques
Réalisation d’un traitement de données qualitatives et de données textuelles sous R.


Modalités d'évaluation
Le formateur évalue la progression pédagogique du participant tout au long de la formation au moyen de QCM, mises en situation, travaux pratiques…
Le participant complète également un test de positionnement en amont et en aval pour valider les compétences acquises.

Solutions de financement
Pour trouver la meilleure solution de financement adaptée à votre situation : contactez votre conseiller formation.
Il vous aidera à choisir parmi les solutions suivantes :
  • Le plan de développement des compétences de votre entreprise : rapprochez-vous de votre service RH.
  • Le dispositif FNE-Formation.
  • L’OPCO (opérateurs de compétences) de votre entreprise.
  • Pôle Emploi sous réserve de l’acceptation de votre dossier par votre conseiller Pôle Emploi.
  • Le plan de développement des compétences de votre entreprise : rapprochez-vous de votre service RH.
  • Le dispositif FNE-Formation.
  • L’OPCO (opérateurs de compétences) de votre entreprise.
  • Pôle Emploi sous réserve de l’acceptation de votre dossier par votre conseiller Pôle Emploi.

Avis clients
5 / 5
Les avis clients sont issus des évaluations de fin de formation. La note est calculée à partir de l’ensemble des évaluations datant de moins de 12 mois. Seules celles avec un commentaire textuel sont affichées.
THOMAS D.
08/11/23
5 / 5

Extraordinaire Maitrise parfaite du sujet Pédagogie au top Dommage que ça dure seulement 3 jours
ARNAUD L.
08/11/23
5 / 5

J’aurais peut être apprécié plus de liens et de documentations vers les différents outils disponibles. La formation est très complète.
YOANN M.
08/11/23
5 / 5

Très pédagogique. De nombreux exemples et formateur très à l’écoute. Ajustement/personnalisation du support vraiment apprécié ainsi que le temps pris pour répondre à l’ensemble des questions des formés. Exercices un peu rapides à la fin, mais beaucoup de références, la qualité du support permet d’approfondir en suite de formation




Horaires
En présentiel, les cours ont lieu de 9h à 12h30 et de 14h à 17h30.
Les participants sont accueillis à partir de 8h45. Les pauses et déjeuners sont offerts.
En classe à distance, la formation démarre à partir de 9h.
Pour les stages pratiques de 4 ou 5 jours, quelle que soit la modalité, les sessions se terminent à 15h30 le dernier jour.

Dates et lieux
Sélectionnez votre lieu ou optez pour la classe à distance puis choisissez votre date.
Classe à distance