Formation : Data Mining par la pratique

Data Mining par la pratique




Le data mining consiste à découvrir des modèles, des correspondances, des motifs dans un ensemble de données numériques ou qualitatives. Cette activité s'appuie sur une trousse à outils algorithmiques qui vous seront présentés dans ce cours. La démarche data mining sera illustrée sur plusieurs projets, en utilisant R.


INTER
INTRA
SUR MESURE

Cours pratique en présentiel ou à distance
Disponible en anglais, à la demande

Réf. DMP
  3j - 21h00
Prix : 2360 € H.T.
Pauses-café et
déjeuners offerts




Le data mining consiste à découvrir des modèles, des correspondances, des motifs dans un ensemble de données numériques ou qualitatives. Cette activité s'appuie sur une trousse à outils algorithmiques qui vous seront présentés dans ce cours. La démarche data mining sera illustrée sur plusieurs projets, en utilisant R.


Objectifs pédagogiques
À l’issue de la formation, le participant sera en mesure de :
Comprendre l'intérêt de l’approche data mining
Traduire une problématique et savoir y répondre
Connaître les principales méthodes de data mining
Identifier et savoir utiliser les outils de data mining
Poser une problématique de data mining et rechercher la méthode appropriée
Être capable de restituer les résultats

Public concerné
Chargés d’études, responsables de projet analyse de données, responsables Infocentre, marketing ou qualité, utilisateurs et gestionnaires métiers de bases de données, futurs data scientists.

Prérequis
Connaissances basiques en statistiques ou connaissances équivalentes à celles apportées par la formation "Statistiques descriptives, introduction" (réf. UES).
Vérifiez que vous avez les prérequis nécessaires pour profiter pleinement de cette formation en faisant  ce test.

Modalités d'évaluation
Le formateur évalue la progression pédagogique du participant tout au long de la formation au moyen de QCM, mises en situation, travaux pratiques…
Le participant complète également un test de positionnement en amont et en aval pour valider les compétences acquises.

Programme de la formation

1
Le projet de data mining

  • La problématique du data scientist : de la donnée à l’information.
  • Le vocabulaire et les concepts.
  • L’exploration descriptive du jeu de données.
  • Les métadonnées pour le suivi du projet de data mining.
  • Rappels sur le logiciel R.
Travaux pratiques
Utilisation de R. Caractérisation descriptive, définition et saisie des métadonnées d'un jeu de données.

2
Les techniques de l’approche data mining

  • Méthode basée sur la classification : identification de groupes d’individus statistiques.
  • Méthode par association : mise en évidence d’une cause et d’une conséquence.
  • Méthode de l’estimation : complément d’un effectif ou d’une fréquence d’un jeu de données.
  • Apports du data mining pour le traitement des grandes volumétries de données.
  • Méthode de segmentation : définition de critères, extension de la méthode de classification et principe des k-means.
  • Méthode de prévision : importance de la temporalité et des hypothèses.
Travaux pratiques
Appréhender les différentes méthodes en fonction des besoins exprimés.

3
Les outils statistiques

  • Méthodes descriptives : corrélation, classification, réseaux de Kohonen, règles d’association.
  • Méthodes prédictives : régression, arbres de décision, réseaux de neurones, les K plus proches voisins.
  • Mise en œuvre de classification par k-means et CAH (Classification Ascendante Hiérarchique).
  • Principe des méthodes supervisées.
Travaux pratiques
Mise en pratique des différentes méthodes sous R.

4
La visualisation des données

  • Les objectifs de la visualisation des données.
  • Les différents types de représentations de données quantitatives.
  • Concevoir des tableaux de bord.
Travaux pratiques
Création d’un tableau de bord avec R en utilisant des données quantitatives. Représentation de données quantitatives et de données qualitatives avec R.

5
Analyse de données qualitatives et textuelles

  • Spécificités de la problématique et les alternatives (analyse factorielle des correspondances, table de contingence).
  • Présentation d’instanciation, de pattern, de vecteur et d’heuristique.
  • Comment utiliser un espace de vecteurs, d’indexation, de scoring.
  • Différents types de transformations et traitement d’un document textuel.
Travaux pratiques
Réalisation d’un traitement de données qualitatives et de données textuelles sous R.


Parcours certifiants associés
Pour aller plus loin et renforcer votre employabilité, découvrez les parcours certifiants qui contiennent cette formation :

Solutions de financement
Plusieurs solutions existent pour financer votre formation et dépendent de votre situation professionnelle.
Découvrez-les sur notre page Comment financer sa formation ou contactez votre conseiller formation.

Avis clients
5 / 5
Les avis clients sont issus des évaluations de fin de formation. La note est calculée à partir de l’ensemble des évaluations datant de moins de 12 mois. Seules celles avec un commentaire textuel sont affichées.
ALEXANDRE M.
15/10/25
5 / 5

Formation très intéressantes même pour une personne ne connaissant pas ou peu le data mining
FAUSTINE C.
15/10/25
5 / 5

Formation correspondant à mes attentes, échanges très constructifs avec le formateur et les autres participants.Formateur disponible, attentif à la bonne compréhension des propos par chacun des participants et qui fait pleinement profiter de son expérience professionnelle.Merci
SOPHIE D.
15/10/25
5 / 5

Très riche et opérationnelle.



Horaires
Les cours ont lieu de 9h à 12h30 et de 14h à 17h30.
Les participants sont accueillis à partir de 8h45. Les pauses et déjeuners sont offerts.
Pour les formations de 4 ou 5 jours, quelle que soit la modalité, les sessions se terminent à 16h le dernier jour.

Dates et lieux
Sélectionnez votre lieu ou optez pour la classe à distance puis choisissez votre date.
Classe à distance

Dernières places
Date garantie en présentiel ou à distance
Session garantie