> formation Technologies numériques > formation Big Data, Intelligence Artificielle > formation IA, Machine Learning, analyse de données > formation Data Mining par la pratique

Avis loadedNote : 3,9Length : 21TotalNote : 325TotalNote20 : 7
Toutes nos formations IA, Machine Learning, analyse de données

Formation Data Mining par la pratique

3,9 / 5
Stage pratique
Durée : 3 jours
Réf : DMP
Prix  2021 : 2240 € H.T.
Pauses et déjeuners offerts
  • Programme
  • Participants / Prérequis
  • Intra / sur-mesure
  • avis clients
Programme

Le Data Mining consiste à découvrir des modèles, des correspondances, des motifs dans un ensemble de données numériques ou qualitatives. Cette activité s'appuie sur une trousse à outils algorithmiques qui vous seront présentés dans ce cours. La démarche Data Mining sera illustrée sur plusieurs projets, en utilisant R.

Objectifs pédagogiques

À l’issue de la formation, le participant sera en mesure de :
  • Comprendre l'intérêt de l’approche Data Mining
  • Traduire une problématique et savoir y répondre
  • Connaître les principales méthodes de Data Mining
  • Identifier et savoir utiliser les outils de Data Mining
  • Poser une problématique de Data Mining et rechercher la méthode appropriée
  • Être en capacité de restituer les résultats
PROGRAMME DE FORMATION

Le projet de Data Mining

  • La problématique du Data Scientist : de la donnée à l’information.
  • Le vocabulaire et les concepts.
  • L’exploration descriptive du jeu de données.
  • Les métadonnées pour le suivi du projet de Data Mining.
  • Rappels sur le logiciel R.

Travaux pratiques
Utilisation de R. Caractérisation descriptive, définition et saisie des métadonnées d'un jeu de données.

Les techniques de l’approche Data Mining

  • Méthode basée sur la classification : identification de groupes d’individus statistiques.
  • Méthode par association : mise en évidence d’une cause et d’une conséquence.
  • Méthode de l’estimation : complément d’un effectif ou d’une fréquence d’un jeu de données.
  • Apports du Data Mining pour le traitement des grandes volumétries de données.
  • Méthode de segmentation : définition de critères, extension de la méthode de classification et principe des k-means.
  • Méthode de prévision : importance de la temporalité et des hypothèses.

Travaux pratiques
Appréhender les différentes méthodes en fonction des besoins exprimés.

Les outils statistiques

  • Méthodes descriptives : corrélation, classification, réseaux de Kohonen, règles d’association.
  • Méthodes prédictives : régression, arbres de décision, réseaux de neurones, les K plus proches voisins.
  • Mise en œuvre de classification par k-means et CAH (Classification Ascendante Hiérarchique).
  • Principe des méthodes supervisées.

Travaux pratiques
Mise en pratique des différentes méthodes sous R.

La visualisation des données

  • Les objectifs de la visualisation des données.
  • Les différents types de représentations de données quantitatives.
  • Concevoir des tableaux de bord.

Travaux pratiques
Création d’un tableau de bord avec R en utilisant des données quantitatives. Représentation de données quantitatives et de données qualitatives avec R.

Analyse de données qualitatives et textuelles

  • Spécificités de la problématique et les alternatives (Analyse Factorielle des Correspondances, table de contingence).
  • Présentation d’instanciation, de pattern, de vecteur et d’heuristique.
  • Comment utiliser un espace de vecteurs, d’indexation, de scoring.
  • Différents types de transformations et traitement d’un document textuel.

Travaux pratiques
Réalisation d’un traitement de données qualitatives et de données textuelles sous R.

Participants / Prérequis

» Participants

Chargés d’études, responsables de projet analyse de données, responsables Infocentre, Marketing ou Qualité, utilisateurs et gestionnaires métiers de bases de données, futurs Data Scientist.

» Prérequis

Connaissances de base en statistiques ou connaissances équivalentes à celles apportées par le stage Statistiques descriptives, introduction (réf. UES).
Intra / sur-mesure

Demande de devis intra-entreprise
(réponse sous 48h)

Vos coordonnées

En cochant cette case, j’atteste avoir lu et accepté les conditions liées à l’usage de mes données dans le cadre de la réglementation sur la protection des données à caractère personnel (RGPD).
Vous pouvez à tout moment modifier l’usage de vos données et exercer vos droits en envoyant un email à l’adresse rgpd@orsys.fr
En cochant cette case, j’accepte de recevoir les communications à vocation commerciale et promotionnelle de la part d’ORSYS Formation*
Vous pouvez à tout moment vous désinscrire en utilisant le lien de désabonnement inclus dans nos communications.
* Les participants inscrits à nos sessions de formation sont également susceptibles de recevoir nos communications avec la possibilité de se désabonner à tout moment.
Avis clients
picto avis clients
ABDELMALIK B. 06/09/2021
5 / 5
très bien

NICOLAS B. 06/09/2021
4 / 5
J’aurais apprécié plus d’exercice pratique avec d’autres méthodes.

BRUNO C. 06/09/2021
5 / 5
Stage très didactique

AXEL B. 14/06/2021
5 / 5
contenue très intéressant, peut etre avoir un peu plus de pratique sur certains sujets

MANON D. 14/06/2021
3 / 5
Le préambule au Data Mining (Objectifs, Projet DM) pourrait être raccourci en 1h30 (au lieu d’une journée) pour passer plus de temps sur les outils du Data Mining (leurs différences, leurs intérêts respectifs) et surtout pratiquer sur une étude de cas avec une vraie démarche pas juste quelques tests ! On ressort avec un catalogue de méthodes qui reste à approfondir par nous même.

MICHAËL M. 14/06/2021
4 / 5
Pas évident à distance ...

JULIE C. 14/06/2021
4 / 5
J’ai trouvé qu’il y avait un grand écart entre les parties très théoriques (pas simple à aborder quand on ne les connaît pas et pas suffisamment illustrées visuellement) et les exercices pratiques dans R, qui en réalité consistent à faire des copier-coller, donc finalement, quand on ne connaît pas R initialement, on ne le connaît pas plus après la formation. Par ailleurs, la partie magistrale

RAPHAEL B. 10/03/2021
4 / 5
Le cycle certifiant "Data scientist" devrait s’orienter plus sur le langage Python que sur le langage R. Comme pour toutes les formations du cycle "Data Scientist", il manque peut-être un fil conducteur au niveau de la pratique.

GABRIEL R. 10/03/2021
3 / 5
Niveau plus bas que j’attendais, et pas assez d’exercices. Il serait intéressant de faire ce cours sous la forme d’un seul grand projet de data mining cohérent à réaliser soi-même avec l’aide de l’intervenant

FRAISSE C. 07/12/2020
4 / 5
Le contenu de cette formation s’adresse à des personnes ayant déj des connaisances sur le data mining, ce qui n’est pas le cas pour moi d’ou certai,nes difficultés mais cela n’enleve aucun interet à cette formation

ADRIEN P. 07/12/2020
5 / 5
Contenu à la fois riche et intéressant.

ROBERTO M. 07/12/2020
3 / 5
Difficile de dire si c’est le cours qui est trop rapide ou ma formation pas assez adaptée.

FABRICE S. 07/12/2020
3 / 5
1 journée complète sur le projet datamining et très peu de temps sur la stats descriptive. Très déséquilibré. Trop peu de temps sur des modèles et d’explications concrètes. Manque d’exemple. Formateur sympathique mais qui a du mal à vulgariser et reste un peu fouilli. N’explique pas assez la structure du code proactivement

LAETITIA B. 07/12/2020
5 / 5
Globalement très positive. Un peu plus de temps sur les techniques de l approche DM et sur les outils statistiques peut etre

PHILIPPE S. 07/12/2020
4 / 5
Le distanciel montre ses limites pour l’animateur : difficile de jauger l’assistance, pas de visibilité sur les travaux pratiques de chacun, etc... Bravo à Eric ! Je suggère une campagne de correction orthographique du support, cela gâche la performance !

LAURENT D. 07/12/2020
5 / 5
Excellent intervenant et disponible. Merci encore à Monsieur Fourlon pour cette intervention

GAEL G. 07/12/2020
4 / 5
J’aurai aimer réaliser plus d’exercices pratiques

NICOLAS H. 07/12/2020
4 / 5
Sur la forme, beaucoup trop de textes dans les diapos ! Et du coup, beaucoup de coquilles, fautes d’orthographes, de conjugaison, de syntaxe, etc... Sur le fond j’ai beaucoup apprécié la pédagogie et la vulgarisation du formateur alors que le contenu est très technique et dense en contenus. Le support n’est pas tout à fait adapté à de la formation en distanciel.

GALLAY BENOÎT M. 21/09/2020
4 / 5
Parfois difficile à suivre au niveau vitesse mais d’un autre côté, on voit un plus grand évantail de chose.

JULIEN C. 21/09/2020
3 / 5
Le temps de formation est trop court par rapport à l’étendue des sujets abordés. Du coup la pratique est réduite à la recopie des exemples fournis par le support de cours (sauf un TP) Pré-requis trop simples, il est dur de suivre la formation si on ne connait pas R ni déjà une partie des méthodes. Formateur trop pointu par moment (sur des math par ex) J’aurai aimé plus de pratique afi

HENI W. 21/09/2020
5 / 5
Très bonne formation, des approches ont été rapidement abordées mais ca m’a permis de voir de quoi ca s’agit.
Avis clients 3,9 / 5

Les avis clients sont issus des feuilles d’évaluation de fin de formation. La note est calculée à partir de l’ensemble des avis datant de moins de 12 mois.

CLASSE A DISTANCE

En inter et en intra-entreprise
Inscrivez-vous ou contactez-nous !

Pour vous inscrire

Cliquez sur la ville, puis sur la date de votre choix.
[+]
CLASSE A DISTANCE
[+]
PARIS

Horaires

Les cours ont lieu de 9h à 12h30 et de 14h à 17h30.
Les participants sont accueillis à partir de 8h45.
Pour les stages pratiques de 4 ou 5 jours, les sessions se terminent à 15h30 le dernier jour.