ORSYS formation
NOUS CONTACTER - +33 (0)1 49 07 73 73
NOUS CONTACTER - 📞 +33 (0)1 49 07 73 73    espace pro ESPACE PRO     inscription formation orsys S'INSCRIRE     drapeau francais   drapeau anglais
Nos domaines de formation :
Toutes nos formations Big Data, NoSQL

Formation Data Clustering, organiser les données du Big Data

Stage pratique
Durée : 2 jours
Réf : DAU
Prix  2020 : 1830 € H.T.
Pauses et déjeuners offerts
  • Programme
  • Participants / Prérequis
  • Intra / sur-mesure
Programme

Le clustering de données vise à regrouper, au sein de "données massives", des données similaires afin d'identifier des connaissances pertinentes et permettre une prise de décision adaptée. Ce cours vous permettra de comprendre les fondamentaux du clustering de données et de les mettre en pratique sur des cas concrets.

Objectifs pédagogiques

  • Découvrir les principaux aspects du clustering de données
  • Comprendre les approches et les techniques de clustering de données
  • Appliquer les outils et algorithmes pour le clustering de données
  • Savoir mesurer les performances et la qualité d'un jeu de données
PROGRAMME DE FORMATION

Introduction au clustering de données

  • Approches supervisées et non supervisées.
  • Méthodes floues et strictes.
  • Théorie des graphes, différents types de structures de données.
  • Calcul de similarité (TF, TF-IDF...).
  • Propriétés des jeux de données.

Clustering simple et clustering hiérarchique

  • Clustering simple.
  • Clusterings hiérarchiques et composés.
  • Utilité du clustering hiérarchique.
  • Présentation du résultat.

Démonstration
Cas d'utilisations de techniques de clustering.

Techniques de clustering

  • Approches orientées K-means.
  • Approches par agglomération.
  • Approches basées sur un modèle physique (modèle énergie, ressort...).
  • Approches "divisives".
  • Approches par marche aléatoire.
  • Algorithmes incrémentaux.

Démonstration
Avantages/inconvénients des approches étudiées.

Outils pratiques et algorithmes pour le clustering de données

  • K-means simple, Graclus, Cluto.
  • Algorithme hiérarchique : Louvain.
  • InfoMap, Fast Modularity.
  • NCut, approche Girvan Newman...
  • Extraction d'arbres couvrants et composition.

Travaux pratiques
Application de K-means sur un jeu de données. Application de l'algorithme hiérarchique CAH.

Mesures Qualité et Performance

  • Introduction à la performance et à la complexité.
  • Mesures de qualité.
  • Critères : Critère de Ward, Cut, Perf, Cond, Cov, MQ, Mod, Critère de Dunn...
  • Trouver le bon algorithme : technique des diagrammes d'Inselberg.

Travaux pratiques
Mesure de la qualité sur un jeu de données.

Clustering de données à partir d'un réseau lexical

  • Présentation du jeu de données.
  • Analyse des propriétés du réseau.
  • Exécution d'algorithmes de clustering.
  • Affichage du résultat.
  • Calcul de la qualité des partitionnements effectués.

Travaux pratiques
Mise en œuvre d'algorithmes de clustering sur un réseau lexical et sur des documents Web, pdf...

Clustering de documents

  • Présentation du jeu de données.
  • Analyse des propriétés du réseau.
  • Calcul de mesures de similarité.
  • Exécution d'algorithmes de clustering.
  • Affichage du résultat.
  • Calcul de la qualité.

Travaux pratiques
Mise en œuvre d'algorithmes de clustering sur une base documentaire, calcul de mesures de similarité, clustering, analyse de la qualité.

Participants / Prérequis

» Participants

Data analyst, développeurs, chefs de projets ou toutes personnes s'intéressant aux techniques de clustering de données.

» Prérequis

Connaissances de base de la programmation.
Intra / sur-mesure

Demande de devis intra-entreprise
(réponse sous 48h)

Vos coordonnées

En cochant cette case, j’atteste avoir lu et accepté les conditions liées à l’usage de mes données dans le cadre de la réglementation sur la protection des données à caractère personnel (RGPD).
Vous pouvez à tout moment modifier l’usage de vos données et exercer vos droits en envoyant un email à l’adresse rgpd@orsys.fr
En cochant cette case, j’accepte de recevoir les communications à vocation commerciale et promotionnelle de la part d’ORSYS Formation*
Vous pouvez à tout moment vous désinscrire en utilisant le lien de désabonnement inclus dans nos communications.
* Les participants inscrits à nos sessions de formation sont également susceptibles de recevoir nos communications avec la possibilité de se désabonner à tout moment.

Pour vous inscrire

Cliquez sur la ville, puis sur la date de votre choix.
[-]
PARIS

Horaires

Les cours ont lieu de 9h à 12h30 et de 14h à 17h30.
Les participants sont accueillis à partir de 8h45.
Pour les stages pratiques de 4 ou 5 jours, les sessions se terminent à 15h30 le dernier jour.
En poursuivant votre navigation, vous acceptez l’utilisation de cookies nous permettant de vous proposer des offres correspondant à vos centres d’intérêt.
En savoir plus sur l’usage des cookies…   ✖ Fermer
linkedin orsys
twitter orsys
it! orsys
instagram orsys
pinterest orsys
facebook orsys
youtube orsys