Rappels sur les fondamentaux du Système d'information Décisionnel (SID)
- Les enjeux du SID : besoins des entreprises, domaines d'application.
- Architecture type d'un SID, état de l'art en matière d'architectures décisionnelles.
- Les différentes couches du SID : lien avec le système d'information opérationnel (SIO), état de l'art en matière d'architecture, synthèse sur les différentes couches de l'architecture: couche en lien avec le SIO, couche orientée informations décisionnelles, couche de présentation.
- Elaboration des informations décisionnelles, présentation.
- Conception d'un SID : les étapes, l'optimisation, l'organisation des données, le dictionnaire fonctionnel et technique.
- Panorama des outils décisionnels.
Introduction au Data Mining (DM)
Comprendre le Data Mining
- Définition et finalité du Data Mining (DM). A quoi sert le DM ?
- Quel lien entre le DM et les statistiques, quelle dépendance entre le DM et l'informatique ?
- Quelle différence entre le DM et OLAP (On Line Analitycal Processing) ?
- Historique du DM et travaux de recherche.
- Les attentes des entreprises, les réponses du DM.
Les techniques du Data Mining
- Les différentes familles du DM.
- Les méthodes prédictives et les méthodes descriptives.
- L'analyse factorielle, l'analyse typologique, la classification ou clustering, la détection de liens.
- Les arbres de décisions, les réseaux de neurones, les modèles paramétriques.
- Classification des techniques de DM : Quelle technique choisir pour un type de problème donné ?
Présentation de méthodes
La méthode descriptive du clustering
- Définition et méthodologie.
- Choix des critères pour structurer les données à classer. Combien de classes viser ?
- Utilisation de variables.
- Evaluation et validation des classes obtenues. Comment mesurer la qualité d'une bonne classification ?
- Les différentes sous famille du clustering.
- Exemple d'application du clustering
Le Scoring : un premier exemple d'application du DM
- Définition du Scoring.
- Dans quels domaines d'activité est-il utilisé ? Pour quel type de problèmes ?
- Quelle est la finalité ?
- Les catégories de Scoring (appétence, risque, octroi).
- La méthodologie de Scoring.
- Cas pratique de Scoring dans une banque ou assurance.
Le géomarketing : un deuxième exemple d'application du DM
- Définition du géomarketing.
- Dans quels domaines d'activité est-il utilisé ? Pour quel type de problèmes ?
- Cas pratique de géomarketing dans une banque ou assurance.
Mise en place d'une solution
Les données de l'entreprise : entre qualité et quantité ?
- Rappel de la problématique des données du SI.
- Les différents types de données.
- Qualité des données et administration des données.
- Processus de collecte et d'exploration.
- Création d'agrégats et de nouvelles données.
- Transformation des données.
Méthodologie de projet
- Définition du problème métier à résoudre et des objectifs à atteindre.
- Inventaire, description et classement des données.
- Conception et alimentation de la base Data Mining.
- Exploration, segmentation des entités analysées.
- établissement du ou des modèles d'analyse.
- Application des modèles et validation des résultats.
- Itérations, déploiement auprès des utilisateurs (formation, accompagnement du changement...).
- Maintenance du modèle et logiciel associé.
Panorama des outils
- Les principaux outils : SAS, R, IBM SPSS, Oracle Data Mining, SQL Server DM...
- Zoom sur l'outil SAS de l'éditeur SAS.
- Zoom sur l'ETL Powercenter.
- Quels critères de choix pour ce type d'outils ?