Data Warehousing, ETL et l'outil BODI
- Architecture Data Warehouse, modélisation dimensionnelle, couche d'alimentation des données.
Définition des données
- Connexions à des données sources et cible.
- Définition du référentiel d'accès aux données.
- Audit. Exceptions. Reporting des métadonnées.
Travaux pratiques
Création des connexions à des fichiers source et une base de données cible.
Planification et gestion des jobs
- Eléments du plan d'alimentation : " job ", " workflow " et " data flow ". Objets dans les schémas source et cible. " Query Transform ". Planification et exécution du " job ".
Travaux pratiques
Mise en place du plan d'alimentation. Planification, ordonnancement de l'exécution des " jobs ".
Capture des Données Modifiées (CDM)
- CDM basé sur la source et CDM basé sur la cible.
- Gestion des erreurs. Procédures de reprise.
Clés de substitution
- Rôle des clés de substitution. estion des modifications apportées aux données avec des clés de substitution.
Travaux pratiques
Génération de clés de substitution. Technique du " Slowly Changing Dimension ".
Gestion des environnements et des utilisateurs
- Environnement multi-utilisateur. Tâches communes.
- Développement, test et production. Portabilité.
Interface d'administration
- Administration via le web et des "batch". Sécurité sur le référentiel central. Interface d'analyse d'impact.
- Tableaux de bord.
Gestion des " jobs " et des transformations
- Validation, exécution et débogage des " jobs ".
- Visualisation en mode " trace ". Description des transformations " built-in ". Encapsulation des " data flow ".
Travaux pratiques
Introduction de données de mauvaise qualité dans les fichiers sources et débogage.
Optimisation des performances des flux
- Optimisation des performances de la source, et de la cible et des traitements. Partitionnement et exécution parallèle des flux.
Travaux pratiques
Exécutions parallèles des " jobs ".