Venez en toute sécurité dans nos centres ! Voir notre dispositif sanitaire

> Formations > Technologies numériques > Business Intelligence > Talend, Qlik, Cognos et autres outils BI > Formation Talend Open Studio for Data Quality, gérer la qualité des données > Formations > Technologies numériques > Formation Talend Open Studio for Data Quality, gérer la qualité des données

Talend Open Studio for Data Quality, gérer la qualité des données

Talend Open Studio for Data Quality, gérer la qualité des données

Télécharger au format pdf Partager cette formation par e-mail


Open Studio for Data Quality, un des principaux outils de profilage de données open source du marché. Vous apprendrez à manipuler efficacement cet outil de Talend afin d’évaluer le niveau de qualité des données de votre système d'information. Vous mettrez en œuvre des analyses, et mesurerez la conformité des données aux normes internes ou externes et définirez des stratégies de nettoyage des données erronées.


Inter
Intra
Sur mesure

Cours pratique en présentiel ou en classe à distance

Réf : TDQ
Prix : 1550 € HT
  2j - 14h
Pauses-café et
déjeuners offerts




Open Studio for Data Quality, un des principaux outils de profilage de données open source du marché. Vous apprendrez à manipuler efficacement cet outil de Talend afin d’évaluer le niveau de qualité des données de votre système d'information. Vous mettrez en œuvre des analyses, et mesurerez la conformité des données aux normes internes ou externes et définirez des stratégies de nettoyage des données erronées.

Objectifs pédagogiques
À l’issue de la formation, le participant sera en mesure de :
  • Se connecter aux sources de données, produire des statistiques, identifier les données à profiler
  • Choisir les différents types d'indicateurs et d'analyses adaptés aux données à contrôler
  • Mettre en œuvre des analyses complexes permettant de vérifier des règles métiers
  • Définir des stratégies de correction des données erronées via des jobs de Talend Data Integration

Public concerné
Analystes métiers, intégrateurs de données, gestionnaires de données.

Prérequis
Bonnes connaissances des bases de données relationnelles et du SQL. Connaissances de base de Talend Open Studio for Data Integration.

Modalités d'évaluation
Le formateur évalue la progression pédagogique du participant tout au long de la formation au moyen de QCM, mises en situation, travaux pratiques…
Le participant complète également un test de positionnement en amont et en aval pour valider les compétences acquises.

Programme de la formation

La problématique de la qualité des données

  • L'évaluation de la qualité des données d'un système d'information.
  • Critères fondamentaux : exhaustivité, précision et intégrité des données.
  • Positionnement du produit Talend Open Studio for Data Quality dans la suite Talend.
Travaux pratiques
Installation du produit, configuration des préférences.

Les concepts fondamentaux de TOS for Data Quality

  • Les métadonnées : connexions aux bases, fichiers délimités et fichiers Excel.
  • Présentation des différents types d'analyses.
  • Les outils et indicateurs d'aide à la réalisation des analyses.
  • L'explorateur de données.
Travaux pratiques
Effectuer une première analyse de colonne sur des données issues d'un fichier csv, exploitation des résultats obtenus.

Les analyses simples

  • Recherche de doublons, respect de contraintes d'intervalle, format de date, d'email...
  • Métriques d'une table, dépendances fonctionnelles entre colonnes.
  • Identification des redondances de valeurs.
  • Contrôles de cohérence entre clefs étrangères et primaires.
  • Utiliser les indicateurs, les modèles, les règles et les fichiers sources.
Travaux pratiques
Réaliser une analyse de chaque type sur un jeu de données partiellement erronées.

Les analyses avancées

  • Analyse de schéma et de la structure des tables via l'explorateur de données.
  • Analyse multitable et multicolonne, respect de règles métiers.
  • Recherche et visualisation de corrélation entre colonnes.
  • Créer ses propres indicateurs et fichiers sources.
  • Gérer les analyses.
Travaux pratiques
Créer une règle métier complexe impliquant plusieurs tables et l'associer à une tâche. Publier la règle dans la forge Talend.

Eléments avancés

  • Utiliser des variables de contexte.
  • Créer des modèles basés sur des expressions régulières.
  • Exporter/importer les analyses et les données analysées.
  • Corriger les données erronées avec Talend Data Integration.
Travaux pratiques
Paramétrer les métadonnées et les analyses à l'aide de variables de contexte, exporter les données analysées pour les corriger dans Talend Data Integration.


Solutions de financement
Pour trouver la meilleure solution de financement adaptée à votre situation : contactez votre conseiller formation.
Il vous aidera à choisir parmi les solutions suivantes :
  • Le plan de développement des compétences de votre entreprise : rapprochez-vous de votre service RH.
  • Le dispositif FNE-Formation.
  • L’OPCO (opérateurs de compétences) de votre entreprise.
  • Pôle Emploi sous réserve de l’acceptation de votre dossier par votre conseiller Pôle Emploi.
  • Le plan de développement des compétences de votre entreprise : rapprochez-vous de votre service RH.
  • Le dispositif FNE-Formation.
  • L’OPCO (opérateurs de compétences) de votre entreprise.
  • Pôle Emploi sous réserve de l’acceptation de votre dossier par votre conseiller Pôle Emploi.


Avis clients
Les avis clients sont issus des évaluations de fin de formation. La note est calculée à partir de l’ensemble des évaluations datant de moins de 12 mois. Seules celles avec un commentaire textuel sont affichées.
XAVIER P.
08/11/21
2 / 5

Le produit est trop limité. Les analyses sont obligatoirement mono-schéma. Elles ne peuvent pas êtres réalisés sur plusieurs schémas ce qui limite énormément l’intérêt du produit dans mon cas. L’analyse des dépendances fonctionnelles ne peut se faire que sur des colonnes appartenant à une même table. Ce qui implique un travail supplémentaire de création de vues pour contourner cet
CHARVIN C.
08/11/21
2 / 5

L’intervenant semblait connaitre l’outil Talend Data Quality et le découvrir par moment.
PATRICK H.
08/11/21
3 / 5

Contenu très technique pour quelqu’un qui ne maitrise pas SQL ou les connexions BDD




Horaires
En présentiel, les cours ont lieu de 9h à 12h30 et de 14h à 17h30.
Les participants sont accueillis à partir de 8h45. Les pauses et déjeuners sont offerts.
En classe à distance, la formation démarre à partir de 9h.
Pour les stages pratiques de 4 ou 5 jours, quelle que soit la modalité, les sessions se terminent à 15h30 le dernier jour.

Dates et lieux
Du 21 au 22 mars 2022
Classe à distance
S’inscrire
Du 12 au 13 mai 2022
Classe à distance
S’inscrire
Du 8 au 9 septembre 2022
Classe à distance
S’inscrire
Du 20 au 21 octobre 2022
Classe à distance
S’inscrire