1
Azure et Databricks : vue d'ensemble
- Présentation et intérêt d'une plateforme cloud
- Les concepts de Databricks : le data lakehouse (ETL et data warehouse), gouvernance des données (Unity Catalog)
- Intégration avec Azure (ADLS, Key Vault, Power BI...)
- Les avantages de Databricks
2
Les espaces de travail
- Les ressources Azure Databricks
- La création d'un espace de travail
- La connexion de l'espace de travail à des sources de données externes
Travaux pratiques
Créer un espace de travail et le connecter à des sources de données externes.
3
Les différents types de ressources : clusters et SQL warehouse
- Présentation
- Les différents types de calculs
- La création d'un cluster
- La gestion du cluster
Travaux pratiques
Identifier les types de calculs, créer et gérer un cluster.
4
Unity Catalog
- La création d'un catalogue
- La connexion à des données à partir de Unity Catalog
- L'ajout d'une table dans le schéma du catalogue
- La définition des autorisations à des bases de données SQL
- Focus : connexion à des bases de données SQL
- D'autres méthodes pour ajouter des données du catalogue
Travaux pratiques
Créer un catalogue, le connecter à des données à partir de Unity Catalog ainsi qu'à des bases de données.
5
Databricks : les notebooks
- Les objectifs et les intérêts des notebooks
- Le principe des cellules
- Les commandes
- Les magic commands
- Transformation avec PySpark, SQL
- L'utilisation des cellules et la visualisation du résultat
- L'export et le partage des notebooks
Travaux pratiques
Explorer, requêter et manipuler les données présentes sur Databricks à travers les différents outils (SQL et notebooks) afin de créer des analyses.
6
Databricks SQL
- Databricks SQL : administration
- L'éditeur SQL
- La création et l'exécution d'une requête
- Le partage d'un résultat de requête
- Les options disponibles sur les résultats d'une requête : export, visualisation, filtres d'affichage, paramétrage d'un résultat
Travaux pratiques
Créer et exécuter une requête, manipuler le résultat et le partager.
7
Le tableau de bord
- La création d'un tableau de bord
- Les options de partage et de publication sur le tableau de bord
- La création d'une alerte sur un tableau de bord
Travaux pratiques
Créer un tableau de bord et utiliser les différentes fonctionnalités de partage et de publication.
8
Les connexions avec Power BI
- La publication vers Power BI à partir de Databricks
- La génération d'un fichier .pbids et son ouverture dans Power BI Desktop
- La connexion de Power BI Desktop à Databricks
Travaux pratiques
Publier vers Power BI et générer un fichier .pbids