Publicatiedatum : 25/07/2024

Opleiding : Python HPC supercomputer

Praktijkcursus - 5d - 35u00 - Ref. PYC
Prijs : 2610 € V.B.

Python HPC supercomputer




Python est devenu en quelques années le langage de programmation privilégié de toutes les disciplines scientifiques. Bien qu’il soit interprété, ses librairies scientifiques sont particulièrement performantes car écrites dans des langages compilés, comme C/Cython et très bien parallélisées. Aujourd’hui la lenteur du langage n’est plus un frein et il fonctionne sur les plus puissants des supercalculateurs de la planète. Nous vous proposons d’apprendre les concepts de la programmation parallèle appliquée au HPC au travers des meilleures librairies Python utilisables sur ces environnements.


INTER
INTRA
OP MAAT

Praktijkcursus ter plaatse of via klasverband op afstand
Disponible en anglais, à la demande

Ref. PYC
  5d - 35u00
2610 € V.B.




Python est devenu en quelques années le langage de programmation privilégié de toutes les disciplines scientifiques. Bien qu’il soit interprété, ses librairies scientifiques sont particulièrement performantes car écrites dans des langages compilés, comme C/Cython et très bien parallélisées. Aujourd’hui la lenteur du langage n’est plus un frein et il fonctionne sur les plus puissants des supercalculateurs de la planète. Nous vous proposons d’apprendre les concepts de la programmation parallèle appliquée au HPC au travers des meilleures librairies Python utilisables sur ces environnements.


Pedagogische doelstellingen
Aan het einde van de training is de deelnemer in staat om:
Een goed begrip hebben van supercomputerconcepten en programmeren
Meer informatie over Python-bibliotheken die geschikt zijn voor HPC-rekenen
Ontwikkel algoritmen op een supercomputer met behulp van de MPI4Py, Dask, Xarray, Dask+Scikit-Learn en PyTorch bibliotheken...
Workflows uitvoeren met Prefect
Grote gegevens visualiseren met DataShader

Doelgroep
Ingenieurs, ontwikkelaars, onderzoekers, datawetenschappers, data-analisten en iedereen met een sterke behoefte aan rekencapaciteit met Python.

Voorafgaande vereisten
Python taalvaardigheden, kennis van numpy en pandas bibliotheken.

Praktische modaliteiten
Leer methodes
Het praktische werk wordt uitgevoerd op een supercomputer (type Exaion).

Opleidingsprogramma

1
Ontdek supercomputers

  • Een overzicht van de allereerste supercomputer tot de krachtigste van vandaag.
  • Wat is een supercomputer?
  • Fundamentele principes en kenmerken: rekencapaciteit, netwerkcapaciteit en opslagcapaciteit.
  • Les différents classements : Top500, Green500, io500.
  • Comment se programme un supercalculateur : les ordonnanceurs/gestionnaires de ressources : SLURM, PBS, ...
  • Présentation du supercalculateur Exaion sur lequel nous travaillerons.
Praktisch werk
Aan de slag met de Exaion supercomputer: aansluiten, een virtuele omgeving installeren en de eerste jobs uitvoeren met Slurm.

2
MPI programmeren

  • Snelle inleiding tot de basisprincipes van parallel rekenen met Python: multithreading, multiprocessing, GIL.
  • MPI concepten en de verschillende beschikbare bibliotheken.
  • De verschillende primitieven: zenden/ontvangen, verstrooien/verzamelen, broadcast/reduce, procespools, enz.
Praktisch werk
Implementatie van verschillende problemen met de belangrijkste primitieven: een batch afbeeldingen verwerken, de decimalen van PI berekenen, enz.

3
MPI programmeren, toepassingen

  • Presentatie van voorbeelden van MPI-toepassingen.
Praktisch werk
Voortzetting van praktisch werk met de belangrijkste primitieven.

4
Dask en zijn ecosysteem

  • Aan de slag met dask: basisconcepten, dask array en dataframe.
  • De andere onderdelen van dask: vertraagd, futures en zakken.
  • Dask sur HPC : Scheduler et workers, créer un cluster dask : Cluster MPI/Slurm...
  • Panorama des différentes librairies de l’écosystème Dask.
  • NetCDF-bestanden verwerken met XArray.
Praktisch werk
Analyse van tijd- en klimaatreeksen, classificaties en regressies met Dask+Scikit-Learn, cartografische datavisualisatie.

5
Dask en big data

  • Grote gegevens visualiseren met DataShader en Xarray.
  • Créer des pipelines/workflows avec Prefect.
  • DaskML : déployer vos algorithmes de machine learning sur HPC.
Praktisch werk
Verder praktisch werk met gegevensanalyse en visualisatie.

6
GPU-rekenen

  • GPU-computerconcepten met Python: hardware, bibliotheken.
  • Fonctionnement d’un GPU.
  • Dask sur GPU : Créer un cluster CUDA.
  • Machine-learning avec PyTorchLightning et RapidsAI.
Praktisch werk
Basisimplementatie met de PyCuda en Cupy bibliotheken. Dataframe manipulatie met Dask-CUDF. Machine learning toegepast op meerdere compute nodes en meerdere GPU's.


Feedback van klanten
4,5 / 5
De feedback van klanten is afkomstig van eindevaluaties na de opleiding. De score wordt berekend op basis van alle evaluaties die minder dan 12 maanden oud zijn. Alleen die met een tekstcommentaar worden weergegeven.
MYRIAM O.
10/03/25
4 / 5

De trainer was erg beschikbaar en voldeed aan onze verwachtingen voor onze toepassingen.
CHARLES C.
10/03/25
4 / 5

Een zeer competente trainer met een schat aan ervaring die in staat was een stapje terug te doen en een technische en/of algoritmische oplossing te vinden.een klein gebrek aan voorbereiding/testen met betrekking tot de gebruikte HPC-oplossing, wat een aanzienlijke hoeveelheid tijd in beslag nam tijdens de cursus. Trainer die de neiging heeft af te wijken van het programma om context toe te voegen, waar hij duidelijk gepassioneerd over is. Misschien vervelend, maar dat is zijn charme.