Publicatiedatum : 18/12/2024

Opleiding : Data Science met Python, API Society-certificering

RS 6763

Praktijkcursus - 4d - 28u00 - Ref. PYS
Prijs : 2240 € V.B.

Data Science met Python, API Society-certificering

RS 6763



Aan het einde van het trainingsprogramma voor datawetenschappers zijn de deelnemers vaardig in het installeren en gebruiken van wetenschappelijke modules in een virtuele omgeving, het samenwerken aan gegevensprojecten, het manipuleren en transformeren van gegevens voor complexe analyses en het maken van interactieve en toegankelijke visualisaties die zijn afgestemd op de behoeften van gebruikers.


INTER
INTRA
OP MAAT

Praktijkcursus ter plaatse of via klasverband op afstand
Disponible en anglais, à la demande

Ref. PYS
  4d - 28u00
2240 € V.B.




Aan het einde van het trainingsprogramma voor datawetenschappers zijn de deelnemers vaardig in het installeren en gebruiken van wetenschappelijke modules in een virtuele omgeving, het samenwerken aan gegevensprojecten, het manipuleren en transformeren van gegevens voor complexe analyses en het maken van interactieve en toegankelijke visualisaties die zijn afgestemd op de behoeften van gebruikers.


Pedagogische doelstellingen
Aan het einde van de training is de deelnemer in staat om:
Ontdek het wetenschappelijke Python-ecosysteem
Gegevens manipuleren en analyseren met NumPy en Pandas
Eenvoudige, interactieve gegevens visualiseren met Matplotlib, Seaborn, Plotly
Leiding geven aan data science- en datavisualisatieprojecten

Doelgroep
Statistici, gegevensanalisten en gegevenswetenschappers

Voorafgaande vereisten
Basiskennis van de programmeertaal Python

Certificatie
Het certificeringsexamen vindt online, offline en in het Frans plaats in de maand volgend op de cursus. Het bestaat uit een theoretische test van 20 minuten - 40 waar/onwaar MCQ-vragen en in te voeren informatie (24 van de 40 te valideren antwoorden), en een praktische programmeertest (code oefening) van 120 minuten in een format van 6 oefeningen (10 van de 21 te valideren criteria).

Praktische modaliteiten
Praktisch werk
Individueel en groepspracticum, collectieve reflectie
Leer methodes
Actieve lesmethoden die persoonlijke betrokkenheid en uitwisselingen tussen deelnemers aanmoedigen.

Opleidingsprogramma

1
Het wetenschappelijke Python-ecosysteem

  • Inleiding tot Python-pakketten voor datawetenschap.
  • Bibliotheken installeren in een virtuele omgeving: pip en de venv module, miniconda, mamba, miniforge, WinPython.
  • Ontwikkelomgeving.
  • Het gebruik van IPython, Jupyter Notebook, JupyterLab en IDE-omgevingen: het voorbeeld van Spyder.
  • Ontdek de teksteditor: VS Code.

2
De NumPy-bibliotheek

  • Introductie en maken van tabellen.
  • Presentatie van de NumPy-bibliotheek.
  • Voordelen van tabellen (prestaties, gegevensverwerking).
  • Maak arrays met array(), nullen(), enen(), vol(), arange(), linspace(), logspace().
  • Matrixvermenigvuldiging met np.dot en de @ operator.
  • Initialisatie met willekeurige gegevens (willekeurige module).
  • Tabellen en bewerkingen verwerken.
  • Indexeren, snijden en geavanceerd indexeren.
  • Matrixdimensies transponeren en wijzigen (transpose(), reshape()).
  • Arrays samenvoegen en splitsen (concatenate(), splitsen()).
  • Behandel klassieke en wiskundige functies (som(), min(), max(), mediaan().
  • Gegevens vergelijken en verbergen met behulp van Booleaanse maskers.
  • Gegevensbeheer en visualisatie.
  • Arrays laden en opslaan (loadtxt(), save(), load()).
  • Gebruik de asoptie in de functies.
  • Informatie uit gegevens halen.
  • Visualisatiepraktijken gebruiken: modules en soorten afbeeldingen kiezen.
  • Genereer interactieve afbeeldingen.

3
De panda's bibliotheek

  • Inleiding en gegevensstructuren.
  • De Pandas-bibliotheek introduceren.
  • Reeksen maken met de serie klasse.
  • Maak 2D-arrays of DataFrames met de klasse DataFrame.
  • Extractie van rij- en kolomindexen (index- en kolommenattributen).
  • Lees en exporteer gegevens in verschillende formaten (csv, xls).
  • Implementeer de basismethoden: head() en tail().
  • Indexeren en slicen: impliciet, expliciet en het gebruik van loc en iloc indexers.
  • Gegevens selecteren en Booleaanse expressies gebruiken.
  • Gegevensmanipulatie en -transformatie.
  • Gegevens invoegen en wijzigen.
  • Hernoem kolommen met rename().
  • Gegevens samenvoegen met concat() en samenvoegen/joinen met merge() en join().
  • Gegevens kopiëren: ondiepe of diepe kopie (copy()).
  • Omgaan met ontbrekende gegevens (isna(), isnull(), notna(), notnull(), dropna(), fillna(), interpolate()).
  • Indexen manipuleren: set_index(), sort_index().
  • Sorteer waarden met sort_values().
  • Transponeer gegevens met transponeer().

4
Gegevensanalyse en aggregatie

  • Gegevensaggregatie: som(), som(), min(), max(), telling(), gemiddelde(), mediaan(), var(), std(), kwantiel(), beschrijf()
  • Groeperen en analyseren met groupby().
  • Gebruik de functies aggregate(), apply(), filter() en transform().
  • Maak draaitabellen met pivot_table().
  • Segmenteer gegevens met qcut() en cut().
  • Bereken voortschrijdende gemiddelden met rolling(), expanding(), ewm().
  • Verwerk tijdsgegevens met to_datetime(), to_timedelta(), date_range(), period_range()...

5
De Matplotlib-bibliotheek

  • Introductie en creatie van afbeeldingen.
  • Presentatie van de bibliotheek.
  • Grafieken weergeven vanuit een Python script (plt.show()) of vanuit een notitieblok.
  • Gebruik MATLAB-stijl of objectgeoriënteerde stijl om grafieken weer te geven.
  • Pas de stijl van de afbeeldingen aan.
  • Figuur- en asobjecten.
  • Teken curven met plot().
  • Soorten afbeeldingen en interacties.
  • Scatterplots weergeven met scatter().
  • Geef foutbalken weer met error_bar().
  • Vul het gebied tussen twee lijnen met fill_between().
  • Teken histogrammen met hist().
  • 3D-grafieken tekenen met mplot3d.
  • Interactie met afbeeldingen in Jupyter notebook met behulp van de interact-widget.
  • Gebruik pandas plot om snel plots te maken: plot(), bar(), barh(), hist(), box(), scatter(), pie().

6
De Seaborn Bibliotheek

  • Introductie tot Seaborn en basisfuncties.
  • Seaborn PLC-werking: onderscheid tussen pads op figuurniveau en op asniveau.
  • Relationele Plots: functies gebruiken om relaties tussen variabelen uit te zetten.
  • Verdelingen uitzetten: functies gebruiken om gegevensverdelingen te visualiseren.
  • Kwalitatieve gegevens: categorische gegevens uitzetten.
  • Hittekaarten: gebruik de functie heatmap() om hittekaarten te tekenen.
  • Lineaire regressiemodellen: plot regressiemodellen met lmplot().
  • Afbeeldingen aanpassen: verander de manier waarop de figuur wordt weergegeven met behulp van de functies.

7
De Plotly-bibliotheek

  • Presentatie van de Plotly boekwinkel en Kaleido: introductie en verkenning van Plotly Express.
  • Krommen tekenen met line(): pas de figuur aan met de opties titel, breedte, hoogte, markering, labels, enz.
  • Gebiedsgrafieken maken met area(): patronen toevoegen met pattern_shape.
  • Puntwolken maken met scatter(): de opties size, size_max, opacity, symbol, color_continuous_ gebruiken
  • 3D-afbeeldingen: scatter_3d() en line_3d() gebruiken.
  • Maak staafdiagrammen op met bar() en histogrammen met histogram().
  • Teken kaarten met line_map(), scatter_map(), line_geo(), scatter_geo() en choropleth().


Data en plaats
Selecteer uw locatie of kies voor de les op afstand en kies vervolgens uw datum.
Klas op afstand

Dernières places
Date garantie en présentiel ou à distance
Session garantie

KLAS OP AFSTAND
2026 : 31 maa., 23 juni, 29 sep., 24 nov.

PARIS LA DÉFENSE
2026 : 7 apr., 16 juni, 22 sep., 17 nov.