Publicatiedatum : 29/09/2025

Opleiding : Big Data - Python voor gegevensanalyse

Praktijkcursus - 3d - 21u00 - Ref. PBD
Prijs : 2010 € V.B.

Big Data - Python voor gegevensanalyse




De taal Python heeft een wetenschappelijk ecosysteem dat statistische verwerking mogelijk maakt, van de constructie van analysemodellen tot de evaluatie en representatie ervan. Deze cursus stelt je in staat om gegevens uit verschillende bronnen te analyseren met behulp van Python-bibliotheken.


INTER
INTRA
OP MAAT

Ter plaatse of via klasverband op afstand
Beschikbaar in het Engels op aanvraag

Ref. PBD
  3d - 21u00
2010 € V.B.




De taal Python heeft een wetenschappelijk ecosysteem dat statistische verwerking mogelijk maakt, van de constructie van analysemodellen tot de evaluatie en representatie ervan. Deze cursus stelt je in staat om gegevens uit verschillende bronnen te analyseren met behulp van Python-bibliotheken.


Pedagogische doelstellingen
Aan het einde van de training is de deelnemer in staat om:
Het principe van statistische modellering begrijpen
Weten hoe je de belangrijkste tools voor gegevensverwerking en analyse voor Python gebruikt
Weten hoe je best practice toepast bij het opschonen en voorbereiden van gegevens voorafgaand aan de analyse.
Kiezen tussen regressie en classificatie afhankelijk van het type gegevens
Leer hoe je een eenvoudig leermodel opzet
Gegevens uit een bestand kunnen halen

Doelgroep
Python-ontwikkelaars, datacenterbeheerders, softwareontwikkelaars, programmeurs, gegevensanalisten, gegevenswetenschappers.

Voorafgaande vereisten
Beheersing van Python programmeren. Basiskennis van statistiek of afronding van de cursus "Statistics, mastering the fundamentals" (Ref. STA).

Praktische modaliteiten
Analyses ontwikkelen/uitvoeren met Python, met behulp van de modules Pandas, Numpy en SciPy.

Opleidingsprogramma

1
Presentatie van het wetenschappelijke Python-ecosysteem

  • Overzicht van het wetenschappelijke ecosysteem van Python: de essentiële bibliotheken.
  • Weet waar je nieuwe boekwinkels kunt vinden en beoordeel hun duurzaamheid.
  • De belangrijkste open source tools en software voor data science.
Praktisch werk
Installatie van Python 3, Anaconda en Jupiter Notebook.

2
Werken met gegevens in Python

  • De wetenschappelijke basis van Python: de SciPy Stack.
  • Best practices voor een goede start van uw data science project met Python.
  • Wetenschappelijke bestandsformaten en bibliotheken om ze te manipuleren.
  • Pandas: analyse van gegevens in tabelvorm (CSV-bestanden, Excel, enz.), statistieken, pivots, filters, zoekopdrachten, enz.
  • NumPy: numerieke berekening en lineaire algebra (vectoren, matrices, afbeeldingen).
  • Gegevensextractie, voorbereiding en opschoning.
Praktisch werk
Python-scripts schrijven om met gegevens uit bestanden te werken, om filters, opmaak- en opschoningsprocessen toe te passen.

3
Inleiding tot modelleren

  • De stappen die nodig zijn om een model te bouwen.
  • Supervised en unsupervised algoritmen.
  • De keuze tussen regressie en classificatie.
Praktisch werk
Integratie van Python-scripts in de geïnstalleerde omgeving voor analyse.

4
Modelevaluatieprocedures

  • Technieken voor herbemonstering in trainings-, validatie- en testspellen.
  • Testen van de representativiteit van trainingsgegevens.
  • Prestatiemetingen voor voorspellende modellen.
  • Verwarring en kostenmatrix, ROC- en AUC-curven.
Praktisch werk
Het opzetten van steekproeven van gegevenssets. Evaluatietests uitvoeren op verschillende geleverde modellen.

5
Algoritmen onder toezicht

  • Het principe van univariate lineaire regressie.
  • Multivariate regressie.
  • Polynomiale regressie.
  • Gereguleerde regressie.
  • De Naive Bayes.
  • Logistische regressie.
Praktisch werk
Implementatie van regressies en classificaties op verschillende soorten gegevens.

6
Algoritmen zonder toezicht

  • Hiërarchische clustering.
  • Niet-hiërarchische clustering.
  • Gemengde benaderingen.
Praktisch werk
Ongecontroleerde verwerking van clustering op verschillende datasets.


Feedback van klanten
4,6 / 5
De feedback van klanten is afkomstig van eindevaluaties na de opleiding. De score wordt berekend op basis van alle evaluaties die minder dan 12 maanden oud zijn. Alleen die met een tekstcommentaar worden weergegeven.
CAMILLE L.
03/11/25
5 / 5

de inhoud was erg goed, het tempo was hoog en de spreker was leerzaam en grappig.
NICOLAS M.
03/11/25
4 / 5

interessante en gepassioneerde spreker, die de tijd nam om het onderwerp uit te leggen en te openen. Een geweldige tijd
GAËL R.
03/11/25
4 / 5

Ik had de inhoud van de training die mijn werkgever aanbood verkeerd ingeschat na mijn verzoek om verder te komen in Python. Volgens de titel verwachtte ik meer een Data Analist dan een Data Scientist, die Python gebruikt om data te laden en transformeren (ETL). Het statistiekgedeelte zou ik waarschijnlijk niet kunnen gebruiken, maar het was erg interessant en het lijkt me mogelijk om in 3 dagen een 'operationeel' pakket samen te stellen voor dit ETL-gedeelte.



Data en plaats
Selecteer uw locatie of kies voor de les op afstand en kies vervolgens uw datum.
Klas op afstand

Laatste plaatsen
Garantiedatum ter plaatse of op afstand
Gegarandeerde sessie

KLAS OP AFSTAND
2026 : 22 juni, 21 sep., 30 nov.

PARIS LA DÉFENSE
2026 : 22 juni, 21 sep., 30 nov.