Publicatiedatum : 07/02/2024

Opleiding : Gegevensanalyse met R

gegevensmodellering en -representatie

Praktijkcursus - 4d - 28u00 - Ref. DTA
Prijs : 2520 € V.B.

Gegevensanalyse met R

gegevensmodellering en -representatie



Big Data Analytics omvat het beheersen van fundamentele gegevensverwerkingstechnieken: statistische methoden, classificaties, regressies, PCA, enz. Deze praktische cursus laat je aan de hand van echte gegevens zien hoe je deze technieken kunt gebruiken om modellen te bouwen en vervolgens te evalueren met behulp van de taal R.


INTER
INTRA
OP MAAT

Praktijkcursus ter plaatse of via klasverband op afstand
Beschikbaar in het Engels op aanvraag

Ref. DTA
  4d - 28u00
2520 € V.B.




Big Data Analytics omvat het beheersen van fundamentele gegevensverwerkingstechnieken: statistische methoden, classificaties, regressies, PCA, enz. Deze praktische cursus laat je aan de hand van echte gegevens zien hoe je deze technieken kunt gebruiken om modellen te bouwen en vervolgens te evalueren met behulp van de taal R.


Pedagogische doelstellingen
Aan het einde van de training is de deelnemer in staat om:
Het principe van statistische modellering begrijpen
Kiezen tussen regressie en classificatie afhankelijk van het type gegevens
De voorspellende prestatie van een algoritme evalueren
Selecties en rankings maken op basis van grote hoeveelheden gegevens om trends te identificeren

Doelgroep
Managers van datacentra (datamining, marketing, kwaliteit, enz.), databasegebruikers en bedrijfsmanagers.

Voorafgaande vereisten
Basiskennis van statistiek en R, of de cursussen "Statistiek, de grondbeginselen beheersen" (Ref. STA) en "R-omgeving, gegevensverwerking en analyse ... " (Ref. TDA) gevolgd hebben.

Opleidingsprogramma

1
Een herinnering aan de R-taal

  • Gegevenstypen in R.
  • Gegevens importeren-exporteren.
  • Technieken voor het tekenen van krommen en grafieken.
Rollenspel
Aan de slag met scripts en notitieblokken.

2
Analyse van componenten

  • Principale Componentenanalyse.
  • Correspondentieanalyse.
  • Meervoudige Correspondentieanalyse.
  • Factoriële analyse voor gemengde gegevens.
  • Hiërarchische classificatie op principale componenten.
Praktisch werk
Implementatie van de vermindering van het aantal variabelen en identificatie van de factoren die ten grondslag liggen aan de dimensies die verband houden met significante variabiliteit.

3
Modelleren

  • De stappen die nodig zijn om een model te bouwen.
  • Supervised en unsupervised algoritmen.
  • De keuze tussen regressie en classificatie.
Praktisch werk
Het opzetten van steekproeven van gegevenssets. Evaluatietests uitvoeren op verschillende geleverde modellen.

4
Modelevaluatieprocedures

  • Technieken voor herbemonstering in trainings-, validatie- en testspellen.
  • Testen van de representativiteit van trainingsgegevens.
  • Prestatiemetingen voor voorspellende modellen.
  • Verwarring en kostenmatrix, ROC- en AUC-curven.
Praktisch werk
Het opzetten van steekproeven van gegevenssets. Evaluatietests uitvoeren op verschillende geleverde modellen.

5
Algoritmen zonder toezicht

  • Hiërarchische clustering.
  • Niet-hiërarchische clustering.
  • Gemengde benaderingen.
Praktisch werk
Ongecontroleerde verwerking van clustering op verschillende datasets.

6
Algoritmen onder toezicht

  • Het principe van univariate lineaire regressie.
  • Multivariate regressie.
  • Polynomiale regressie.
  • Gereguleerde regressie.
  • De Naive Bayes.
  • Logistische regressie.
Praktisch werk
Implementatie van regressies en classificaties op verschillende soorten gegevens.

7
Tekstgegevensanalyse

  • Verzamelen en voorbewerken van tekstuele gegevens.
  • Extractie van primaire entiteiten, benoemde entiteiten en referentiële resolutie.
  • Grammaticale labeling, syntactische analyse, semantische analyse.
  • Lemmatisering. Vectorrepresentatie van teksten. TF-IDF weging.


Feedback van klanten
4 / 5
De feedback van klanten is afkomstig van eindevaluaties na de opleiding. De score wordt berekend op basis van alle evaluaties die minder dan 12 maanden oud zijn. Alleen die met een tekstcommentaar worden weergegeven.
CINDY S.
16/12/25
4 / 5

Oefeningen op minder gebruikelijke gegevenssets
XICHAO Y.
16/12/25
4 / 5

Duidelijke uitleg
ALICE R.
16/12/25
4 / 5

Zeer dichte cursus, ik had meer interactie en mondelinge deelname aan de oefeningen gewild.



Data en plaats
Selecteer uw locatie of kies voor de les op afstand en kies vervolgens uw datum.
Klas op afstand

Dernières places
Date garantie en présentiel ou à distance
Session garantie

KLAS OP AFSTAND
2026 : 16 juni, 1 dec.

PARIS LA DÉFENSE
2026 : 16 juni, 1 dec.