Opleiding : Gegevensanalyse met R

gegevensmodellering en -representatie

Praktijkcursus - 4d - 28u00 - Ref. DTA
Prijs : 2520 € V.B.

Gegevensanalyse met R

gegevensmodellering en -representatie



Big Data Analytics omvat het beheersen van fundamentele gegevensverwerkingstechnieken: statistische methoden, classificaties, regressies, PCA, enz. Deze praktische cursus laat je aan de hand van echte gegevens zien hoe je deze technieken kunt gebruiken om modellen te bouwen en vervolgens te evalueren met behulp van de taal R.


INTER
INTRA
OP MAAT

Praktijkcursus ter plaatse of via klasverband op afstand
Beschikbaar in het Engels op aanvraag

Ref. DTA
  4d - 28u00
2520 € V.B.




Big Data Analytics omvat het beheersen van fundamentele gegevensverwerkingstechnieken: statistische methoden, classificaties, regressies, PCA, enz. Deze praktische cursus laat je aan de hand van echte gegevens zien hoe je deze technieken kunt gebruiken om modellen te bouwen en vervolgens te evalueren met behulp van de taal R.


Pedagogische doelstellingen
Aan het einde van de training is de deelnemer in staat om:
Het principe van statistische modellering begrijpen
Kiezen tussen regressie en classificatie afhankelijk van het type gegevens
De voorspellende prestatie van een algoritme evalueren
Selecties en rankings maken op basis van grote hoeveelheden gegevens om trends te identificeren

Doelgroep
Managers van datacentra (datamining, marketing, kwaliteit, enz.), databasegebruikers en bedrijfsmanagers.

Voorafgaande vereisten
Basiskennis van statistiek en R, of de cursussen "Statistiek, de grondbeginselen beheersen" (Ref. STA) en "R-omgeving, gegevensverwerking en analyse ... " (Ref. TDA) gevolgd hebben.

Opleidingsprogramma

1
Een herinnering aan de R-taal

  • Gegevenstypen in R.
  • Gegevens importeren-exporteren.
  • Technieken voor het tekenen van krommen en grafieken.
Rollenspel
Aan de slag met scripts en notitieblokken.

2
Analyse van componenten

  • Principale Componentenanalyse.
  • Correspondentieanalyse.
  • Meervoudige Correspondentieanalyse.
  • Factoriële analyse voor gemengde gegevens.
  • Hiërarchische classificatie op principale componenten.
Praktisch werk
Implementatie van de vermindering van het aantal variabelen en identificatie van de factoren die ten grondslag liggen aan de dimensies die verband houden met significante variabiliteit.

3
Modelleren

  • De stappen die nodig zijn om een model te bouwen.
  • Supervised en unsupervised algoritmen.
  • De keuze tussen regressie en classificatie.
Praktisch werk
Het opzetten van steekproeven van gegevenssets. Evaluatietests uitvoeren op verschillende geleverde modellen.

4
Modelevaluatieprocedures

  • Technieken voor herbemonstering in trainings-, validatie- en testspellen.
  • Testen van de representativiteit van trainingsgegevens.
  • Prestatiemetingen voor voorspellende modellen.
  • Verwarring en kostenmatrix, ROC- en AUC-curven.
Praktisch werk
Het opzetten van steekproeven van gegevenssets. Evaluatietests uitvoeren op verschillende geleverde modellen.

5
Algoritmen zonder toezicht

  • Hiërarchische clustering.
  • Niet-hiërarchische clustering.
  • Gemengde benaderingen.
Praktisch werk
Ongecontroleerde verwerking van clustering op verschillende datasets.

6
Algoritmen onder toezicht

  • Het principe van univariate lineaire regressie.
  • Multivariate regressie.
  • Polynomiale regressie.
  • Gereguleerde regressie.
  • De Naive Bayes.
  • Logistische regressie.
Praktisch werk
Implementatie van regressies en classificaties op verschillende soorten gegevens.

7
Tekstgegevensanalyse

  • Verzamelen en voorbewerken van tekstuele gegevens.
  • Extractie van primaire entiteiten, benoemde entiteiten en referentiële resolutie.
  • Grammaticale labeling, syntactische analyse, semantische analyse.
  • Lemmatisering. Vectorrepresentatie van teksten. TF-IDF weging.


Publicatiedatum : 07/02/2024


Data en plaats
Selecteer uw locatie of kies voor de les op afstand en kies vervolgens uw datum.
Klas op afstand

Laatste plaatsen
Garantiedatum ter plaatse of op afstand
Gegarandeerde sessie

KLAS OP AFSTAND
2026 : 16 juni, 1 dec.

PARIS LA DÉFENSE
2026 : 16 juni, 1 dec.