Opleiding : Hadoop, toepassingen ontwikkelen voor Big Data

Praktijkcursus - 4d - 28u00 - Ref. APH
Prijs : 2520 € V.B.

Hadoop, toepassingen ontwikkelen voor Big Data




In deze praktische cursus leert u applicaties ontwikkelen waarmee u gedistribueerde gegevens in batchmodus kunt verwerken. Je zult gegevens in heterogene formaten verzamelen, opslaan en verwerken met Apache Hadoop om verwerkingsketens op te zetten die geïntegreerd zijn in je informatiesysteem.


INTER
INTRA
OP MAAT

Praktijkcursus ter plaatse of via klasverband op afstand
Disponible en anglais, à la demande

Ref. APH
  4d - 28u00
2520 € V.B.




In deze praktische cursus leert u applicaties ontwikkelen waarmee u gedistribueerde gegevens in batchmodus kunt verwerken. Je zult gegevens in heterogene formaten verzamelen, opslaan en verwerken met Apache Hadoop om verwerkingsketens op te zetten die geïntegreerd zijn in je informatiesysteem.


Pedagogische doelstellingen
Aan het einde van de training is de deelnemer in staat om:
Een op MapReduce gebaseerd programma bouwen
Hadoop HBase integreren in een bedrijfsworkflow
Travailler avec Apache Hive et Pig depuis Hadoop Distributed File System (HDFS)
Een taakgrafiek gebruiken met Hadoop

Doelgroep
Concepteurs, développeurs.

Voorafgaande vereisten
Goede ervaring met Java-ontwikkeling. Kennis van webarchitectuur is een pluspunt.

Praktische modaliteiten
Praktisch werk
Ontwikkeling van Big Data-toepassingen.
Leer methodes
Hoorcolleges 30%, praktisch werk 70%.

Opleidingsprogramma

1
Grote gegevens

  • De reikwijdte van big data definiëren.
  • De rol van het Hadoop-project.
  • De basisconcepten van big data projecten.
  • Inleiding tot cloud computing.
  • Het verschil tussen private en publieke cloud computing.
  • Big data-architecturen gebaseerd op het Hadoop-project.
Demonstratie
Gebruik van Hadoop en GoogleApp.

2
Gegevens verzamelen en MapReduce toepassen

  • Analyse van gegevensstromen binnen het bedrijf.
  • Gestructureerde en ongestructureerde gegevens.
  • De principes van semantische analyse van bedrijfsgegevens.
  • Op MapReduce gebaseerde taakgrafiek.
  • Granulariteit gegevensconsistentie.
  • Gegevens overbrengen van een persistentiesysteem naar Hadoop.
  • Gegevens overbrengen van een cloud naar Hadoop.
Praktisch werk
Het verzamelen van klantgegevens beheren met MapReduce. De Yarn implementatie configureren. Een op MapReduce gebaseerde taak ontwikkelen.

3
Gegevensopslag met HBase

  • Verschillende soorten XML-databases.
  • Gebruikspatronen en hun toepassing op de cloud.
  • Toepassing van Hadoop-database binnen een workflow.
  • Gebruik van Hive/Pig projecten.
  • Gebruik van het HCatalog project.
  • De HBase Java API.
Praktisch werk
Wijzigingen in een gegevenscatalogus van leveranciers beheren.

4
Gegevensopslag op HDFS

  • Gebruikspatronen en hun toepassing op de cloud.
  • Architectuur en installatie van een HDFS-systeem, journaal, NameNode, DataNode.
  • Operaties, bestellingen en orderbeheer.
  • De Java HDFS API.
  • Gegevensanalyse met Apache Pig.
  • De taal Pig Latin. Apache Pig gebruiken met Java.
  • Query's uitvoeren met Apache Hive.
  • Gegevensreplicatie. Het delen van gegevens op een HDFS-architectuur.
Praktisch werk
Een gedeelde cliëntrepository op Hadoop beheren. De visualisatieconsole gebruiken.

5
Springgegevens Hadoop

  • Inleiding tot Spring en Spring Data.
  • De Hadoop-namespace voor Spring.
  • Spring gebruiken om Hadoop-configuratie te vereenvoudigen.
  • Gedistribueerde cacheconfiguratie.
  • Jobdefinitie en afhankelijkheid tussen jobs.
  • Integratie van tools (Pig, Hive, enz.).
Praktisch werk
Herontwerp van het beheer van de leveranciersgegevenscatalogus met behulp van Spring Data.


Data en plaats
Selecteer uw locatie of kies voor de les op afstand en kies vervolgens uw datum.
Klas op afstand

Dernières places
Date garantie en présentiel ou à distance
Session garantie

KLAS OP AFSTAND
2026 : 26 mei, 6 okt.

PARIS LA DÉFENSE
2026 : 26 mei, 6 okt.