Opleiding : Hadoop, installatie en beheer

Praktijkcursus - 4d - 28u00 - Ref. HOD
Prijs : 2520 € V.B.

Hadoop, installatie en beheer




Het Apache Hadoop platform was de eerste oplossing die (gedistribueerde) verwerking van enorme hoeveelheden gegevens echt mogelijk maakte. Deze cursus laat zien hoe je een Hadoop-cluster en andere componenten van het ecosysteem (Hive, Pig, HBase, Flume, enz.) installeert, configureert en beheert.


INTER
INTRA
OP MAAT

Praktijkcursus ter plaatse of via klasverband op afstand
Beschikbaar in het Engels op aanvraag

Ref. HOD
  4d - 28u00
2520 € V.B.




Het Apache Hadoop platform was de eerste oplossing die (gedistribueerde) verwerking van enorme hoeveelheden gegevens echt mogelijk maakte. Deze cursus laat zien hoe je een Hadoop-cluster en andere componenten van het ecosysteem (Hive, Pig, HBase, Flume, enz.) installeert, configureert en beheert.


Pedagogische doelstellingen
Aan het einde van de training is de deelnemer in staat om:
Ontdek de concepten en uitdagingen van Hadoop
Begrijpen hoe het platform en zijn onderdelen werken
Het platform installeren en beheren
Het platform optimaliseren

Doelgroep
Hadoop clusterbeheerders, ontwikkelaars.

Voorafgaande vereisten
Goede kennis van Linux administratie. Vereiste ervaring.

Praktische modaliteiten
Praktisch werk
Installatie en configuratie van het Hadoop-cluster.
Leer methodes
Lesmethode " met praktische oefeningen na elk uitgelegd concept of groep concepten.

Opleidingsprogramma

1
Presentatie van het Apache Hadoop-raamwerk

  • De uitdagingen van big data en de voordelen van het Hadoop framework.
  • Inleiding tot de Hadoop-architectuur.
  • Beschrijving van de belangrijkste onderdelen van het Hadoop-platform.
  • Presentatie van de belangrijkste distributies op de on-premise en on-cloud markt, en de hybride aanpak.
  • Voordelen/nadelen van het platform ten opzichte van alternatieve oplossingen.
  • Overzicht van de verschillende native en aanvullende componenten en vergelijkingen (Storm, Flink, Spark, enz.).

2
Het Hadoop-cluster voorbereiden en configureren

  • Bedieningsprincipes van het Hadoop Distributed File System (HDFS).
  • Werkingsprincipes van MapReduce.
  • Ontwerp "type" van het cluster.
  • Criteria voor apparatuurselectie.
Praktisch werk
Het Hadoop-cluster configureren.

3
Een Hadoop-platform installeren

  • Type inzet.
  • Hadoop installeren.
  • Installatie van andere componenten (Hive, Pig, HBase, Nifi, enz.).
  • Presentatie en vergelijking van historische (HDP, HDF, CDH) en huidige (CDP/CDSW...) softwarestacks.
  • Kappa, Lambda, SMACK-architecturen (Spark, Mesos, Akka, Cassandra, Kafka).
Praktisch werk
Een Hadoop-platform en de belangrijkste onderdelen ervan installeren.

4
Een Hadoop-cluster beheren

  • Hadoop-clusternodes beheren.
  • MapReduce V2 (Yarn, Resource Manager, Application Master, Node Manager, enz.).
  • Resourcemanagers (Yarn versus Mesos).
  • Taakbeheer via schedulers.
  • Logboekbeheer.
  • Procesplanning (Oozie).
  • Gebruik een manager.
Praktisch werk
Taken weergeven, wachtrijstatus, taakstatus, taakbeheer, WebUI-toegang.

5
Gegevensbeheer in HDFS

  • Externe gegevens (bestanden, relationele databases) importeren in HDFS.
  • Omgaan met HDFS bestanden.
  • Bestandsformaten (SequenceFile, ORC, Parquet, etc.), hun gebruik en hun relatie tot prestaties.
  • Databaseopslag (gestructureerd of ongestructureerd): NoSQL Hbase, SQL met Impala, Hive, Hive LLAP, enz.
Praktisch werk
Importeer externe gegevens met Flume of Nifi, importeer gegevens uit relationele databases met Sqoop.

6
Geavanceerde configuratie

  • Autorisaties en beveiliging: administratie, authenticatie, autorisaties, audit, gegevensbescherming.
  • Componenten betrokken bij beveiliging: Ranger, Knox, Kerberos, KMS, etc.
  • NameNode hoge beschikbaarheid (MRV2/YARN).
Praktisch werk
Configuratie van een authenticatie op serviceniveau (SLA) en een toegangscontrolelijst (ACL).

7
Bewaking en optimalisatie/tuning

  • Monitoring (Ambari, Cloudera Manager, Ganglia, enz.).
  • Soorten benchmark (DFSIO, Teragen/TeraSort/TeraValidate) en online beschikbare resultaten (TPCx-HS, etc.)
  • Vergelijking tussen MapReduce en TEZ.
  • Voorbeelden van optimalisatie en optimalisatietools (CDP-adviseur, enz.).
  • Keuze van blokgrootte.
  • Andere afstelopties (gebruik van compressie, geheugenconfiguratie, enz.).
Praktisch werk
Het opzetten, starten en analyseren van benchmarks en het begrijpen van nieuwe opdrachten voor clustermonitoring en optimalisatie.

8
De voordelen van Hadoop v3

  • Objectopslagbenaderingen (Ozone).
  • Erasure-codering.
  • Federatie van garen.
  • Migratiescenario's, aspecten om rekening mee te houden en een paar voorbeelden (Hortonworks naar Cloudera...).


Feedback van klanten
5 / 5
De feedback van klanten is afkomstig van eindevaluaties na de opleiding. De score wordt berekend op basis van alle evaluaties die minder dan 12 maanden oud zijn. Alleen die met een tekstcommentaar worden weergegeven.
THOMAS M.
04/11/25
5 / 5

De inhoud was goed aangepast aan onze behoeften en verwachtingen, en de trainer was zeer competent en leerzaam.
BASTIEN Z.
04/11/25
5 / 5

Een zeer goede cursus met veel praktische aspecten die de theoretische aspecten illustreren die tijdens de cursus zijn behandeld.
YENNIPENA JÉRÉMIE C.
20/10/25
5 / 5

De cursus is over het algemeen erg duidelijk en behandelt veel BIG DATA concepten en componenten.



Data en plaats
Selecteer uw locatie of kies voor de les op afstand en kies vervolgens uw datum.
Klas op afstand

Dernières places
Date garantie en présentiel ou à distance
Session garantie

KLAS OP AFSTAND
2026 : 23 juni, 22 sep.

PARIS LA DÉFENSE
2026 : 23 juni, 22 sep.