Nos domaines de formation :

Formation Hadoop, installation et administration

4,2 / 5
Stage pratique
meilleur vente
Durée : 4 jours
Réf : HOD
Prix  2019 : 2540 € H.T.
Pauses et déjeuners offerts
  • Programme
  • Participants / Prérequis
  • Intra / sur-mesure
  • avis vérifiés
Programme

La plateforme Apache Hadoop permet de faciliter la création d'applications distribuées. Ce stage vous permettra de comprendre son architecture et vous donnera les connaissances nécessaires pour installer, configurer et administrer un cluster Hadoop. Vous apprendrez également à l'optimiser et le maintenir dans le temps.

Objectifs pédagogiques

  • Découvrir les concepts et les enjeux liés à Hadoop
  • Comprendre le fonctionnement de la plateforme et de ses composants
  • Installer la plateforme et la gérer
  • Optimiser la plateforme

Travaux pratiques

Installation du cluster Hadoop et paramétrage.

Méthodes pédagogiques

Méthode pédagogique de type "magistrale" avec des exercices pratiques à l'appui, après chaque notion ou groupe de notions exposées.
PROGRAMME DE FORMATION

Présentation du framework Apache Hadoop

  • Enjeux du Big Data et apports du framework Hadoop.
  • Présentation de l'architecture Hadoop.
  • Description des principaux composants de la plateforme Hadoop.
  • Présentation des distributions principales du marché et des outils complémentaires (Cloudera, MapR, Dataiku...).
  • Avantages/inconvénients de la plateforme.

Préparations et configuration du cluster Hadoop

  • Principes de fonctionnement de Hadoop Distributed File System (HDFS).
  • Principes de fonctionnement de MapReduce.
  • Design "type" du cluster.
  • Critères de choix du matériel.

Travaux pratiques
Configuration du cluster Hadoop.

Installation d'une plateforme Hadoop

  • Type de déploiement.
  • Installation d'Hadoop.
  • Installation d'autres composants (Hive, Pig, HBase, Flume...).

Travaux pratiques
Installation d'une plateforme Hadoop et des composants principaux.

Gestion d'un cluster Hadoop

  • Gestion des nœuds du cluster Hadoop.
  • Les TaskTracker, JobTracker pour MapReduce.
  • Gestion des tâches via les schedulers.
  • Gestion des logs.
  • Utiliser un manager.

Travaux pratiques
Lister les jobs, statut des queues, statut des jobs, gestion des tâches, accès à la Web UI.

Gestion des données dans HDFS

  • Import de données externes (fichiers, bases de données relationnelles) vers HDFS.
  • Manipulation des fichiers HDFS.

Travaux pratiques
Importer des données externes avec Flume, consulter des bases de données relationnelles avec Sqoop.

Configuration avancée

  • Gestion des autorisations et de la sécurité.
  • Reprise sur échec d'un name node (MRV1).
  • NameNode high availability (MRV2/YARN).

Travaux pratiques
Configuration d'un service-level authentication (SLA) et d'un Access Control List (ACL).

Monitoring et optimisation Tuning

  • Monitoring (Ambari, Ganglia...).
  • Benchmarking/profiling d'un cluster.
  • Les outils Apache GridMix, Vaaidya.
  • Choisir la taille des blocs.
  • Autres options de tuning (utilisation de la compression, configuration mémoire...).

Travaux pratiques
Appréhender les commandes au fil de l'eau de monitoring et d'optimisation de cluster.

Participants / Prérequis

» Participants

Administrateurs de cluster Hadoop, développeurs.

» Prérequis

Bonnes connaissances de l'administration Linux. Expérience requise.
Intra / sur-mesure
Programme standard     Programme sur-mesure
Oui / Non

Vos coordonnées

Avis vérifiés
picto avis vérifiés
OTHMANE B. 04/09/2018
4 / 5
Manque quelque guides dans les TP ( J'aurai aimé si y a plus de description sur les instructions dans les tp)

Marc R. 04/09/2018
4 / 5
Contenu très (trop ?) riche.

Isabelle G. 04/09/2018
4 / 5
contenu ok , pédagogie ok

MACHHOURI 15/05/2018
4 / 5
Manque de directives par rapport à la partie pratique, sinon rien à dire par rapport la partie théorique. Vaut mieux partir sur 5 jours de formation au lieu de 4 jours le sujet est vachement vague !

Rémi G. 15/05/2018
4 / 5
Stéphane était vraiment l'écoute de nos questions très appréciable.

Pierre R. 15/05/2018
5 / 5
un bon equilibre pratique/théorie + une bonne vision de l'ecosystem

Marc B. 15/05/2018
5 / 5
très bien , je recommande cette formation et le formateur a mes collègues et mon réseau.

Patrick B. 09/04/2018
4 / 5
Formation et formateur intéressant. Dommage que la partie manipulation nécessite autant de copier/coller...

Nicolas V. 09/04/2018
5 / 5
La partie installation et configuration de l'environnement est trop répétitive. Une fois la stratégie générale d'installation et de configuration comprise pour un premier module, sa répétition pour les nombreux autres modules est peu instructive et prend un temps trop important qui pourrait être utilisé pour plus de contenu théorique ou d'autres manipulation (sauvegarde, restauration, tests de disponibilit[eacute

thomas t. 09/04/2018
5 / 5
très bien. Bon matériel, bon formateur, bons locaux.
Avis client 4,2 / 5

Les avis client sont issus des feuilles d’évaluation de fin de formation. La note est calculée à partir de l’ensemble des avis datant de moins de 12 mois.

Pour vous inscrire

Cliquez sur la ville, puis sur la date de votre choix.
[+]
PARIS
[+]
AIX
[+]
BORDEAUX
[+]
LILLE
[+]
LYON
[+]
NANTES
[+]
SOPHIA-ANTIPOLIS
[+]
STRASBOURG
[+]
TOULOUSE

Horaires

Les cours ont lieu de 9h à 12h30 et de 14h à 17h30.
Les participants sont accueillis à partir de 8h45.
Pour les stages pratiques de 4 ou 5 jours, les sessions se terminent à 15h30 le dernier jour.