ORSYS formation
NOUS CONTACTER - +33 (0)1 49 07 73 73
NOUS CONTACTER - 📞 +33 (0)1 49 07 73 73    espace pro ESPACE PRO     inscription formation orsys S'INSCRIRE     drapeau francais   drapeau anglais
Nos domaines de formation :
Toutes nos formations Big Data, NoSQL

Formation HDFS, utiliser le système de fichiers distribué d'Hadoop
E-learning

Stage pratique
100% à distance
Durée : 1 heure 58 mn
Réf : 4TO
Prix  2019 : 30 € H.T.
  • Programme
  • Participants / Prérequis
Programme

Cette vidéo présente l'HDFS (Hadoop Distributed File System) et ses particularités afin d'en obtenir une connaissance approfondie. Elle va vous permettre également de développer une application se basant sur l'HDFS - en lien ou non avec Hadoop - et de profiter ainsi de ses possibilités de réplication et de très haute disponibilité. Après une introduction rapide des systèmes de fichiers en général puis d'Hadoop, nous nous pencherons sur les spécificités de l'HDFS : parallélisation et réplication des fichiers par blocs. Ensuite, nous détaillerons HadoopFS, une couche d'abstraction permettant d'interagir avec des systèmes de fichiers, qu'ils soient locaux ou distribués comme l'HDFS, Amazon S3, Cassandra, CephFS. Nous étudierons les interfaces qu'offre HadoopFS pour contrôler les systèmes de fichiers compatibles et notamment l'HDFS, que ce soit en ligne de commande, en programmation Java ou via des appels HTTP. Nous illustrerons chacune de ces possibilités par des exemples simples et concrets. Enfin, nous nous pencherons plus spécifiquement sur le fonctionnement profond de l'HDFS et de ses services afin de comprendre au mieux ses particularités : la notion de NameNode, de DataNode et les points essentiels du stockage dans l'HDFS.

PROGRAMME DE FORMATION

Présentation de l’HDFS

  • Introduction aux systèmes de fichiers
  • Histoire de l’HDFS
  • Couche d’abstraction HadoopFS

Notions principales et fonctionnement

  • Réplication
  • Notion de block size
  • Compression dans l’HDFS
  • Permissions du système de fichiers
  • Vérification de l’intégrité du système : La commande FSCK
  • Équilibrage du cluster : Le balancer

Prise en main

  • Contrôle de l’HDFS via la ligne de commande
  • API Java pour les opérations sur l’HDFS
  • WebHDFS pour l’accès à l’HDFS en HTTP
  • HDFS en entrée et en sortie des MapReduce

Mise en place d'un cluster HDFS

  • Schéma global de fonctionnement
  • Anatomie d’une lecture/d’une écriture sur l’HDFS
  • Services de l’HDFS
  • Fédération de clusters HDFS, snapshots et corbeille
  • Mise en place de la haute disponibilité
Participants / Prérequis

» Participants

Cette vidéo de formation s'adresse à tout développeur, administrateur système ou décideur informatique.

» Prérequis

Aucune connaissance particulière.
Intra / sur-mesure

Demande de devis intra-entreprise
(réponse sous 48h)

Vos coordonnées

En cochant cette case, j’atteste avoir lu et accepté les conditions liées à l’usage de mes données dans le cadre de la réglementation sur la protection des données à caractère personnel (RGPD).
Vous pouvez à tout moment modifier l’usage de vos données et exercer vos droits en envoyant un email à l’adresse rgpd@orsys.fr
En cochant cette case, j’accepte de recevoir les communications à vocation commerciale et promotionnelle de la part d’ORSYS Formation*
Vous pouvez à tout moment vous désinscrire en utilisant le lien de désabonnement inclus dans nos communications.
* Les participants inscrits à nos sessions de formation sont également susceptibles de recevoir nos communications avec la possibilité de se désabonner à tout moment.
En poursuivant votre navigation, vous acceptez l’utilisation de cookies nous permettant de vous proposer des offres correspondant à vos centres d’intérêt.
En savoir plus sur l’usage des cookies…   ✖ Fermer
linkedin orsys
twitter orsys
it! orsys
instagram orsys
pinterest orsys
facebook orsys
youtube orsys