> Formations > Technologies numériques > Langages et développement > Python > Formation NLP, traitement du langage naturel avec Python > Formations > Technologies numériques > Formation NLP, traitement du langage naturel avec Python

Formation : NLP, traitement du langage naturel avec Python

Natural Language Processing avec les outils et bibliothèques Python

NLP, traitement du langage naturel avec Python

Natural Language Processing avec les outils et bibliothèques Python


Nouvelle formation Formation Blended

Ce cours enseigne l'utilisation de Python pour le traitement du langage naturel : la préparation des données, la représentation de textes et leur modélisation. Le participant utilise des outils et bibliothèques Python pour effectuer des tâches courantes de NLP, met en œuvre et applique des modèles de NLP.


INTER
INTRA
SUR MESURE

Cours pratique en présentiel ou à distance
Disponible en anglais, à la demande

Réf. PTS
  3j - 21h00
Prix : 1900 € H.T.
Pauses-café et
déjeuners offerts
En option :
Dynamique.Model.Bean_FormationOption
Blended : 190 € HT




Ce cours enseigne l'utilisation de Python pour le traitement du langage naturel : la préparation des données, la représentation de textes et leur modélisation. Le participant utilise des outils et bibliothèques Python pour effectuer des tâches courantes de NLP, met en œuvre et applique des modèles de NLP.


Objectifs pédagogiques
À l’issue de la formation, le participant sera en mesure de :
Utiliser python pour traiter des données textuelles
Choisir les outils et bibliothèques Python nécessaires au traitement
Mettre en place les différentes étapes de préprocessing et de vectorisation
Utiliser les techniques appropriées en fonction des objectifs : classification / topic modelling / analyse de sentiment
Appliquer et évaluer des modèles sur des données réelles

Prérequis
Connaissances de programmation en Python.
Vérifiez que vous avez les prérequis nécessaires pour profiter pleinement de cette formation en faisant  ce test.

Modalités d'évaluation
Le formateur évalue la progression pédagogique du participant tout au long de la formation au moyen de QCM, mises en situation, travaux pratiques…
Le participant complète également un test de positionnement en amont et en aval pour valider les compétences acquises.

Programme de la formation

1
Environnement Python pour le NLP

  • L'environnement de développement Python / Anaconda / Jupyter Notebook.
  • Les principaux types de données : chaînes, booléennes, nombres, listes, tuples et dictionnaires.
  • Les structures de contrôles : les boucles for et while, le test if/elif/else.
  • Les fonctions : création, passage de paramètres, valeurs par défaut, arguments variables.
  • Numpy : vecteurs, matrices, slicing, concaténation.
  • Pandas : l’analyse de données tabulaires (CSV, Excel...), statistiques, pivots, jointures, filtres.
Travaux pratiques
Manipulation de Python dans un notebook Jupyter. Exercice de mise en pratique avec pandas et numpy.

2
Prétraitement des données textuelles

  • Identifier ce que sont des données textuelles et présentation des librairies spaCy et nltk.
  • Tokenisation des mots.
  • Suppression des stop-words, de la ponctuation et des éléments non essentiels à l’analyse.
  • Lemmatisation vs racinisation (stemming).
Travaux pratiques
Preprocessing sur des corpus de textes avec les 2 librairies, comparaison des résultats et des façons d’implémenter. Création de listes de stop-words, comparaison lemmatisation et de racinisation.

3
Extraction d'informations

  • Identification de la nature grammatical des mots à l’aide du Part Of Speech Tagging.
  • Identifier des personnes, lieux etc avec le Named Entity Recognition.
Travaux pratiques
Mettre en place le Part Of Speech Tagging et le Named Entity Recognition. Analyse des résultats, filtres sur certaines catégories grammaticales, sur les noms propres.

4
Représentation vectorielle des données textuelles

  • Bag of words.
  • Pondération tf-idf.
  • Approche avec des n-grams.
  • Les embeddings : word2vec, gloVe, fastTesxt..
Travaux pratiques
Transformation d’un corpus de texte en utilisant différentes approches : bag of words, tf-idf, word2vec, gloVe. Comparaison des vecteurs.

5
Machine learning sur des données textuelles

  • Rappels sur les étapes de construction d'un modèle prédictif.
  • Classification.
  • Analyse de sentiment.
  • Topic modelling.
Travaux pratiques
Modélisation en utilisant différents types de vecteurs (bag of words vs embeddings). Analyse de sentiment sur des tweets.

6
Procédures d'évaluation de modèles

  • Les techniques de rééchantillonnage en jeu d'apprentissage, de validation et de test.
  • Test de représentativité des données d'apprentissage.
  • Mesures de performance des modèles prédictifs.
  • Matrice de confusion.
Travaux pratiques
Construire et évaluer un modèle NLP de façon appliquée..


Parcours certifiants associés
Pour aller plus loin et renforcer votre employabilité, découvrez les parcours certifiants qui contiennent cette formation :

Options
Blended : 190 € HT
Approfondissez les connaissances acquises en formation grâce aux modules e-learning de notre Chaîne e-learning Python Data Science. Un apprentissage flexible et complet, à suivre à votre rythme dès le premier jour de votre présentiel et pendant 1 an.

Solutions de financement
Plusieurs solutions existent pour financer votre formation et dépendent de votre situation professionnelle.
Découvrez-les sur notre page Comment financer sa formation ou contactez votre conseiller formation.

Horaires
les cours ont lieu de 9h à 12h30 et de 14h à 17h30.
Les participants sont accueillis à partir de 8h45. Les pauses et déjeuners sont offerts.
Pour les stages pratiques de 4 ou 5 jours, quelle que soit la modalité, les sessions se terminent à 16h le dernier jour.

Dates et lieux
Sélectionnez votre lieu ou optez pour la classe à distance puis choisissez votre date.
Classe à distance

Dernières places
Date garantie en présentiel ou à distance
Session garantie




PARTICIPANTS
Futurs managers et responsables d’équipe souhaitant structurer leur pratique managériale

PRÉREQUIS
Aucun

COMPÉTENCES DU FORMATEUR
Les experts qui animent la formation sont des spécialistes des matières abordées. Ils ont été validés par nos équipes pédagogiques tant sur le plan des connaissances métiers que sur celui de la pédagogie, et ce pour chaque cours qu’ils enseignent. Ils ont au minimum cinq à dix années d’expérience dans leur domaine et occupent ou ont occupé des postes à responsabilité en entreprise.

MODALITÉS D’ÉVALUATION
Le formateur évalue la progression pédagogique du participant tout au long de la formation au moyen de QCM, mises en situation, travaux pratiques… Le participant complète également un test de positionnement en amont et en aval pour valider les compétences acquises.

MOYENS PÉDAGOGIQUES ET TECHNIQUES
• Les moyens pédagogiques et les méthodes d’enseignement utilisés sont principalement : aides audiovisuelles, documentation et support de cours, exercices pratiques d’application et corrigés des exercices pour les stages pratiques, études de cas ou présentation de cas réels pour les séminaires de formation. • À l’issue de chaque stage ou séminaire, ORSYS fournit aux participants un questionnaire d’évaluation du cours qui est ensuite analysé par nos équipes pédagogiques. • Une feuille d’émargement par demi-journée de présence est fournie en fin de formation ainsi qu’une attestation de fin de formation si le stagiaire a bien assisté à la totalité de la session.

MODALITÉS ET DÉLAIS D’ACCÈS
L’inscription doit être finalisée 24 heures avant le début de la formation.

ACCESSIBILITÉ AUX PERSONNES HANDICAPÉES
Pour toute question ou besoin relatif à l’accessibilité, vous pouvez joindre notre équipe PSH par e-mail à l'adresse psh-accueil@orsys.fr.