> Formations > Technologies numériques > Développement logiciel > Python > Formation Python pour le traitement du langage naturel (NLP) > Formations > Technologies numériques > Formation Python pour le traitement du langage naturel (NLP)

Formation : Python pour le traitement du langage naturel (NLP)

Natural Language Processing avec les outils et bibliothèques Python

Python pour le traitement du langage naturel (NLP)

Natural Language Processing avec les outils et bibliothèques Python


New

Ce cours enseigne l'utilisation de Python pour le traitement du langage naturel : la préparation des données, la représentation de textes et leur modélisation. Le participant utilise des outils et bibliothèques Python pour effectuer des tâches courantes de NLP, met en œuvre et applique des modèles de NLP.


INTER
INTRA
SUR MESURE

Cours pratique
Disponible en anglais, à la demande

Réf. PTS
  3j - 21h00
Prix : 1900 € H.T.
Pauses-café et
déjeuners offerts




Ce cours enseigne l'utilisation de Python pour le traitement du langage naturel : la préparation des données, la représentation de textes et leur modélisation. Le participant utilise des outils et bibliothèques Python pour effectuer des tâches courantes de NLP, met en œuvre et applique des modèles de NLP.


Objectifs pédagogiques
À l’issue de la formation, le participant sera en mesure de :
Utiliser python pour traiter des données textuelles
Choisir les outils et bibliothèques Python nécessaires au traitement
Mettre en place les différentes étapes de préprocessing et de vectorisation
Utiliser les techniques appropriées en fonction des objectifs : classification / topic modelling / analyse de sentiment
Appliquer et évaluer des modèles sur des données réelles

Prérequis
Connaissances de programmation en Python.

Modalités d'évaluation
Le formateur évalue la progression pédagogique du participant tout au long de la formation au moyen de QCM, mises en situation, travaux pratiques…
Le participant complète également un test de positionnement en amont et en aval pour valider les compétences acquises.

Programme de la formation

Environnement Python pour le NLP

  • L'environnement de développement Python / Anaconda / Jupyter Notebook.
  • Les principaux types de données : chaînes, booléennes, nombres, listes, tuples et dictionnaires.
  • Les structures de contrôles : les boucles for et while, le test if/elif/else.
  • Les fonctions : création, passage de paramètres, valeurs par défaut, arguments variables.
  • Numpy : vecteurs, matrices, slicing, concaténation.
  • Pandas : l’analyse de données tabulaires (CSV, Excel...), statistiques, pivots, jointures, filtres.
Travaux pratiques
Manipulation de Python dans un notebook Jupyter. Exercice de mise en pratique avec pandas et numpy.

Prétraitement des données textuelles

  • Identifier ce que sont des données textuelles et présentation des librairies spaCy et nltk.
  • Tokenisation des mots.
  • Suppression des stop-words, de la ponctuation et des éléments non essentiels à l’analyse.
  • Lemmatisation vs racinisation (stemming).
Travaux pratiques
Preprocessing sur des corpus de textes avec les 2 librairies, comparaison des résultats et des façons d’implémenter. Création de listes de stop-words, comparaison lemmatisation et de racinisation.

Extraction d'informations

  • Identification de la nature grammatical des mots à l’aide du Part Of Speech Tagging.
  • Identifier des personnes, lieux etc avec le Named Entity Recognition.
Travaux pratiques
Mettre en place le Part Of Speech Tagging et le Named Entity Recognition. Analyse des résultats, filtres sur certaines catégories grammaticales, sur les noms propres.

Représentation vectorielle des données textuelles

  • Bag of words.
  • Pondération tf-idf.
  • Approche avec des n-grams.
  • Les embeddings : word2vec, gloVe, fastTesxt..
Travaux pratiques
Transformation d’un corpus de texte en utilisant différentes approches : bag of words, tf-idf, word2vec, gloVe. Comparaison des vecteurs.

Machine learning sur des données textuelles

  • Rappels sur les étapes de construction d'un modèle prédictif.
  • Classification.
  • Analyse de sentiment.
  • Topic modelling.
Travaux pratiques
Modélisation en utilisant différents types de vecteurs (bag of words vs embeddings). Analyse de sentiment sur des tweets.

Procédures d'évaluation de modèles

  • Les techniques de rééchantillonnage en jeu d'apprentissage, de validation et de test.
  • Test de représentativité des données d'apprentissage.
  • Mesures de performance des modèles prédictifs.
  • Matrice de confusion.
Travaux pratiques
Construire et évaluer un modèle NLP de façon appliquée..


Parcours certifiants associés
Pour aller plus loin et renforcer votre employabilité, découvrez les parcours certifiants qui contiennent cette formation :

Solutions de financement
Plusieurs solutions existent pour financer votre formation et dépendent de votre situation professionnelle.
Découvrez-les sur notre page Comment financer sa formation ou contactez votre conseiller formation.

Avis clients
4,4 / 5
Les avis clients sont issus des évaluations de fin de formation. La note est calculée à partir de l’ensemble des évaluations datant de moins de 12 mois. Seules celles avec un commentaire textuel sont affichées.
ELIANA W.
01/07/24
5 / 5

Par rapport à la documentation, il pourrait être intéressant d’avoir une bibliographie introductive avant le cours. Ainsi, nous pourrions mieux comprendre les sujets et avoir plus de pratique.
JEAN-CHRISTOPHE R.
01/07/24
4 / 5

Beaucoup trop de théorie, de concepts abstraits, de formules mathématiques pour expliquer comment fonctionnent tous les composants de de l’IA et du NLP. Un peu plus d’exercices et de mises en pratique en python auraient été les bienvenues. Peut-être n’avais-je pas les connaissances théoriques minimales nécessaires pour suivre cette formation. Peut-être la formation en elle-même est-elle trop dense et que 4 jours auraient été plus confortables que 3.
VICTOR H.
01/07/24
4 / 5

Enseignant dynamique qui sait bien vulgariserUn peu plus d’exercices pratiques serait souhaitable



Horaires
les cours ont lieu de 9h à 12h30 et de 14h à 17h30.
Les participants sont accueillis à partir de 8h45. Les pauses et déjeuners sont offerts.
Pour les stages pratiques de 4 ou 5 jours, quelle que soit la modalité, les sessions se terminent à 16h le dernier jour.

Dates et lieux
Sélectionnez votre lieu ou optez pour la classe à distance puis choisissez votre date.
Classe à distance
Dernières places
Session garantie