> formation Technologies numériques > formation Big Data, Intelligence Artificielle > formation IA, Machine Learning, analyse de données > formation Text Mining par la pratique

Avis loadedNote : 4,6Length : 14TotalNote : 255TotalNote20 : 9
Toutes nos formations IA, Machine Learning, analyse de données

Formation Text Mining par la pratique

4,6 / 5
Stage pratique
Durée : 3 jours
Réf : MMD
Prix  2021 : 2240 € H.T.
Pauses et déjeuners offerts
  • Programme
  • Participants / Prérequis
  • Intra / sur-mesure
  • avis clients
Programme

Le Data Mining restreint aux données textuelles - le Text Mining - est de plus en plus utilisé dans les entreprises. Il permet, par exemple, de classer des produits à partir des commentaires des consommateurs. Vous mettrez en œuvre les algorithmes et les outils du Text Mining sur des exemples paradigmatiques.

Objectifs pédagogiques

À l’issue de la formation, le participant sera en mesure de :
  • Comprendre les méthodes de la statistique textuelle
  • Mettre en œuvre l’extraction des caractéristiques de données textuelles
  • Créer des sélections et des classements dans de grands volumes de données textuelles
  • Choisir un algorithme de classification
  • Évaluer les performances prédictives d'un algorithme
PROGRAMME DE FORMATION

Les approches traditionnelles en Text Mining

  • Les API pour récupérer des données textuelles.
  • La préparation des données textuelles en fonction de la problématique.
  • La récupération et l'exploration du corpus de textes.
  • La suppression des caractères accentués et spéciaux.
  • Stemming, Lemmatization et suppression des mots de liaison.
  • Tout rassembler pour nettoyer et normaliser les données.

Travaux pratiques
La recherche des documents, la préparation, la transformation et la vectorisation des données en DataFrame.

Feature Engineering pour la représentation de texte

  • Comprendre la syntaxe et la structure du texte.
  • Le modèle Bag of Words et Bag of N-Grams.
  • Le modèle TF-IDF, Transformer et Vectorizer.
  • Le modèle Word2Vec et l’implémentation avec Gensim.
  • Le modèle GloVe.
  • Le modèle FastText.

Travaux pratiques
Mise en place des opérations d’extraction des caractéristiques de données textuelles afin d’effectuer des classifications.

La similarité des textes et classification non supervisée

  • Les concepts essentiels de similarité.
  • Analyse de la similarité des termes : distances Hamming, Manhattan, Euclidienne et Levenshtein.
  • Analyse de la similarité des documents.
  • Okapi BM25 et le palmarès de classement.
  • Les algorithmes de classification non supervisée.

Travaux pratiques
Construire un système de recommandation des produits similaires sur la base de la description et du contenu des produits que vous avez choisi.

La classification supervisée du texte

  • Prétraitement et normalisation des données.
  • Modèles de classification.
  • Multinomial Naïve Bayes.
  • Régression logistique. Support Vector Machines.
  • Random Forest. Gradient Boosting Machines.
  • Évaluation des modèles de classification.

Travaux pratiques
Mise en œuvre des classifications supervisées sur plusieurs jeux de données.

Natural Language Processing et Deep Learning

  • Les librairies NLP : NLTK, TextBlob, SpaCy, Gensim, Pattern, Stanford CoreNLP.
  • Les librairies Deep Learning : Theano, TensorFlow, Keras.
  • Natural Language Processing et Recurrent Neural Networks.
  • RNN et Long Short-Term Memory. Les modèles bidirectionnels RNN.
  • Les modèles Sequence-to-Sequence.
  • Questions et réponses avec les modèles RNN.

Travaux pratiques
Construire un RNN pour générer un nouveau texte.

Participants / Prérequis

» Participants

Ingénieurs/chefs de projet IA, consultants IA et toute personne souhaitant découvrir le Text Mining pour le Machine Learning et le Deep Learning.

» Prérequis

Bonnes connaissances en statistiques. Bonnes connaissances du Machine Learning et du Deep Learning. Expérience requise.
Intra / sur-mesure

Demande de devis intra-entreprise
(réponse sous 48h)

Vos coordonnées

En cochant cette case, j’atteste avoir lu et accepté les conditions liées à l’usage de mes données dans le cadre de la réglementation sur la protection des données à caractère personnel (RGPD).
Vous pouvez à tout moment modifier l’usage de vos données et exercer vos droits en envoyant un email à l’adresse rgpd@orsys.fr
En cochant cette case, j’accepte de recevoir les communications à vocation commerciale et promotionnelle de la part d’ORSYS Formation*
Vous pouvez à tout moment vous désinscrire en utilisant le lien de désabonnement inclus dans nos communications.
* Les participants inscrits à nos sessions de formation sont également susceptibles de recevoir nos communications avec la possibilité de se désabonner à tout moment.
Avis clients
picto avis clients
MASSELIN-SILVIN S. 19/07/2021
4 / 5
Modules 1 à 4 OK. Module 5 beaucoup plus complexe, et pas vraiment illustré par des exemples et applications "convaincants".

JEAN-CHRISTOPHE F. 19/07/2021
5 / 5
Le contenu était très intéressant et le cours est bien construit. Merci pour cette prestation qui engage de mon côté de très bonnes réflexions sur l’avenir de nos SI.

ZHENBANG L. 19/07/2021
5 / 5
Formation parfaite, intéressante et utile. Le prof est sympa.

STÉPHANIE B. 10/05/2021
5 / 5
Contenu dense sur 3 jours mais il permet vraiment de reprendre les bases du ML et du DL. Les parties théoriques sur les rappels des modèles sont tout ce que j’attendais. Très bien les TPs, très bien expliqué. Formateur qui maitrise son sujet et qui a su s’adapter.

ADRIEN V. 10/05/2021
4 / 5
Contenu globalement intéressant. L’approche est restée parfois trop théorique-abstraite et parfois un peu trop compliquée notamment sur la partir deep learning où les aspects mathématiques auraient peut-être mérités un peu plus d’illustrations pratiques "simples". Même avec des notions de Machine Learning certains concepts et TP étaient difficiles d’accès. Néanmoins pour une formation sur un d

LE NAGARD E. 10/05/2021
4 / 5
Je suis satisfait de la formation pour l’apport théorique. En revanche, je trouve que la formation est très peu opérationnelle : peu de cas d’usages présentés, peu d’outils présentés, les TP ne s’appuient pas sur les librairies de marché généralement utilisées en entreprise (ex : sklearn...)

INPONG L. 08/03/2021
5 / 5
Très bons cours et formateur très érudit. Ambiance studieuse mais aussi très sympathique. Le formateur est très disponible. Les TPs sont faits sur des supports collaboratifs très pédagogiques.

ALEXANDRE O. 08/03/2021
5 / 5
Très complet Pour mon niveau, j’aurais préféré un cours moins dense et des TP plus introductifs

FEVRE ESTELLE L. 08/03/2021
5 / 5
Formateur très pédagogue. TPs (avec code-solution) qui marchent bien et qui répondent à chaque thématique. Exemples concrets. Outils adaptés (google collaboratory)

PETIT S. 16/11/2020
4 / 5
Formateur qui connait son sujet, mais problème sur le format: - trop court pour couvrir raisonnablement les concepts - Les concepts sont découverts lors des TP, difficile d’être autonome donc. Il faut en permanence choisir entre suivre la correction pour comprendre (faite en temps réelle et donc qui nécessite une attention particulière) ou essayer d’avancer soi-même tant bien que mal dans les exercices. Au final on finit par suiv

RABII L. 16/11/2020
4 / 5
-plus de pratiques, moins de théorie -support absent -pas méthodologique + TP intéréssants + Formateur Compétents, il maitrise le domaine

CLAUDE M. 16/11/2020
5 / 5
Très dense, pas évident de suivre la partie théorique et de réaliser les TPs

LAURENCE D. 16/11/2020
5 / 5
contenu dense, mais explications claires. Très intéressant d’avoir pu bénéficier de l’e-book, merci beaucoup. Le formateur maîtrise le sujet, ses documents de formation et ses corrections de tp sont vraiment bien fait, le contenu fourni est très enrichissant.

YANIS A. 16/11/2020
5 / 5
Contenu très enrichissant, expérience très agréable. Très positif dans l’ensemble !
Avis clients 4,6 / 5

Les avis clients sont issus des feuilles d’évaluation de fin de formation. La note est calculée à partir de l’ensemble des avis datant de moins de 12 mois.

CLASSE A DISTANCE

En inter et en intra-entreprise
Inscrivez-vous ou contactez-nous !

Pour vous inscrire

Cliquez sur la ville, puis sur la date de votre choix.
[+]
CLASSE A DISTANCE
[+]
PARIS

Horaires

Les cours ont lieu de 9h à 12h30 et de 14h à 17h30.
Les participants sont accueillis à partir de 8h45.
Pour les stages pratiques de 4 ou 5 jours, les sessions se terminent à 15h30 le dernier jour.