> formation Technologies numériques > formation Big Data, Intelligence Artificielle > formation IA, Machine Learning, analyse de données > formation Text Mining par la pratique

Avis loadedNote : 3,9Length : 14TotalNote : 315TotalNote20 : 12
Toutes nos formations IA, Machine Learning, analyse de données

Formation Text Mining par la pratique

3,9 / 5
Stage pratique
Durée : 3 jours
Réf : MMD
Prix  2021 : 2240 € H.T.
Pauses et déjeuners offerts
  • Programme
  • Participants / Prérequis
  • Intra / sur-mesure
  • avis clients
Programme

Le Data Mining restreint aux données textuelles - le Text Mining - est de plus en plus utilisé dans les entreprises. Il permet, par exemple, de classer des produits à partir des commentaires des consommateurs. Vous mettrez en œuvre les algorithmes et les outils du Text Mining sur des exemples paradigmatiques.

Objectifs pédagogiques

À l’issue de la formation, le participant sera en mesure de :
  • Comprendre les méthodes de la statistique textuelle
  • Mettre en œuvre l’extraction des caractéristiques de données textuelles
  • Créer des sélections et des classements dans de grands volumes de données textuelles
  • Choisir un algorithme de classification
  • Évaluer les performances prédictives d'un algorithme
PROGRAMME DE FORMATION

Les approches traditionnelles en Text Mining

  • Les API pour récupérer des données textuelles.
  • La préparation des données textuelles en fonction de la problématique.
  • La récupération et l'exploration du corpus de textes.
  • La suppression des caractères accentués et spéciaux.
  • Stemming, Lemmatization et suppression des mots de liaison.
  • Tout rassembler pour nettoyer et normaliser les données.

Travaux pratiques
La recherche des documents, la préparation, la transformation et la vectorisation des données en DataFrame.

Feature Engineering pour la représentation de texte

  • Comprendre la syntaxe et la structure du texte.
  • Le modèle Bag of Words et Bag of N-Grams.
  • Le modèle TF-IDF, Transformer et Vectorizer.
  • Le modèle Word2Vec et l’implémentation avec Gensim.
  • Le modèle GloVe.
  • Le modèle FastText.

Travaux pratiques
Mise en place des opérations d’extraction des caractéristiques de données textuelles afin d’effectuer des classifications.

La similarité des textes et classification non supervisée

  • Les concepts essentiels de similarité.
  • Analyse de la similarité des termes : distances Hamming, Manhattan, Euclidienne et Levenshtein.
  • Analyse de la similarité des documents.
  • Okapi BM25 et le palmarès de classement.
  • Les algorithmes de classification non supervisée.

Travaux pratiques
Construire un système de recommandation des produits similaires sur la base de la description et du contenu des produits que vous avez choisi.

La classification supervisée du texte

  • Prétraitement et normalisation des données.
  • Modèles de classification.
  • Multinomial Naïve Bayes.
  • Régression logistique. Support Vector Machines.
  • Random Forest. Gradient Boosting Machines.
  • Évaluation des modèles de classification.

Travaux pratiques
Mise en œuvre des classifications supervisées sur plusieurs jeux de données.

Natural Language Processing et Deep Learning

  • Les librairies NLP : NLTK, TextBlob, SpaCy, Gensim, Pattern, Stanford CoreNLP.
  • Les librairies Deep Learning : Theano, TensorFlow, Keras.
  • Natural Language Processing et Recurrent Neural Networks.
  • RNN et Long Short-Term Memory. Les modèles bidirectionnels RNN.
  • Les modèles Sequence-to-Sequence.
  • Questions et réponses avec les modèles RNN.

Travaux pratiques
Construire un RNN pour générer un nouveau texte.

Participants / Prérequis

» Participants

Ingénieurs/chefs de projet IA, consultants IA et toute personne souhaitant découvrir le Text Mining pour le Machine Learning et le Deep Learning.

» Prérequis

Bonnes connaissances en statistiques. Bonnes connaissances du Machine Learning et du Deep Learning. Expérience requise.
Intra / sur-mesure

Demande de devis intra-entreprise
(réponse sous 48h)

Vos coordonnées

En cochant cette case, j’atteste avoir lu et accepté les conditions liées à l’usage de mes données dans le cadre de la réglementation sur la protection des données à caractère personnel (RGPD).
Vous pouvez à tout moment modifier l’usage de vos données et exercer vos droits en envoyant un email à l’adresse rgpd@orsys.fr
En cochant cette case, j’accepte de recevoir les communications à vocation commerciale et promotionnelle de la part d’ORSYS Formation*
Vous pouvez à tout moment vous désinscrire en utilisant le lien de désabonnement inclus dans nos communications.
* Les participants inscrits à nos sessions de formation sont également susceptibles de recevoir nos communications avec la possibilité de se désabonner à tout moment.
Avis clients
picto avis clients
INPONG L. 08/03/2021
5 / 5
Très bons cours et formateur très érudit. Ambiance studieuse mais aussi très sympathique. Le formateur est très disponible. Les TPs sont faits sur des supports collaboratifs très pédagogiques.

ALEXANDRE O. 08/03/2021
5 / 5
Très complet Pour mon niveau, j’aurais préféré un cours moins dense et des TP plus introductifs

FEVRE ESTELLE L. 08/03/2021
5 / 5
Formateur très pédagogue. TPs (avec code/solution) qui marchent bien et qui répondent à chaque thématique. Exemples concrets. Outils adaptés (google collaboratory)

YANIS A. 16/11/2020
5 / 5
Contenu très enrichissant, expérience très agréable. Très positif dans l’ensemble !

PETIT S. 16/11/2020
4 / 5
Formateur qui connait son sujet, mais problème sur le format: - trop court pour couvrir raisonnablement les concepts - Les concepts sont découverts lors des TP, difficile d’être autonome donc. Il faut en permanence choisir entre suivre la correction pour comprendre (faite en temps réelle et donc qui nécessite une attention particulière) ou essayer d’avancer soi-même tant bien que mal dans les exercices. Au final on finit par suiv

CLAUDE M. 16/11/2020
5 / 5
Très dense, pas évident de suivre la partie théorique et de réaliser les TPs

LAURENCE D. 16/11/2020
5 / 5
contenu dense, mais explications claires. Très intéressant d’avoir pu bénéficier de l’e-book, merci beaucoup. Le formateur maîtrise le sujet, ses documents de formation et ses corrections de tp sont vraiment bien fait, le contenu fourni est très enrichissant.

RABII L. 16/11/2020
4 / 5
-plus de pratiques, moins de théorie -support absent -pas méthodologique + TP intéréssants + Formateur Compétents, il maitrise le domaine

JULIEN P. 26/08/2020
5 / 5
Formation très intéressant avec partie Deep Learning et partie application au domaine du NLP Quelques parties de formations peu en lien avec le NLP, mais cela a permis de se remettre en mémoire les algos de Machine Learning Manque de temps pour tout explorer dans le détail, il faudrait soit étendre la durée de formation soit alléger le contenu sur les parties moins en lien avec le NLP

CARREL . 02/06/2020
5 / 5
Formateur d’excellent niveau et sympathique, qui maîtrise totalement son sujet, à l’état de l’art. Après cela reste un domaine de connaissance très pointu qui requiert des prérequis costauds en matière de raisonnement statistique. J’étais un peu juste là-dessus. En matière de développement, il est nécessaire de connaître un peu de python, mais pas de difficultés particuli

STÉPHANE G. 02/06/2020
5 / 5
La formation a été d’un grand intérêt puisque je vais pouvoir mettre en pratique immédiatement l’enseignement (partie TFIDF, Word2Vec et classifiers tels que LinearSVC) et les conseils reçus pour mon projet personnel. Les exercices du dernier jour me semblent un peu compliqués pour un réel codage personnel. Je me suis juste contenté de lire et d’exécuter la correction.

ISABELLE R. 02/06/2020
4 / 5
Sujet assez ardu avec un grand nombre de méthodes et d’approches proposés. Assez dense sur 3 jours. Formation distancielle qui ne simplifie pas les choses.

HOANG NAM H. 02/06/2020
5 / 5
De la théorie à la pratique, c’est bien présenté. Une belle présentation sur l’état de l’art des méthodes actuelles (Machine Learning, Deep Learning et Transfer Learning).

FABIEN T. 02/06/2020
5 / 5
Cours très dense mais le sujet en lui-même l’est aussi donc c’est compréhensible
Avis clients 3,9 / 5

Les avis clients sont issus des feuilles d’évaluation de fin de formation. La note est calculée à partir de l’ensemble des avis datant de moins de 12 mois.

CLASSE A DISTANCE

En inter et en intra-entreprise
Inscrivez-vous ou contactez-nous !

Pour vous inscrire

Cliquez sur la ville, puis sur la date de votre choix.
[+]
CLASSE A DISTANCE
[+]
PARIS

Horaires

Les cours ont lieu de 9h à 12h30 et de 14h à 17h30.
Les participants sont accueillis à partir de 8h45.
Pour les stages pratiques de 4 ou 5 jours, les sessions se terminent à 15h30 le dernier jour.