> formation Technologies numériques > formation Big Data, Intelligence Artificielle > formation Big Data, NoSQL > formation Big Data Analytics avec Python

Avis loadedNote : 4,4Length : 39TotalNote : 1320TotalNote20 : 45
Toutes nos formations Big Data, NoSQL

Formation Big Data Analytics avec Python
modélisation et représentation des données

4,4 / 5
Stage pratique
Best
Durée : 4 jours
Réf : BDA
Prix  2021 : 2710 € H.T.
Pauses et déjeuners offerts
  • Programme
  • Participants / Prérequis
  • Intra / sur-mesure
  • avis clients
Programme

Le Big Data Analytics suppose la maîtrise de techniques fondamentales de traitement des données : méthodes statistiques, classifications, régressions, ACP... Ce stage pratique vous montrera, sur des données concrètes, comment utiliser ces techniques pour construire puis évaluer des modèles à l'aide du langage Python.

Objectifs pédagogiques

À l’issue de la formation, le participant sera en mesure de :
  • Comprendre le principe de la modélisation statistique
  • Choisir entre la régression et la classification en fonction du type de données
  • Évaluer les performances prédictives d'un algorithme
  • Créer des sélections et des classements dans de grands volumes de données pour dégager des tendances

Travaux pratiques

Développement/réalisation d'analyses sur le logiciel Python, avec les modules pandas, NumPy, SciPy, MatPlotLib, seaborn, scikit-learn et statsmodels.
PROGRAMME DE FORMATION

Introduction à la modélisation

  • Introduction au langage Python.
  • Introduction au logiciel Jupiter Notebook.
  • Les étapes de construction d'un modèle.
  • Les algorithmes supervisés et non supervisés.
  • Le choix entre la régression et la classification.

Travaux pratiques
Installation de Python 3, d'Anaconda et de Jupiter Notebook.

Procédures d'évaluation de modèles

  • Les techniques de ré-échantillonnage en jeu d'apprentissage, de validation et de test.
  • Test de représentativité des données d'apprentissage.
  • Mesures de performance des modèles prédictifs.
  • Matrice de confusion, de coût et la courbe ROC et AUC.

Travaux pratiques
Mise en place d'échantillonnage de jeux de donnes. Effectuer des tests d'évaluations sur plusieurs modèles fournis.

Les algorithmes supervisés

  • Le principe de régression linéaire univariée.
  • La régression multivariée.
  • La régression polynomiale.
  • La régression régularisée.
  • Le Naive Bayes.
  • La régression logistique.

Travaux pratiques
Mise en œuvre des régressions et des classifications sur plusieurs types de données.

Les algorithmes non supervisés

  • Le clustering hiérarchique.
  • Le clustering non hiérarchique.
  • Les approches mixtes.

Travaux pratiques
Traitements de clustering non supervisés sur plusieurs jeux de données.

Analyse en composantes

  • Analyse en composantes principales.
  • Analyse factorielle des correspondances.
  • Analyse des correspondances multiples.
  • Analyse factorielle pour données mixtes.
  • Classification hiérarchique sur composantes principales.

Travaux pratiques
Mise en œuvre de la diminution du nombre des variables et identification des facteurs sous-jacents des dimensions associées à une variabilité importante.

Analyse de données textuelles

  • Collecte et prétraitement des données textuelles.
  • Extraction d'entités primaires, d'entités nommées et résolution référentielle.
  • Étiquetage grammatical, analyse syntaxique, analyse sémantique.
  • Lemmatisation.
  • Représentation vectorielle des textes.
  • Pondération TF-IDF.
  • Word2Vec.

Travaux pratiques
Explorer le contenu d'une base de textes en utilisant l'analyse sémantique latente.

Participants / Prérequis

» Participants

Responsables Infocentre (Datamining, Marketing, Qualité...), utilisateurs et gestionnaires métiers de bases de données.

» Prérequis

Connaissances de base en statistiques ou avoir suivi le stages"Statistiques, maîtriser les fondamentaux" (Réf. STA). Connaissances de base en Python.
Intra / sur-mesure

Demande de devis intra-entreprise
(réponse sous 48h)

Vos coordonnées

En cochant cette case, j’atteste avoir lu et accepté les conditions liées à l’usage de mes données dans le cadre de la réglementation sur la protection des données à caractère personnel (RGPD).
Vous pouvez à tout moment modifier l’usage de vos données et exercer vos droits en envoyant un email à l’adresse rgpd@orsys.fr
En cochant cette case, j’accepte de recevoir les communications à vocation commerciale et promotionnelle de la part d’ORSYS Formation*
Vous pouvez à tout moment vous désinscrire en utilisant le lien de désabonnement inclus dans nos communications.
* Les participants inscrits à nos sessions de formation sont également susceptibles de recevoir nos communications avec la possibilité de se désabonner à tout moment.
Avis clients
picto avis clients
JEAN R. 23/02/2021
4 / 5
Je pense qu’il faudrait un peu plus d’apprentissage par l’exemple avec du code, et un peu moins de slides (par exemple pour montrer les influences de tous les paramètres). Mais sinon le support est déjà vraiment pas mal avec Google colab

GEOFFROY L. 23/02/2021
5 / 5
Très satisfait par cete formation, aussi bien par le fond que la forme. Cela m’a permis de bien me rendre compte de l’état de l’art du Machine Leaning aujourd’hui.

JEANDENANS L. 23/02/2021
5 / 5
le format des travaux pratiques/tutoriel est très bien. un peu déçue sur le sujet des ACP (pas assez détaillée à mon gout)

RÉMY D. 23/02/2021
5 / 5
petit écart sur l’aspect python par rapport à la description de la formation : Introduction au langage Python. => pas exactement ça

VINCENT V. 15/12/2020
5 / 5
Nous avons eu un excellent formateur et le contenu de la formation était un bon compromis entre une grande diversité de sujets et une bonne technicité. Les lignes "solutions" dans les TPs permettent de passer plus rapidement, sans se stresser, et si besoin de les approfondir hors formation. Cette formation à distance a permis d’économiser pas mal de temps (et de frais) de transports et d’hébergement sans présenter de gros incon

SAMIRA E. 15/12/2020
4 / 5
Formation très intéressante, faisant bien le tour de l’existant autour des algorithmes existants pour la data science, mon seul regret est que j’aurais aimé plus de mise en pratique et de travail d’interprétation des résultats sur les algos.

PHILIPPE G. 15/12/2020
4 / 5
Le contenu du stage est parfait pour quelqu’un qui a un certain vécu en datascience et un peu en python. Ce qui n’était pas mon cas. Cela m’a permis d’avoir une vision d’ensemble de ce sujet que je ne connaissais pas. Un peu hard malgré tout pour moi. Animateur trés disponible et sympathique

JEAN MICHEL O. 15/12/2020
4 / 5
Très bonne introduction dans l’ensemble. Après, ça reste très superficiel car il y a beaucoup de points à aborder. Le support est un peu hétérogène, j’aurais préféré une approche plus formelle au début, avec un système de notation cohérent pendant tout le support, et des mentions aux modules/fonction python associés à chaque thématique . Pour les tutos

FONTAINE R. 17/11/2020
4 / 5
* trop théorique à mon gout (intéressant mais pas forcément à pousser aussi loin dans le cadre d’une formation courte en entreprise), j’aurai préféré une orientation plus pratique, plus simple en lien avec mon métier pour mieux appréhender les concepts (parfois codes Python trop complexes => difficulté à appréhender le code et les concepts de modèles) * formation pas assez longue (4

MARC D. 17/11/2020
5 / 5
Très bon contenu pédagogique, et très bonne maitrise du sujet par le formateur

MARIANNE D. 17/11/2020
5 / 5
Le contenu est très vaste, il faut s’accrocher. Néanmoins, les TP permettent d’assimiler plus facilement ce qui est vu pendant le cours et de saisir l’intérêt de chaque modèle. L’animateur est très clair, très bon pédagogue.

BRYAN K. 17/11/2020
5 / 5
Très bien, juste une petite remarque peut être transmettre le modèle de données utilisé pendant la formation, avant celle-ci pour bien s’approprier les données avant.

AUDREY K. 17/11/2020
5 / 5
Formation qui donne un bon aperçu des méthodes existantes. TP a refaire chez soi au calme car programme très chargé

FRANCK D. 17/11/2020
5 / 5
Excellent Formateur, capable d’expliquer simplement et très clairement des notions pourtant complexes ! Bravo !!

ILIAS T. 17/11/2020
4 / 5
RAS

DAMIEN C. 17/11/2020
5 / 5
Un programme chargé qui laisse peu de temps pour la pratique réelle mais cela n’est pas dérangeant car les notebooks sont clairs et les explications aussi.

TEST . 17/11/2020
5 / 5
Une planche ou deux de cartographie de tous ces outils (vue process par exemple) peut être intéressante: - ex: https://miro.medium.com/max/4360/1*PzzcJA-cwXQ8hwlpM4DwbA@2x.jpeg avec peut être un peu plus de détails (cas d’utilisation de chaque techno par exemple) L’objectif est de pouvoir raccrocher facilement à des cas métiers. Une planche de type "antisèche" peut être très intéressante pour p[eacu

JULIEN J. 17/11/2020
5 / 5
Formateur très compétent sur le sujet et présentations dynamiques. Ce qui est dommage c’est que les approchent se résument souvent à devoir tester plusieurs combinaisons sans savoir à la fin pourquoi une méthode fonctionne mieux qu’une autre. Mais cela est lié à la thématique.

INPONG L. 22/09/2020
4 / 5
Formateur ponctuel, très pédagogue et disponible. Maîtrise les outils de netmeeting.

ROMUALD M. 22/09/2020
4 / 5
Le sujet est très vaste pour 4 jours de formation. Les notebooks sont de très bons outils pour combiner théorie et pratique, il faudrait que la formation se base plus sur ceux-ci et que le recours à une présentation type "powerpoint" soit plus ponctuelle.

THOMAS L. 22/09/2020
4 / 5
Contenu intéressant mais technique -> Vise un public averti. Beaucoup de sujets via un panorama -> J’aurais préféré moins de sujets mais plus de pratique. équilibre globalement OK. Bien d’avoir les solutions. Syntaxe librairie déroutante pour un novice. Exercices intéressants. Support très dense (beaucoup de slides), essayer de faire + concis avec des slides "techniques" permettant de creuser si besoin les fo

SEBASTIEN P. 22/09/2020
5 / 5
Un peu trop de temps passé sur des notions qui sont normalement un pré-requis à la formation (Python notamment).

DAVID R. 22/09/2020
5 / 5
Rythme très soutenu, un peu plus de temps aurait été bienvenu

PIERRE D. 22/09/2020
5 / 5
Très bon formateur et très bon cours avec un bon équilibre théorie/pratique et une bonne interaction entre les élèves et le formateur.

SALHOU D. 22/09/2020
4 / 5
Le contenu de la formation est très intéressant et très riche (trop ?). La difficulté : Il faut arriver assimiler la théorie de chacune des méthodes en parallèle à leur implémentation sous Python en même temps. Pourquoi ne pas découper la formation en deux parties : 1) Méthode de big data analytics 2) Implémentation Python des méthodes de bigdata analytics M

VINCENT C. 22/09/2020
5 / 5
formateur très compétent et bonne animation

STÉPHANIE B. 21/09/2020
5 / 5
Bonne formation adaptée aux besoins initiaux.

EMMANUEL B. 21/09/2020
5 / 5
Formateur très pédagogue

JÉRÉMY G. 15/09/2020
4 / 5
Fournir la version imprimée relative à aux transparents les plus récents

MAEVA D. 15/09/2020
5 / 5
Le formateur est très pédagogue, la formation est intéressante. Dommage que nous ayons eu des problèmes techniques en début de formation, ce qui nous a fait perdre du temps. Les exercices sont intéressants. Le fait d’avoir la correction est un plus. Il est dommage que le support imprimé ne soit pas à jour.

GHISLAINE Q. 01/09/2020
5 / 5
Les exercices sur notebook ont été très appréciés: plus dynamique et se retiennent plus facilement

FRANCK M. 21/07/2020
5 / 5
Complet et pertinent

ALEXANDRE G. 16/06/2020
5 / 5
explication en profondeur, programme très complet.

MORGANE E. 16/06/2020
5 / 5
Le contenu est dense, il y a beaucoup de sujets et méthodes en 4 jours. La qualité de l’animation est top, le formateur répond à toutes les questions, il est très disponible avec une touche d’humour super appréciable :-)

JOSÉ C. 16/06/2020
4 / 5
Contenu théorique très enrichissant, les exercices ont beaucoup d’intérêt et sont de bonne qualité, malheureusement il y a un manque de temps considérable pour pouvoir les exploiter directement pendant la formation. Cet déséquilibre marqué est pénalisant sur l’ensemble de la formation. Personnellement je vais le refaire de mon côté pour commencer à intégrer les sujets.

TANOR N. 16/06/2020
4 / 5
Le contenu est très riche et le prof explique bien

OUAHID D. 16/06/2020
4 / 5
Satisfait.

FABIEN T. 14/04/2020
5 / 5
Contenu extrêmement dense adressé en 4 jours mais bien équilibré et me semble bien couvrir les différents concepts et méthodes du ML

SALMA A. 14/04/2020
5 / 5
Le contenu est intéressant et offre la possibilité d’explorer la théorie d’algorithmes qu’on utilise de manière automatique. Il aurait été souhaitable d’avoir une autre journée de formation pour apprendre et appliquer les méthodes adaptées à d’autres typologies de données (Séries temporelles par exemple ?)
Avis clients 4,4 / 5

Les avis clients sont issus des feuilles d’évaluation de fin de formation. La note est calculée à partir de l’ensemble des avis datant de moins de 12 mois.

CLASSE A DISTANCE

En inter et en intra-entreprise
Inscrivez-vous ou contactez-nous !

Pour vous inscrire

Cliquez sur la ville, puis sur la date de votre choix.
[+]
CLASSE A DISTANCE
[+]
PARIS
[+]
AIX
[+]
ANGERS
[+]
BORDEAUX
[+]
BREST
[+]
BRUXELLES
[+]
CLERMONT-FERRAND
[+]
DIJON
[+]
GENÈVE
[+]
GRENOBLE
[+]
LILLE
[+]
LIMOGES
[+]
LUXEMBOURG
[+]
LYON
[+]
MONTPELLIER
[+]
NANCY
[+]
NANTES
[+]
NIORT
[+]
ORLÉANS
[+]
REIMS
[+]
RENNES
[+]
ROUEN
[+]
SOPHIA-ANTIPOLIS
[+]
STRASBOURG
[+]
TOULON
[+]
TOULOUSE
[+]
TOURS

Horaires

Les cours ont lieu de 9h à 12h30 et de 14h à 17h30.
Les participants sont accueillis à partir de 8h45.
Pour les stages pratiques de 4 ou 5 jours, les sessions se terminent à 15h30 le dernier jour.
Formations conseillées
Filières métiers
Thème associé