> formation Technologies numériques > formation Big Data, Intelligence Artificielle > formation Big Data, NoSQL > formation Big Data Analytics avec Python

Avis loadedNote : 4,4Length : 60TotalNote : 1050TotalNote20 : 36
Toutes nos formations Big Data, NoSQL

Formation Big Data Analytics avec Python
modélisation et représentation des données

4,4 / 5
Stage pratique
Best
Durée : 4 jours
Réf : BDA
Prix  2021 : 2710 € H.T.
Pauses et déjeuners offerts
  • Programme
  • Participants / Prérequis
  • Intra / sur-mesure
  • avis clients
Programme

Data Analytics est un terme pour exprimer les démarches d'analyse de données, afin d'être en mesure de prendre des décisions. Le langage Python dispose d'un écosystème permettant les traitements statistiques : de la construction de modèles d'analyse, à leur évaluation jusqu'à leur représentation.

Objectifs pédagogiques

À l’issue de la formation, le participant sera en mesure de :
  • Comprendre le principe de la modélisation statistique
  • Choisir entre la régression et la classification en fonction du type de données
  • Évaluer les performances prédictives d'un algorithme
  • Créer des sélections et des classements dans de grands volumes de données pour dégager des tendances

Travaux pratiques

Développement/réalisation d'analyses sur le logiciel Python, avec les modules pandas, NumPy, SciPy, MatPlotLib, seaborn, scikit-learn et statsmodels.
PROGRAMME DE FORMATION

Introduction à la modélisation

  • Introduction au langage Python.
  • Introduction au logiciel Jupiter Notebook.
  • Les étapes de construction d'un modèle.
  • Les algorithmes supervisés et non supervisés.
  • Le choix entre la régression et la classification.

Travaux pratiques
Installation de Python 3, d'Anaconda et de Jupiter Notebook.

Procédures d'évaluation de modèles

  • Les techniques de ré-échantillonnage en jeu d'apprentissage, de validation et de test.
  • Test de représentativité des données d'apprentissage.
  • Mesures de performance des modèles prédictifs.
  • Matrice de confusion, de coût et la courbe ROC et AUC.

Travaux pratiques
Mise en place d'échantillonnage de jeux de donnes. Effectuer des tests d'évaluations sur plusieurs modèles fournis.

Les algorithmes supervisés

  • Le principe de régression linéaire univariée.
  • La régression multivariée.
  • La régression polynomiale.
  • La régression régularisée.
  • Le Naive Bayes.
  • La régression logistique.

Travaux pratiques
Mise en œuvre des régressions et des classifications sur plusieurs types de données.

Les algorithmes non supervisés

  • Le clustering hiérarchique.
  • Le clustering non hiérarchique.
  • Les approches mixtes.

Travaux pratiques
Traitements de clustering non supervisés sur plusieurs jeux de données.

Analyse en composantes

  • Analyse en composantes principales.
  • Analyse factorielle des correspondances.
  • Analyse des correspondances multiples.
  • Analyse factorielle pour données mixtes.
  • Classification hiérarchique sur composantes principales.

Travaux pratiques
Mise en œuvre de la diminution du nombre des variables et identification des facteurs sous-jacents des dimensions associées à une variabilité importante.

Analyse de données textuelles

  • Collecte et prétraitement des données textuelles.
  • Extraction d'entités primaires, d'entités nommées et résolution référentielle.
  • Étiquetage grammatical, analyse syntaxique, analyse sémantique.
  • Lemmatisation.
  • Représentation vectorielle des textes.
  • Pondération TF-IDF.
  • Word2Vec.

Travaux pratiques
Explorer le contenu d'une base de textes en utilisant l'analyse sémantique latente.

Participants / Prérequis

» Participants

Responsables Infocentre (Datamining, Marketing, Qualité...), utilisateurs et gestionnaires métiers de bases de données.

» Prérequis

Connaissances de base en Python. Connaissances de base en statistiques ou avoir suivi le stage "Statistiques, maîtriser les fondamentaux" (Réf. STA).
Intra / sur-mesure

Demande de devis intra-entreprise
(réponse sous 48h)

Vos coordonnées

En cochant cette case, j’atteste avoir lu et accepté les conditions liées à l’usage de mes données dans le cadre de la réglementation sur la protection des données à caractère personnel (RGPD).
Vous pouvez à tout moment modifier l’usage de vos données et exercer vos droits en envoyant un email à l’adresse rgpd@orsys.fr
En cochant cette case, j’accepte de recevoir les communications à vocation commerciale et promotionnelle de la part d’ORSYS Formation*
Vous pouvez à tout moment vous désinscrire en utilisant le lien de désabonnement inclus dans nos communications.
* Les participants inscrits à nos sessions de formation sont également susceptibles de recevoir nos communications avec la possibilité de se désabonner à tout moment.
Avis clients
picto avis clients
MARY M. 03/08/2021
3 / 5
Le contenu de la formation nécessite des pré-requis en algèbre et non en statistiques comme indiqué dans le programme du stage Beaucoup de sujets sont abordés en 4 jours d’une manière théorique. Cela reste intéressant mais il n’y a pas besoin de pousser aussi loin pour une formation en entreprise. Il aurait été plus intéressant d’avoir une formation plus pratique et plus en lien avec le travail en e

GUILLAUME T. 20/07/2021
5 / 5
Maîtrise du sujet, approche très didactique et bienveillante.

ANNE S. 20/07/2021
5 / 5
J’ai apprécié l’alternance entre la pratique et la théorie et que ça soit équilibré. Les supports de TP seront facile à utiliser pour revoir et approfondir ce qui a été vu. il faut pratiquer encore pour s’améliorer. Le formateur expliquait très bien.

BEAUCHANT CLAIRE M. 20/07/2021
4 / 5
Ca pourrait être sympa d’avoir un exemple simple et qui retient l’attention le 1er jour pour avoir un teasing de ce qui est possible de faire une fois qu’on est avancé. C’est une pratique américaine, beaucoup moins française.

SMART DRONE SERVICES MIQUEL F. 15/06/2021
3 / 5
1. 4 jours c’est beaucoup trop rapide. 2. C’est bien de savoir se servir des modules existants mais il faudrait comprendre ce que font réellement les algorithmes, par exemple l’animateur n’a pas su nous expliquer comment fonctionnait une Isolation Forest. La théorie derrière les différentes méthodes n’a pas été abordée. 3. Il manque les supports de cours, ne serait-ce que pour annoter des remarques faites

AXEL O. 15/06/2021
3 / 5
Le programme n’est pas adapté à des débutants (qui représentaient 90% de l’audience). Il serait bon de repositionner ce training: soit faire exclusivement les bases de python, soit faire exclusivement du ML (ou alors uniquement un jour de rappel). Mais l’organisation actuelle n’est pas pas du tout optimisée (avis partagé par l’intégralité du groupe), malgré la bonne volonté du formateur.

CEDRIC S. 15/06/2021
4 / 5
Pour moi, on a eu un vrai soucis avec le contenu de la formation. En effet, il était prévu de faire une introduction sur python, et on y a passé 2 jours sans attaquer le vif du sujet. Du coup, il n’a resté que 2 jours de formation pour travailler sur le vrai contenu de la formation. Cela est sans doute du au pré requis qui n’ont pas été vérifié pour les participants de la formation.

ROMAIN R. 15/06/2021
3 / 5
Programme non respecté: 3 jours de formation python, puis le dernier jour une présentation très brouillon et accélérée du machine learning- je n’ai appris que très très peu de choses au final et vais devoir m’auto former à partir du support de cours et du site sklearn

ARIA MARIUS G. 15/06/2021
5 / 5
Le contenu et la pédagogie étaient très biens. J’ai la possibilité de refaire les cas pratiques en toute autonomie.

AXEL D. 15/06/2021
3 / 5
l’insatisfaction réside dans le fait que le formateur a dû faire des rappels conséquents car certains participants n’avaient pas les prérequis demandés à cette formation. Nous faisons une formation en machine learning en utilisant le langage python qui a été une découverte pour certains... Sur 4 jours, 1.5jour a été consacré à ces rappels. Il serait bien qu’Orsys valide un minimum les acquis

BRUYAS J. 15/06/2021
5 / 5
Très bonne formation, le formateur était très pédagogue et à très bien animé la formation.

TING Y. 15/06/2021
5 / 5
contenu très intéréssant, et le formateur très sympa, compétent et patient

JÉRÉMIE M. 28/05/2021
5 / 5
Formateur super agréable, très intéressant et a pris le temps de tout nous expliquer jusqu’à être sur que c’était acquis. Le contenu de la formation était très complet et la pratique était suffisante pour rendre concret la théorie

FRANCK R. 25/05/2021
4 / 5
Exercices un peu trop complexes

ABDERRAHIM A. 25/05/2021
5 / 5
Bonjour, tout en sachant que ce n’est pas simple à organiser, je pense qu’il serait plus intéressant d’aborder moins de choses mais d’approfondir les TPs. Cordialement.

SICCARDI V. 25/05/2021
4 / 5
La durée de la formation ne permet que de survoler le sujet

ARNAUD C. 25/05/2021
3 / 5
:-( Formation trop dense, avec mélange de 3 thématiques qui devraient être traité dans 3 formations différentes chacune de 2 à 5 jours 1) Notion de mathématiques, statistiques, visualisation de données, théorie du Machine Learning 2) Programmation en Python, les principes, les bases, la structure 3) la programmation avancée en python en Statistiques et Machines Learning :-( Le titre de la formation est

QUENTIN M. 25/05/2021
4 / 5
Rien a dire le formateur connait son sujet et réponds aux questions. Je n’avais pas les bases requises en mathématiques et statistiques, ce qui m’a pénalisé lors de la formation.

AURÉLIEN F. 25/05/2021
5 / 5
Formation très complète, objectifs personnels parfaitement atteints : - Procéder au nettoyage d’une base de données, faire des modélisations de "1er niveau" type régression linéaire multiples, arbres de décision avec leur évaluation - Assimiler théorie et techniques de modélisation, leur utilité et leurs limites afin d’assurer l’interface métier-datascientist. Formation dense

NAGARD ERWAN L. 25/05/2021
5 / 5
Maitrisant déjà Python, l’introduction à Python fut fastidieuse... La maitrise du langage Python devrait être un pré-requis à la formation, ce qui permettrait d’avoir plus de temps pour approfondir certains concepts. Le contenu de la formation est très bon, le formateur est très pédagogue.

NEVORET C. 19/05/2021
5 / 5
Merci beaucoup pour ce cours et notamment la prise en compte des besoins internes et du niveaux des participants (surtout en Python !)

CLEMENT T. 19/05/2021
5 / 5
Formation très intéressante et très bien expliquée. De plus elle était bien adaptée à nos besoins en terme de rythme et de contenu, par rapport à nos connaissances préalables sur certains sujets.

ROBERT J. 19/05/2021
5 / 5
Formation de très haut niveau. Le formateur est vraiment très bien.

CAROLINE L. 19/05/2021
4 / 5
Contenu très technique, formateur très pédagogue et disponible pour répondre aux questions.

ARNAUD B. 28/04/2021
5 / 5
Pédagogie très bonne. Animation dynamique.

PARGNY R. 06/04/2021
5 / 5
Formation très riche qui me donne des clés du ML. Travail à poursuivre par moi-même à la maison.

DERRE CHRISTOPHE P. 06/04/2021
5 / 5
Christian nous a livré un exposé passionnant. Ca donne envie d’aller beaucoup plus loin dans l’utilisation de ces technologies.

YUANCI Z. 30/03/2021
5 / 5
Le contenu de cette formation est très intéressant. J’apprécie l’équilibre entre la théorie et pratique. Le formateur Christian est très pédagogique.

SÉBASTIEN D. 30/03/2021
5 / 5
Peut être un peu trop de temps passé sur l’introduction à Python

FAYCAL H. 30/03/2021
4 / 5
Très bien l’alternance théorie via dessin - pratiques sur notebook. Manque un peu de temps pour pratiquer tout seul ou via des challenges en équipe

JEAN R. 23/02/2021
4 / 5
Je pense qu’il faudrait un peu plus d’apprentissage par l’exemple avec du code, et un peu moins de slides (par exemple pour montrer les influences de tous les paramètres). Mais sinon le support est déjà vraiment pas mal avec Google colab

GEOFFROY L. 23/02/2021
5 / 5
Très satisfait par cete formation, aussi bien par le fond que la forme. Cela m’a permis de bien me rendre compte de l’état de l’art du Machine Leaning aujourd’hui.

JEANDENANS L. 23/02/2021
5 / 5
le format des travaux pratiques-tutoriel est très bien. un peu déçue sur le sujet des ACP (pas assez détaillée à mon gout)

RÉMY D. 23/02/2021
5 / 5
petit écart sur l’aspect python par rapport à la description de la formation : Introduction au langage Python. => pas exactement ça

JEAN MICHEL O. 15/12/2020
4 / 5
Très bonne introduction dans l’ensemble. Après, ça reste très superficiel car il y a beaucoup de points à aborder. Le support est un peu hétérogène, j’aurais préféré une approche plus formelle au début, avec un système de notation cohérent pendant tout le support, et des mentions aux modules-fonction python associés à chaque thématique . Pour les tutos

VINCENT V. 15/12/2020
5 / 5
Nous avons eu un excellent formateur et le contenu de la formation était un bon compromis entre une grande diversité de sujets et une bonne technicité. Les lignes "solutions" dans les TPs permettent de passer plus rapidement, sans se stresser, et si besoin de les approfondir hors formation. Cette formation à distance a permis d’économiser pas mal de temps (et de frais) de transports et d’hébergement sans présenter de gros incon

PHILIPPE G. 15/12/2020
4 / 5
Le contenu du stage est parfait pour quelqu’un qui a un certain vécu en datascience et un peu en python. Ce qui n’était pas mon cas. Cela m’a permis d’avoir une vision d’ensemble de ce sujet que je ne connaissais pas. Un peu hard malgré tout pour moi. Animateur trés disponible et sympathique

SAMIRA E. 15/12/2020
4 / 5
Formation très intéressante, faisant bien le tour de l’existant autour des algorithmes existants pour la data science, mon seul regret est que j’aurais aimé plus de mise en pratique et de travail d’interprétation des résultats sur les algos.

FONTAINE R. 17/11/2020
4 / 5
* trop théorique à mon gout (intéressant mais pas forcément à pousser aussi loin dans le cadre d’une formation courte en entreprise), j’aurai préféré une orientation plus pratique, plus simple en lien avec mon métier pour mieux appréhender les concepts (parfois codes Python trop complexes => difficulté à appréhender le code et les concepts de modèles) * formation pas assez longue (4

MARC D. 17/11/2020
5 / 5
Très bon contenu pédagogique, et très bonne maitrise du sujet par le formateur

MARIANNE D. 17/11/2020
5 / 5
Le contenu est très vaste, il faut s’accrocher. Néanmoins, les TP permettent d’assimiler plus facilement ce qui est vu pendant le cours et de saisir l’intérêt de chaque modèle. L’animateur est très clair, très bon pédagogue.

BRYAN K. 17/11/2020
5 / 5
Très bien, juste une petite remarque peut être transmettre le modèle de données utilisé pendant la formation, avant celle-ci pour bien s’approprier les données avant.

AUDREY K. 17/11/2020
5 / 5
Formation qui donne un bon aperçu des méthodes existantes. TP a refaire chez soi au calme car programme très chargé

FRANCK D. 17/11/2020
5 / 5
Excellent Formateur, capable d’expliquer simplement et très clairement des notions pourtant complexes ! Bravo !!

DAMIEN C. 17/11/2020
5 / 5
Un programme chargé qui laisse peu de temps pour la pratique réelle mais cela n’est pas dérangeant car les notebooks sont clairs et les explications aussi.

ILIAS T. 17/11/2020
4 / 5
RAS

JULIEN J. 17/11/2020
5 / 5
Formateur très compétent sur le sujet et présentations dynamiques. Ce qui est dommage c’est que les approchent se résument souvent à devoir tester plusieurs combinaisons sans savoir à la fin pourquoi une méthode fonctionne mieux qu’une autre. Mais cela est lié à la thématique.

TEST . 17/11/2020
5 / 5
Une planche ou deux de cartographie de tous ces outils (vue process par exemple) peut être intéressante: - ex: https:--miro.medium.com-max-4360-1*PzzcJA-cwXQ8hwlpM4DwbA@2x.jpeg avec peut être un peu plus de détails (cas d’utilisation de chaque techno par exemple) L’objectif est de pouvoir raccrocher facilement à des cas métiers. Une planche de type "antisèche" peut être très intéressante pour p[eacu

SEBASTIEN P. 22/09/2020
5 / 5
Un peu trop de temps passé sur des notions qui sont normalement un pré-requis à la formation (Python notamment).

DAVID R. 22/09/2020
5 / 5
Rythme très soutenu, un peu plus de temps aurait été bienvenu

PIERRE D. 22/09/2020
5 / 5
Très bon formateur et très bon cours avec un bon équilibre théorie-pratique et une bonne interaction entre les élèves et le formateur.

SALHOU D. 22/09/2020
4 / 5
Le contenu de la formation est très intéressant et très riche (trop ?). La difficulté : Il faut arriver assimiler la théorie de chacune des méthodes en parallèle à leur implémentation sous Python en même temps. Pourquoi ne pas découper la formation en deux parties : 1) Méthode de big data analytics 2) Implémentation Python des méthodes de bigdata analytics M

INPONG L. 22/09/2020
4 / 5
Formateur ponctuel, très pédagogue et disponible. Maîtrise les outils de netmeeting.

ROMUALD M. 22/09/2020
4 / 5
Le sujet est très vaste pour 4 jours de formation. Les notebooks sont de très bons outils pour combiner théorie et pratique, il faudrait que la formation se base plus sur ceux-ci et que le recours à une présentation type "powerpoint" soit plus ponctuelle.

THOMAS L. 22/09/2020
4 / 5
Contenu intéressant mais technique -> Vise un public averti. Beaucoup de sujets via un panorama -> J’aurais préféré moins de sujets mais plus de pratique. équilibre globalement OK. Bien d’avoir les solutions. Syntaxe librairie déroutante pour un novice. Exercices intéressants. Support très dense (beaucoup de slides), essayer de faire + concis avec des slides "techniques" permettant de creuser si besoin les fo

VINCENT C. 22/09/2020
5 / 5
formateur très compétent et bonne animation

EMMANUEL B. 21/09/2020
5 / 5
Formateur très pédagogue

STÉPHANIE B. 21/09/2020
5 / 5
Bonne formation adaptée aux besoins initiaux.

MAEVA D. 15/09/2020
5 / 5
Le formateur est très pédagogue, la formation est intéressante. Dommage que nous ayons eu des problèmes techniques en début de formation, ce qui nous a fait perdre du temps. Les exercices sont intéressants. Le fait d’avoir la correction est un plus. Il est dommage que le support imprimé ne soit pas à jour.

JÉRÉMY G. 15/09/2020
4 / 5
Fournir la version imprimée relative à aux transparents les plus récents
Avis clients 4,4 / 5

Les avis clients sont issus des feuilles d’évaluation de fin de formation. La note est calculée à partir de l’ensemble des avis datant de moins de 12 mois.

CLASSE A DISTANCE

En inter et en intra-entreprise
Inscrivez-vous ou contactez-nous !

Pour vous inscrire

Cliquez sur la ville, puis sur la date de votre choix.
[+]
CLASSE A DISTANCE
[+]
PARIS
[+]
AIX
[+]
ANGERS
[+]
AVIGNON
[+]
BORDEAUX
[+]
BOURGES
[+]
BREST
[+]
BRUXELLES
[+]
CAEN
[+]
CHARTRES
[+]
CLERMONT-FERRAND
[+]
DIJON
[+]
GENÈVE
[+]
GRENOBLE
[+]
LE HAVRE
[+]
LE MANS
[+]
LILLE
[+]
LIMOGES
[+]
LYON
[+]
METZ
[+]
MONTPELLIER
[+]
MULHOUSE
[+]
NANCY
[+]
NANTES
[+]
NIORT
[+]
ORLÉANS
[+]
PAU
[+]
REIMS
[+]
RENNES
[+]
ROUEN
[+]
SAINT-ETIENNE
[+]
SOPHIA-ANTIPOLIS
[+]
STRASBOURG
[+]
TOULON
[+]
TOULOUSE
[+]
TOURS

Horaires

Les cours ont lieu de 9h à 12h30 et de 14h à 17h30.
Les participants sont accueillis à partir de 8h45.
Pour les stages pratiques de 4 ou 5 jours, les sessions se terminent à 15h30 le dernier jour.
Formations conseillées
Filières métiers
Thème associé