> Formations > Technologies numériques > Intelligence Artificielle, Big Data > Big Data > Formation Environnement R, manipulations et statistiques élémentaires > Formations > Technologies numériques > Formation Environnement R, manipulations et statistiques élémentaires

Formation : Environnement R, manipulations et statistiques élémentaires

Environnement R, manipulations et statistiques élémentaires




R est un langage et un logiciel dédiés aux traitements statistiques. Il propose aussi des outils de qualité pour visualiser les données. Ce cours s'adresse à des participants connaissant déjà le langage R et qui souhaitent effectuer des traitements statistiques élémentaires ainsi que des affichages professionnels.


INTER
INTRA
SUR MESURE

Cours pratique en présentiel ou en classe à distance
Disponible en anglais, à la demande

Réf. MDR
  2j - 14h00
Prix : 1620 € H.T.
Pauses-café et
déjeuners offerts




R est un langage et un logiciel dédiés aux traitements statistiques. Il propose aussi des outils de qualité pour visualiser les données. Ce cours s'adresse à des participants connaissant déjà le langage R et qui souhaitent effectuer des traitements statistiques élémentaires ainsi que des affichages professionnels.


Objectifs pédagogiques
À l’issue de la formation, le participant sera en mesure de :
Constituer des jeux de données à analyser à partir de multiples sources
Manipuler les données pour les transformer à partir de fonctions diverses
Tracer des courbes et des graphiques avec R
Appliquer plusieurs algorithmes de calcul d'indicateurs statistiques

Public concerné
Statisticiens, analystes, ingénieurs, développeurs. Toute personne ayant à manipuler des données, à traiter numériquement et représenter graphiquement des données, à réaliser des statistiques sous R.

Prérequis
Connaissances de base du logiciel R, ou connaissances équivalentes à celles apportées par le stage "Environnement R, initiation" (réf. TDA).
Vérifiez que vous avez les prérequis nécessaires pour profiter pleinement de cette formation en faisant  ce test.

Modalités d'évaluation
Le formateur évalue la progression pédagogique du participant tout au long de la formation au moyen de QCM, mises en situation, travaux pratiques…
Le participant complète également un test de positionnement en amont et en aval pour valider les compétences acquises.

Programme de la formation

Rappels

  • L'environnement RStudio.
  • Les types de données dans R, les listes, les DataFrames, les facteurs et les variables ordinales.
  • Les dates et les séries temporelles.
Travaux pratiques
Prise en main des scripts dans l'environnement RStudio.

Importation-exportation et production de données

  • Lire un fichier texte ASCII, Excel, SPSS, Minitab, SAS ou Matlab.
  • Lire des données au clavier et utiliser le copier-coller.
  • Lecture/écriture des fichiers, bases de données.
Travaux pratiques
Lecture/Ecriture des données à partir des fichiers, base de données, DataLake et dans le format R.

Manipulation de données, fonctions

  • Opérations sur les matrices ou les DataFrames.
  • Les fonctions outer, apply, lapply, sapply et mapply.
  • Opérations logiques et relationnelles.
  • Manipulation de chaînes de caractères. Manipulation de dates et d'unités de temps.
Travaux pratiques
Traîter les matrices et DataFrames. Utiliser les fonctions lapply ou sapply pour remplacer les boucles for.

Techniques pour tracer des courbes et des graphiques

  • Les fenêtres graphiques : manipulation, sauvegarde.
  • Les fonctions de tracé de bas niveau.
  • La gestion des couleurs et paramètres graphiques.
  • L'ajout de texte, titres, axes et légendes.
  • Diagrammes en croix, tuyaux d'orgue, empilé ou circulaire. Boîte à moustaches.
  • Graphe de la fonction de répartition empirique. Histogramme en densité à amplitudes de classes égales ou inégales.
  • Polygone des fréquences. Représentations graphiques dans un cadre bivarié.
Travaux pratiques
Mise en œuvre des techniques pour tracer des courbes et des graphiques.

Mathématiques et statistiques élémentaires

  • Structuration des variables suivant leur type.
  • Résumés numériques.
  • Mesures d'association.
  • Notions sur la génération de nombres au hasard et de variable aléatoire.
  • Loi des grands nombres et théorème de la limite centrale.
  • Intervalles de confiance.
  • Tests d'hypothèses usuels. Autres tests d'hypothèses.
  • Analyse de la variance à un facteur, deux facteurs ou à mesures répétées.
Travaux pratiques
Mise en œuvre de l'algorithme de détermination du type d'une variable. L'interprétation d'un intervalle de confiance.


Solutions de financement
Plusieurs solutions existent pour financer votre formation et dépendent de votre situation professionnelle.
Découvrez-les sur notre page Comment financer sa formation ou contactez votre conseiller formation.

Avis clients
4,1 / 5
Les avis clients sont issus des évaluations de fin de formation. La note est calculée à partir de l’ensemble des évaluations datant de moins de 12 mois. Seules celles avec un commentaire textuel sont affichées.
ISABELLE T.
17/06/24
4 / 5

Contenu très pédagogique , sera facilement réutilisable.il faudrait passer moins de temps sur les explications de bases pour avoir plus de temps sur la fin de la formation (par exemple pas nécessaire de commenter les stats sur le titanic)Plutôt faire les exos au fur et à mesure (et non tout à la fin)
MÉLANIE A.
17/06/24
5 / 5

Supports très complets et faciles à réutiliser
MIKAËL P.
17/06/24
4 / 5

Contenu correspond très bien pour aller un peu plus loin que ce que je savais



Horaires
les cours ont lieu de 9h à 12h30 et de 14h à 17h30.
Les participants sont accueillis à partir de 8h45. Les pauses et déjeuners sont offerts.
Pour les stages pratiques de 4 ou 5 jours, quelle que soit la modalité, les sessions se terminent à 16h le dernier jour.

Dates et lieux
Sélectionnez votre lieu ou optez pour la classe à distance puis choisissez votre date.
Classe à distance
Dernières places
Session garantie