Analyse de données : approche statistique
La statistique est présente, en tant qu’outil appliqué, dans de nombreux domaines : biologie, banques et assurances, industrie, start-ups, pharmacologie, sciences sociales,… Ainsi le spectre des profils des personnes concernées est assez large. Les stagiaires peuvent être intéressés par une découverte des outils statistiques usuels ou celle d’un langage de programmation ou aussi par consolider des pratiques et des notions déjà acquises.
- maîtriser les principes de base de la programmation en R ainsi que RStudio
- maîtriser des concepts et outils statistiques usuels
- mettre en œuvre un traitement statistique des données
- interpréter les résultats statistiques et en comprendre la portée
- Présentation de R
- Objets, nature, classe
- Fonctions et packages
- Script de base
- Extraction d’un sous ensemble de données
- Création d’une nouvelle variable dans un jeu de données
- Boucles for
- Boucles if
- Principe d’un test statistique
- Test de Shapiro-Wilk
- Q-Q plot
- Test de Student
- Test d’ajustement à une loi
- Test du Chi2 d’indépendance
- Test exact de Fisher
- Test G
- Le modèle linéaire
- Ajustement avec R
- Représentations graphiques
- Tests associés
- Diagnostiques graphiques
- Test de Fisher-Snedecor
- Test de Bartlett
- Conditions d’applications de l’ANOVA
- Ajustement avec R
- Tests de comparaisons multiples
- Représentations graphiques
- ANCOVA
La formation intégrant une large partie mise en application via un langage statistique, il est conseillé d’être assez habitué à l’outil informatique. Des connaissances de statistique descriptive sont un plus mais aucune connaissance a priori en statistique n’est requise.
La participation à cette formation ne nécessite pas de pré-requis complémentaires.
La formation mélangera des moments de présentation théorique par le formateur et de la mise en pratique par l’ensemble des participants. Les outils statistiques seront présentés puis mis en application sur des données en utilisant le langage R. Les résultats, ainsi que leurs limites d’interprétation, seront discutés collectivement. De manière générale, le support diffusé et distribué aux stagiaires est le fil conducteur de ces trois journées mais le programme ouvre place à des discussions plus générales (éthique, programmation, limites statistiques,…). Le logiciel Rstudio sera utilisé comme support pour la réalisation des scripts de code R.
M. Nicolas POULIN, Ingénieur de Recherche, UFR de Mathématique et d’Informatique
Courriel : poulin@math.unistra.fr
Cette formation constitue une action d’adaptation et de développement des compétences.Elle donne lieu à la délivrance d’une attestation de participation.Une évaluation en fin de formation permet de mesurer la satisfaction des stagiaires ainsi que l’atteinte des objectifs de formation (connaissances, compétences, adhésion, confiance) selon les niveaux 1 et 2 du modèle d’évaluation de l’efficacité des formations Kirkpatrick.