Le Data Mining (fouille de données) est un ensemble de méthodes génériques pour extraire d'une masse de données de l'information pertinente. Ces méthodes peuvent être basées sur des outils de statistique exploratoire combinés avec des outils de machine learning (apprentissage automatique), que nous étudierons dans ce cours.

Le cours sera illustré de TPs effectué avec la langage R. Je recommande l'utilisation de R Studio, et la réalisation des TPs sous forme de R Notebook.

Pour réviser R

Quelques références