Logiciel R, notes de cours et livre

Introduction : régression, classification et phénomène de sur-apprentissage

Lecture conseillée : Le chapitre 5 du livre An Introduction to Statistical Learning est indispensable et s’applique à chaque partie (méthode d’apprentissage) de ce cours.

Le package R ElemStatLearn

Arbres de décision : régression

Code R: Code pour la régression par arbre de décision avant et après élagage et comparaison avec le régression avec régularisation elasticnet. Attention : présence de données catégorielles donc traitement particulier pour l’elasticnet (voir lignes 40 et 41 du code).

Lecture conseillée : Lecture de la partie 8.1 et Lab de la partie 8.3.1 du livre An Introduction to Statistical Learning.

Arbres de décision : classification

Séance du mercredi 26/02/2021: classification par arbre de décision.

Code R: Code pour la classification par arbre de décision avant et après élagage et comparaison avec le régression logistique avec régularisation elasticnet.

Lecture conseillée : Lecture de la partie 8.1 et Lab de la partie 8.3.2 du livre An Introduction to Statistical Learning.

Méthodes de régularisation : ridge, lasso et elasticnet

Séance du vendredi 05/03/2021: lire les parties régularisation ridge, lasso et elasticnet. Traiter les exemples autour du jeu de données du cancer de la prostate. Code R: ridge, lasso et elasticnet sur le jeu de données Prostate.

Séance du vendredi 12/03/2021: Méthodes de régularisation en régression logistique. Traiter l’exemple Sélection de variables en régression logistique : jeu de données Breast Cancer page 33.

Code R: Code pour la régression logistique et régression logistique avec régularisation elasticnet.

Jeu de données coûts de soins


  1. Personnellement je consulte énormément cette plateforme où je trouve des réponses à mes questions.↩︎