Le cours aborde les méthodes avancées d'apprentissage statistique et les problèmes d'optimisation qui se posent dans le domaine de l'apprentissage statistique, ainsi que des algorithmes efficaces pour les résoudre. Plus exactement, nous considérerons le processus d'entraînement automatique comme un problème d'optimisation. En particulier nous aborderons les questions liées à l'apprentissage d'optimisation convexes, différentiables, non convexes et non différentiables.
Nous aborderons notamment :
- les questions récentes liées aux progrès récents de l’apprentissage statistique
- les moindres carrés et les pénalités usuelles associées (LASSO, MCP...)
- les méthodes de sélection de variables (Lasso, best subset, PCR et PLS...)
- les problème de réglage d'hyper paramètres
- AutoML
- l' Apprentissage de représentation
- les méthodes de clustering
- les méthodes de Factorisation
Scikit learn sera utilisé pour la mise en ouvre de ces méthodes.
Les TD auront lieu sous python à 'aide du notebook jupyter
Vous pourrez aussi utiliser google colab
N'hésitez pas à poser vos questions en avance sur le forum.