Le cours aborde les méthodes avancées d'apprentissage statistique et les problèmes d'optimisation qui se posent dans le domaine de l'apprentissage statistique, ainsi que des algorithmes efficaces pour les résoudre. Plus exactement, nous considérerons le processus d'entraînement automatique comme un problème d'optimisation. En particulier nous aborderons les questions liées à l'apprentissage d'optimisation convexes, différentiables, non convexes et non différentiables.
Nous aborderons notamment :
les questions récentes liées aux progrès récents de l’apprentissage statistique
les moindres carrés et les pénalités usuelles associées (LASSO, MCP...)
les méthodes de sélection de variables (Lasso, best subset, PCR et PLS...)
les problème de réglage d'hyper paramètres
AutoML
l' Apprentissage de représentation
les méthodes de clustering
les méthodes de Factorisation
Scikit learn sera utilisé pour la mise en ouvre de ces méthodes.
Les TD auront lieu sous python à 'aide du notebook jupyter