Parmi les problématiques du Big-Data, on trouve le traitement statistique en temps réel des données lorsqu'elles arrivent en flux continu et qu'elles ne sont pas stockées, empêchant ainsi les procédures de calcul habituelleset nécessitant la mise en place de procédures de calcul itératives.
L'objectif de ce cours est de présenter et mettre en oeuvre des algorithmes itératifs, stochastiques ou non, pour le traitement statistique de données en ligne.
Il s'agit de pouvoir répondre par exemple aux nouvelles problématiques issues du web et l'arrivée de données en flux continu.
On traitera en particulier le cas du calcul itératif des statistiques de base, l'estimation itérative des paramètres d'un modèle de régression linéaire
et d'un modèle de régression logistique par des algorithmes performants, ainsi que l'ACP en ligne.
- Enseignant: Portier Bruno