
- Enseignant: Lemosse Didier
L'objectif de ce module est de fournir aux apprenants :
- les outils statistiques de base pour la description et la visualisation de données ;
- les outils de base pour l'estimation d'indicateurs statistiques classiques ;
- les notions de base des tests statistiques,
ainsi que quelques tests utiles pour la sélection de variables et la comparaison d'algorithmes de classification supervisée.
Les méthodes et outils abordés seront mis en oeuvre sur des exemples réels et traités avec le logiciel R.
A l'issu de ce module, l'apprenant disposera de premiers outils pour décrire, identifier et sélectionner les données pertinentes parmi celles à sa disposition, en vue de la modélisation.
Il disposera de plus d'outils lui permettant de comparer et sélectionner l'algorithme de classification supervisée le plus performant pour résoudre le problème qu'il lui sera posé.
L’objet de cet EC est d’introduire les méthodes de régressions pénalisées.
Après un rappel sur la régression linéaire multiple et ses principales limites, on introduira les méthodes de régularisation ridge (pénalité l2) et lasso ( pénalité l1), ainsi que la méthode de régularisation "elastic net".
Le cadre de la régression linéaire ridge et lasso sera étendu à celui de la régression logistique.
Parmi les problématiques du Big-Data, on trouve le traitement statistique en temps réel des données lorsqu'elles arrivent en flux continu et qu'elles ne sont pas stockées, empêchant ainsi les procédures de calcul habituelleset nécessitant la mise en place de procédures de calcul itératives.
L'objectif de ce cours est de présenter et mettre en oeuvre des algorithmes itératifs, stochastiques ou non, pour le traitement statistique de données en ligne.
Il s'agit de pouvoir répondre par exemple aux nouvelles problématiques issues du web et l'arrivée de données en flux continu.
On traitera en particulier le cas du calcul itératif des statistiques de base, l'estimation itérative des paramètres d'un modèle de régression linéaire
et d'un modèle de régression logistique par des algorithmes performants, ainsi que l'ACP en ligne.
L'objectif de cet EC est d'acquérir les outils statistiques pour le traitement automatique et la mise en oeuvre de modèles statistiques performants pour des données hétérogènes.
Le cours présentera les arbres binaires de décision, les forêts aléatoires, les algorithmes de boosting réputés performants sur des données continues et discrètes et les nouvelles approches de sélection automatique de modèles.
Le but de cette U.V. est de familiariser les étudiants au raisonnement en présence d'aléas, tout en présentant les méthodes statistiques de base qu'ils pourront être amené à rencontrer lors de leur vie professionnelle.
Espace d'échange entre le service des examens et les surveillants.
Afin de faciliter la rédaction de lettres de recommandation et pour vous donner accès à l'ensemble des résultats des jurys, nous mettons à la disposition de tous les PERMANENTS du département GE les tableaux de résultats des différents jurys. La mise en forme n'est pas encore finalisée et dépendra des outils développés par la scolarité pour traiter les tableaux extraits de Pégase.
Ces résultats sont confidentiels et NE DOIVENT PAS etre transmis en l'état aux étudiants
Ce cours est une introduction à la modélisation à l'aide de graphes de problèmes conventionnels.
Il se focalise sur la compétence à évaluer la classe de problème à laquelle se réfère une problématique donnée.
Dans ce cours vous apprendrez les principes fondamentaux du traitement d'image : amélioration de l'image, filtrage, détection des attributs, transformations géométriques, traitement couleur, etc.
https://ent.normandie-univ.fr/
Ce cours contient une série de tutoriels pour vous aider à utiliser ce portail.
Cet espace vous permet de découvrir les usages de Wooclap et Wooflash.