Machine Learning (IML)
Section outline
-
Les entreprises, les collectivités, les institutions, les particuliers collectent et stockent de grandes quantités de données. Ces mégabases de données, recèlent d'informations décisives. La disponibilité de ces données gigantesques et des moyens de calcul ont favorisé l'essor rapide de la Science des Données puis de l'Intelligence Artificielle. Le but de cet EC est d'initier les élèves-ingénieurs aux méthodes du Machine Learning pour le traitement des données.
- La première partie de l'EC aborde les méthodes d'apprentissage non-supervisé notamment la représentation des données multidimensionnelles ou le clustering de ces données
- La dernière partie porte sur les approches d'apprentissage supervisé et présentera les différentes catégories de problème, les différents algorithmes de machine learning pour les résoudre et les bonnes pratiques pour s'assurer de la validité des résultats obtenus.
Bibliographie
- T. Hastie, R. Tibshrani, J. Friedman, The Elements of Statistical Learning: Data Mining, Inference, and Prediction (Springer Verlag). Pdf disponible ici
- G. James, D. Witten, T. Hastie, R. Tibshrani, An Introduction to Statistical Learning with Application in R (Springer Verlag). Pdf disponible ici
- C.M. Bishop, Pattern Recognition and Machine Learning, (Springer Verlag. Pdf disponible ici
- V. N. Vapnik, The nature of statistical learning theory (Springer-Verlag)
Diagnostiquer votre démarche de Machine Learning
-
Advice for Applying Machine Learning de Andrew Ng (Stanford)
Data Science Resource
-
DataCamp (plenty tutorials in R and Python) : https://www.datacamp.com/
Bases de Données et/ou codes :
-
- Kaggle : plateforme de compétition
- OpenML
- UCI Machine Learning Repository
- Papers with code
Quelques toolboxes gratuites
Principalement des toolboxes Python, R
-
Outils Statistiques
- Machine learning toolboxes
- Scikit Learn : module Python implémentant les principales méthodes de Machine Learning
- R