• Préambule

    Les entreprises, les collectivités collectent et stockent de grandes quantités de données. Ces mégabases de données, recèlent d'informations décisives. Pour les exploiter, la Science des Données est née. Le but de cet EC est d'initier les élèves-ingénieurs aux méthodes du Machine Learning pour le traitement des données.

    • La première partie du cours aborde les méthodes de représentation de données multidimensionnelles.
    • Dans la seconde partie, le cours se concentre sur les méthodes de "clustering", méthodes permettant de regrouper les individus dans des classes homogènes.
    • La dernière partie du cours porte sur la notion de discrimination ou classification, i.e. les méthodes permettant de construire une fonction d'association entre un individu et sa classe.

    Bibliographie

    Diagnostiquer votre démarche de Machine Learning


    Data Science Resource


    Bases de Données en ligne :

    Quelques toolboxes gratuites

    Principalement des toolboxes Python, R