• Projets

    L'objectif de ce projet est :
    • soit de réaliser une petite application (le livrable sera dans ce cas le programme et un mini rapport de moins de 10 pages);
    • soit de faire un état de l'art sur un problème (le livrable sera un mini rapport d'une vingtaine de pages avec au moins une dizaine de références bibliographiques);
    • soit de résumer des articles de recherche ou des extraits de mémoires assez récents dans le domaine du document et du web sémantique. La taille du résumé devra être d'environ 25% du document initial sans copier/coller (nous les rechercherons avec le logiciel d'anti-plagiat Compilatio.net).
    Les projets sont réalisés par groupe. Une présentation de 15 minutes maximum aura lieu durant la dernière semaine de cours.
    Vous rédigez votre rapport en LaTeX en utilisant obligatoirement l'entête suivante :
    \usepackage[utf8]{inputenc}
    \usepackage[T1]{fontenc}
    \usepackage[francais]{babel}
    \usepackage{lmodern}
    \usepackage{ucs}

    Vous mettrez dans le forum moodle du cours, avant le vendredi 19 février 2021, la constitution des groupes pour chaque projet.

    Votre livrable sera une archive (tar.gz) composée :

    • d'un répertoire "presentation" (sans accent) contenant la source et le PDF de votre présentation (si LaTeX, un fichier Makefile permettra de le compiler)
    • d'un répertoire "rapport" contenant la source et le PDF de votre rapport (si LaTeX, un fichier Makefile permettra de le compiler)
    • d'un répertoire "code" contenant ce que vous avez développé. L'organisation et le contenu de ce répertoire suivront ce que l'on vous a enseigné dans les différentes cours (variant un peu en fonction des langages) : src, test, doc, bin ou classes, Makefile, README, etc.

    Les archives (tar.gz) seront à déposer avec le lien ci dessous avant le mardi 5 mai 2020 23h55. Le nom de l'archive et du répertoire obtenu après décompression seront la concaténation des noms des étudiants du groupe (en CamelCase, en ordre alphabétique, sans accent, sans espace), séparés par des tirets (-), le tout préfixé par le numéro du projet (1 à 5). Par exemple le livrable de Julie Le Cain et Jean Dupont du groupe 2 se nommerait 2-Dupont-Lecain.tar.gz

    Sujets

    Projet 1 : une IA explicable

    Contexte

    Durant les dix dernières années, l’apprentissage artificiel (AA) a permis de réaliser de gros progrès en intelligence artificielle et ceci dans énormément de domaines. Cela est d’autant plus vrai dans le cadre de l’apprentissage supervisé, un sous domaine de l’AA, qui permet d’étiqueter de nouvelles données. L’apprentissage supervisé permet par exemple de pouvoir reconnaître des objets dans une image.

    Le problème de l’AA est qu’il fonctionne en « boîte noire » : il est impossible de justifier ce que produisent ces algorithmes. De plus, dans de nombreux cas, ces algorithmes ne peuvent pas « se remettre en question » en détectant des incohérences sémantiques dans leur résultat.

    L’IA explicable est un domaine de recherche qui essaye de répondre à ces deux questions. L’équipe MIND du LITIS travaille entre autres sur cette problématique scientifique. Une nos approches est d’utiliser conjointement des algorithmes d’AA et des ontologies pour valider et expliquer les résultats : chaque algorithme de AA génère des individus de l’ontologie, un algorithme les relie entre eux et aux classes d’un schéma ontologique et finalement un raisonneur valide, ou pas, l’ontologie obtenue.

    La reconnaissance de chiffre
    On se propose dans ce projet de tester cette approche sur la reconnaissance de chiffres manuscrits de la base de données MINST (http://yann.lecun.com/exdb/mnist/). Pour chaque image à classer, nous allons utiliser :
    • un algorithme d’AA pour générer un individu de l’une des dix classes de l’ontologie représentant le chiffre reconnu ;
    • des algorithmes d’AA pour générer des individus représentant des composants graphiques de base (traits verticaux, traits horizontaux, traits diagonaux haut gauche-bas droit, traits diagonaux bas gauche-haut droit, cercle, arc de cercle orienté suivant les quatre directions haut, bas, gauche, droite) ainsi que leur position dans l’image (le cadre qui les inclut appelé “bounding box”) ;
    • un algorithme qui relie, au regard de leurs positionnements relatifs, les individus issus de l’algorithme 2 ;
    • un raisonneur qui à partir de ces individus et d’un schéma ontologique du domaine des chiffres indo-arabe détermine si l’ontologie est cohérente, ou pas, et qui génère un petit texte en langue naturelle qui explique ce résultat.
    Projets pour chaque équipe
    1. (2 personnes) développement du schéma ontologique OWL2 décrivant des chiffres indo-arabes
    2. (2 personnes) développement d’un programme utilisant le meilleur algorithme d’AA sur la base MINST pour générer l’ individu représentant le chiffre reconnu. Le résultat de ce programme sera un fichier turtle
    3. (4 personnes) développement d’un programme utilisant des cascades de Haar pour reconnaître les individus représentant les composants graphiques de base et leur bounding box. Le résultat de ce programme sera un fichier turtle
    4. (2 personnes) développement d’un programme qui prendra en entrée le fichier turtle de l’équipe 3 et qui ajoutera les informations de positionnement relatifs entre représentant des composants graphiques. Le résultat de ce programme sera un fichier turtle
    5. (2 personnes) développement d’un programme qui prendra en entrée le fichier turtle de l’équipe 1 et de l’équipe 4 et qui produira un petit texte en langue naturelle qui explique pourquoi l’ensemble forme un tout cohérent, ou pas...

    Projet 2 : NoDEfr-2, une norme pour la description des offres de formation

    Contexte

    Un groupe d'experts de l'AFNOR travaillent depuis deux ans sur la spécification d'un modèle conceptuel pour la description des offres de formation (NoDEfr-2). Le méta modèle utilisé pour modéliser le NoDEfr-2 est celui proposé par l'ISO dans le cadre du MLR. Le paradigme de ce méta-modèle (ensembliste reposant sur la description de classes et d'éléments de données) est proche de ceux proposés par le W3C pour le web des données (RDFS) et le web sémantique (OWL2). Pour travailler les experts utilisent un tableur (document semi-formel): un onglet représente les classes, et les autres onglets (un par classe) leurs propriétés (éléments de données). L'objectif de ce projet est de formaliser automatiquement ce travail pour générer automatiquement des schémas RDFS et OWL.

    Projets pour chaque équipe
    1. (2 personnes) développement d'une grammaire XSD pour valider des fichiers XML qui formaliseraient les classes et éléments de données du NoDEfr-2
    2. (2 personnes) formalisation des informations semi structurées issus d'un tableur calc. Le programme prendra en entrée un ods et générera un fichier XML compatible avec le schéma XML du l'équipe 1
    3. (2 personnes) génération d'un schéma RDF (au format turtle) à partir du fichier XML produit par l'équipe 2
    4. (3 personnes) génération d'un schéma OWL2 (au format turtle) à partir du fichier XML produit par l'équipe 2

    • Fichier pour le projet NoDEfr-2 File
      Restricted Not available unless: You belong to Inscrits