Résumé:
La grande quantité de texte disponible sous forme numérique peut rendre difficile l'accès
efficace aux informations. Classer les textes est un bon moyen d'améliorer l'accès à
l'information. Parmi les méthodes de classification est celle basé sur la collaboration des
utilisateurs par l’attribution d’annotation ou tags aux ressources afin de mieux cerner leur
contenu.
Cette étude porte sur le développement d’un système de filtrage et de recommandation sur un
site de partage de documents scientifiques. Le principe de filtrage des étiquettes est d'abord
basé sur leur représentation sous forme d’un graphe pondéré, puis un algorithme de filtrage et
de sélection est appliqué pour identifier et recommander les tags les plus importants selon le
principe de calcul du plus court chemin sur le graphe de tags.
L'objectif est d'aider l'utilisateur d'un site de partage de publications scientifiques à mieux
annoter les documents scientifiques en recommandant une liste de tags significatives.