Résumé:
La recherche des articles scientifiques pertinents à un projet de recherche est une tâche
indispensable dans le protocole d’élaboration des revues systématiques. Pour éviter le
risque d’éliminer des documents pertinents, une recommandation a été adoptée pour
l’utilisation de plusieurs moteurs de recherche académiques à la fois : Google Scholar,
Scopus, ACM, Springer, IEEE, ScienceDirect et Wiley. Cette recommandation rend la
sélection des documents une tâche fastidieuse et coûteuse en termes de temps.
Effectivement, la réponse à une requête par chaque moteur de recherche produit un
nombre énorme de métadonnées qui doivent être filtrées manuellement. Chaque moteur
adopte une stratégie particulière pour trier ses propres résultats, qui ne sont pas fiables
pour la sélection rigoureuse des documents pertinents. À travers ce projet, nous
contribuons par l’automatisation de la phase de sélection des métadonnées renvoyées par
les différents moteurs de recherche en les classifiant selon leurs pertinences « sémantique
» à la requête de recherche. Nous proposons donc l’utilisation des techniques de
l’intelligence artificielle pour l’automatisation de cette tâche. L'objectif principal visé est
la proposition et l’implémentation d’une approche à base d’apprentissage automatique
et de l’ontologie du domaine pour la sélection des documents scientifiques depuis
l’analyse de leurs métadonnées. L’ontologie du domaine enrichit les termes de
recherches et améliore la détection de similarité entre les papiers, alors que
l’apprentissage automatique prédit automatiquement la pertinence des papiers.
L’expérimentation montre que l’approche proposée réduit jusqu’à 35% de l’effort
manuel.