Titre : | Etude d' indicateurs de performances d'algorithmes de pseudo réinjection de pertinence |
Auteurs : | Nadjet Oucheni, Auteur ; Kheira Cherad, Auteur ; Chakir Mokhtari, Directeur de thèse |
Type de document : | texte manuscrit |
Editeur : | Université mustapha stambouli de Mascara:Faculté des sciences exactes, 2016 |
Format : | 115p. / ill. en coul. / 29 cm. |
Accompagnement : | disque optique numérique (CD-ROM) |
Langues: | Français |
Résumé : |
L’objectif principal de la recherche d’information (RI) est de fournir des modèles, des techniques et des outils pour stocker et organiser des masses d’informations et localiser celles qui seraient pertinentes relativement a un besoin en information d’un utilisateur, souvent, exprimé à travers une requête. Les systèmes de recherche d’information (SRI) permettent d’automatiser la tâche de la RI. Ils consistent à construire une représentation des documents et de la requête et d’établir une comparaison entre deux représentations (requête et documents) pour retourner les documents pertinents. La reformulation de requêtes est une phase importante du processus de recherche d’information. Elle consiste de manière générale à enrichir la requête de l’utilisateur en ajoutant des termes permettant de mieux exprimer son besoin. En effet, les techniques de reformulation consistent à modifier les requêtes pour ressembler d’avantage aux documents jugés pertinents et s’éloigner des documents non pertinents. Plus la distance entre la requête initiale et la requête reformulée est grande, plus il y a de nouveau documents qui vont apparaître comme résultat de la nouvelle recherche. Ces techniques peuvent être assistées par l’utilisateur, comme elles peuvent être menées d’une manière automatique. L’objectif de cette étude est le développement d’un SRI permettant d’augmenter la pertinence de la RI dans une collection de documents. L’intérêt de ce travail était basé sur l’utilisation le modèle vectoriel et une classification non supervisée qui consiste à grouper les données dans des classes. Nous avons utilisé dans notre travail deux algorithmes de classification automatique à savoir FPF et K-moyens. A travers les tests, nous avons calculé un certain nombre d’indicateurs pour prédire la contribution de l’algorithme de classification dans la réinjection de pertinence. Les différents tests sont effectués sur le corpus Disque 4 & 5 de la collection TREC, il est de taille importante comprenant plus de 556,000 documents textes avec des jugements d’experts. Nous espérons que ces indicateurs nous donnent des prédictions sur la contribution de la classification dans la pseudo réinjection de pertinence. Ce projet nous a permis en plus d’acquérir une expérience très bénéfique pour nos futures carrières En effet, ce travail étant une œuvre humaine, n’est pas un modèle unique et parfait, c’est pourquoi il reste ouvert à toutes les critiques et nous sommes prêtes à recevoir toutes vos suggestions et remarques tendant à améliorer d’avantage cette étude. On estime qu’on a réussi à faire un bon travail. Néanmoins, nous aurions voulu l’occasion beaucoup développer et enrichir notre application mais faute de temps on est s’arrêté à ce point en encouragent tous les chercheurs qui souhaite approfondir ce domaine. A la fin, on remercie tous ce qu’ils lisent ce mémoire. |
Exemplaires (2)
Code-barres | Cote | Support | Localisation | Section | Disponibilité |
---|---|---|---|---|---|
SE00347T | INF21 | Livre audio | Bibliothèque des Sciences Exactes | 7-Mémoires Master | Libre accès Disponible |
SE00348T | INF21 | Livre audio | Bibliothèque des Sciences Exactes | 7-Mémoires Master | Libre accès Disponible |
Aucun avis, veuillez vous identifier pour ajouter le vôtre !
Accueil