Options
Premières évaluations de la recherche d’information dans les <i>blogs</i>
Auteur(s)
Fautsch, Claire
Date de parution
2008
In
Actes 5ème Conférence en Recherche d’Information et Applications CORIA’08, ARIA (Association Francophone de Recherche d'Information et Applications) et CNRS (Centre National de Recherche Scientifique), 2008///441-448
Résumé
Recourant au modèle vectoriel tf idf, ainsi qu’à trois approches probabilistes et un modèle de langue, cet article évalue leur performance sur un corpus TREC extrait de la blogosphère et comprenant 100 requêtes. Basé sur deux mesures de performance, nous démontrons que l’absence d’enracineur s’avère plus efficace que d’autres approches (enracineur léger ou celui de Porter)., This paper describes the main retrieval problems when facing with blogs. Using the classical tf idf vector-space model together with three probabilistic and one statistical language model, we evaluate them using a TREC test-collections composed of 100 topics. Using two performance measures, we show that ignoring a stemming approach results in a better performance than other indexing strategies (light or Porter’s stemmer).
Identifiants
Autre version
http://coria08.irisa.fr/index_fr.shtml
Type de publication
journal article