Premières évaluations de la recherche d’information dans les <i>blogs</i>
Author(s)
Fautsch, Claire
Date issued
2008
In
Actes 5ème Conférence en Recherche d’Information et Applications CORIA’08, ARIA (Association Francophone de Recherche d'Information et Applications) et CNRS (Centre National de Recherche Scientifique), 2008///441-448
Subjects
blogosphère domaine spécifique évaluation modèle probabiliste TREC blogs domain-specific IR evaluation probabilistic model TREC
Abstract
Recourant au modèle vectoriel tf idf, ainsi qu’à trois approches probabilistes et un modèle de langue, cet article évalue leur performance sur un corpus TREC extrait de la blogosphère et comprenant 100 requêtes. Basé sur deux mesures de performance, nous démontrons que l’absence d’enracineur s’avère plus efficace que d’autres approches (enracineur léger ou celui de Porter)., This paper describes the main retrieval problems when facing with blogs. Using the classical tf idf vector-space model together with three probabilistic and one statistical language model, we evaluate them using a TREC test-collections composed of 100 topics. Using two performance measures, we show that ignoring a stemming approach results in a better performance than other indexing strategies (light or Porter’s stemmer).
Later version
http://coria08.irisa.fr/index_fr.shtml
Publication type
journal article
File(s)![Thumbnail Image]()
Loading...
Name
Fautsch_Claire_-_Premi_res_valuations_de_la_recherche_d_information_20100223.pdf
Type
Main Article
Size
302.19 KB
Format
Adobe PDF
