Voici les éléments 1 - 10 sur 10
  • Publication
    Accès libre
    Hyperliens et recherche d’information sur le Web
    (2004) ;
    Rasolofo, Yves
    Les moteurs de recherche s’avèrent des outils indispensables afin de retrouver de l’information sur Internet. Cependant, les usagers ne désirent pas toujours une liste de sites répondant à leurs requêtes mais souhaitent obtenir un site comme unique réponse (recherche d’une page d’accueil ou d’un service en-ligne). D’autre part, nous voulons parfois extraire une liste des ressources clés ayant trait à un domaine précis. Dans ce cas, nous ne cherchons pas toutes les pages sur un thème mais souvent des bons points de départ pour la navigation. Cet article décrit notre système de recherche capable de répondre à ces deux types d’interrogation en recourant aux hyperliens afin d’accroître la qualité des réponses. Une évaluation basée sur une collection de pages Web (18,1 GB) indiquent que la présence des hyperliens permet d’accroître la qualité du dépistage., Today search engines are very useful tools for retrieving information on the Web. When submitting a query however users may not always be interested in retrieving long lists of sites; rather they may prefer only a single Web site (e.g., when looking for a given homepage, an on-line service or a named page). Or, they may be only seeking useful starting points from which to browse a given topic; thus the system should respond with a list of key resources on a given subject (topic distillation). This paper describes our search system that would respond to these two search types and how its reliance on hyperlinks enhances retrieval effectiveness. Using a relatively large Web test collection (18.1 GB), an evaluation of our strategy indicates that the presence of hyperlinks improves search precision and that our system provides performance levels superior to those of other models.
  • Publication
    Métadonnées seulement
    Result merging strategies for a current news metasearcher
    (2003)
    Rasolofo, Yves
    ;
    Hawking, David
    ;
    Metasearching of online current news services is a potentially useful Web application of distributed information retrieval techniques. We constructed a realistic current news test collection using the results obtained from 15 current news Web sites (including ABC News, BBC and AllAfrica) in response to 107 topical queries. Results were judged for relevance by independent assessors. Online news services varied considerably both in the usefulness of the results sets they returned and also in the amount of information they provided which could be exploited by a metasearcher. Using the current news test collection we compared a range of different merging methods. We found that a low-cost merging scheme based on a combination of available evidence (title, summary, rank and server usefulness) worked almost as well as merging based on downloading and rescoring the actual news articles. (C) 2002 Elsevier Science Ltd. All rights reserved.
  • Publication
    Métadonnées seulement
  • Publication
    Métadonnées seulement
  • Publication
    Accès libre
    Term Proximity Scoring for Keyword-Based Retrieval Systems
    (2003)
    Rasolofo, Yves
    ;
    This paper suggests the use of proximity measurement in combination with the Okapi probabilistic model. First, using the Okapi system, our investigation was carried out in a distributed retrieval framework to calculate the same relevance score as that achieved by a single centralized index. Second, by applying a term-proximity scoring heuristic to the top documents returned by a keyword-based system, our aim is to enhance retrieval performance. Our experiments were conducted using the TREC8, TREC9 and TREC10 test collections, and show that the suggested approach is stable and generally tends to improve retrieval effectiveness especially at the top documents retrieved.
  • Publication
    Métadonnées seulement
  • Publication
    Accès libre
    Fusion de collections dans les métamoteurs
    (2002) ;
    Rasolofo, Yves
    ;
    Abbaci, Faïza
    Les métamoteurs disponibles sur le Web offrent la possibilité d'interroger de nombreux serveurs d'information soulevant le problème de la fusion des résultats provenant des différents moteurs interrogés. Dans cet article, nous proposons une nouvelle stratégie de fusion n'utilisant que le rang des documents dépistés par les divers moteurs de recherche consultés. De plus, nous évaluons plusieurs approches en utilisant un corpus de 2 GB comprenant des articles de quotidiens et une seconde collection de pages Web d'environ 10 GB. Basée sur nos expériences, notre stratégie, simple et efficace pour la fusion de collections, présente une performance intéressante et se révèle bien adaptée aux métamoteurs de recherche., We investigate the problem of combining ranked lists of documents provided by multiple search engines. Such a problem must be solved by meta-search engines. In this paper, we suggest a new merging strategy using only the rank of the retrieved items. Moreover, we evaluate various merging approaches based on both a corpus of 2 GB containing news, and a second test-collection of 10 GB of Web pages. Based on our evaluations, our merging approach presents interesting performance and it is well adapted for meta-search engines.
  • Publication
    Accès libre
    Recherche d'information distribuée: approches pour la sélection de collections et la fusion de listes de résultats
    (2002)
    Rasolofo, Yves
    ;
    Une vue simplifiée d'un système de recherche d'information distribuée fait intervenir des serveurs de collections (ou des moteurs de recherche) et un courtier (métamoteur). Le courtier transmet une requête soumise par un utilisateur à un sous-ensemble de serveurs de collections. Les serveurs sélectionnés sont ceux qui ont une forte probabilité de contenir des documents pertinents à cette requête. Cette première étape est communément appelée « sélection de collections ». Chaque collection ainsi sélectionnée traite la requête et retourne une liste de documents au courtier. Finalement, le courtier fusionne en une seule liste les différentes listes qu'il a reçues à l'utilisateur. On parle alors de « Fusion de résultats ». Ce travail propose des nouvelles approches pour la « sélection de collections » et la « fusion de résultats ». Le détail de ces approches et des évaluations que nous avons effectuées est exposé dans les différentes publications incluses dans ce rapport. Ces publications ont été acceptées dans des conférences et des revues de renommée internationale., A simple distributed information retrieval system is made up of collection servers (or search engines) and a broker (or metasearcher). The broker forwards a request submitted by a user to a carefully selected subset of collections servers, those which are likely to contain relevant documents to the query ("collections selection"). Each selected collection server processes the query and returns a ranked list of documents to the broker. Finally, the broker merges the received results lists into a single list ("results merging") and forwards it to the user. This work proposes new effective approaches to "collections selection" and "results merging". Details on those approaches and the evaluations we made are given in the enclosed papers. Those papers are published in well known conferences and journals.
  • Publication
    Métadonnées seulement
  • Publication
    Accès libre
    Approaches to Collection Selection and Results Merging for Distributed Information Retrieval
    (2001)
    Rasolofo, Yves
    ;
    Abbaci, Faïza
    ;
    We have investigated two major issues in Distributed Information Retrieval (DIR), namely: collection selection and search results merging. While most published works on these two issues are based on pre-stored metadata, the approaches described in this paper involve extracting the required information at the time the query isprocessed. In order to predict the relevance of collections to a given query, we analyse a limited number of full documents (e.g., the top five documents) retrieved from each collection and then consider term proximity within them. On the other hand, our merging technique is rather simple since input only requires document scores and lengths of results lists. Our experiments evaluate the retrieval effectiveness of these approaches and compare them with centralised indexing and various other DIR techniques (e.g., CORI [2][3][23]).
    We conducted our experiments using two testbeds: one containing news articles extracted from four different sources (2 GB) and another containing 10 GB of Web pages. Our evaluations demonstrate that the retrieval effectiveness of our simple approaches is worth considering.