Repository logo
Research Data
Publications
Projects
Persons
Organizations
English
Français
Log In(current)
  1. Home
  2. Publications
  3. Article de recherche (journal article)
  4. Recherche bilingue et multilingue d’information. Vers une sélection des bonnes traductions

Recherche bilingue et multilingue d’information. Vers une sélection des bonnes traductions

Author(s)
Savoy, Jacques  
Institut d'informatique  
Berger, Pierre-Yves
Date issued
2004
In
Actes de la 1ère Conférence en Recherche d’Information et Applications CORIA’04, Institut de Recherche en Informatique de Toulouse (IRIT), 2004///271-286
Subjects
recherche multilingue sélection automatique apprentissage automatique cross-lingual retrieval automatic selection automatic learning
Abstract
Afin de pouvoir interroger des corpus écrits dans plusieurs langues, la stratégie la plus simple et la moins onéreuse consiste à traduire la requête soumise dans la (ou les) langue(s) souhaitée(s). Dans ce but, nous nous sommes appuyés sur des ressources dispo-nibles gratuitement sur le Web. En comparant l’efficacité du dépistage entre les requêtes traduites manuellement ou automatiquement, on constate que la machine s’avère moins bonne que l’être humain. Toutefois, cette première conclusion se base sur une moyenne et une analyse plus détaillée indique une forte variabilité, dans le dépistage de l’information, entre les performances des différentes traductions produites par la machine. La question qui se pose est de savoir si l’on peut prédire la performance d’une requête traduite afin de sélectionner seulement la meilleure ou les meilleures traductions. Afin de résoudre ce problème, nous avons conçu un système de prédiction basé sur la régression logistique et capable de prédire les meilleures traductions. L’évaluation de notre approche s’avère supé-rieure au meilleur système de traduction automatique., In order to search within corpora written in two or more languages, the simplest and most effective approach is to translate the submitted request into the required lan-guage(s). To achieve this goal, we based our IR model on translation tools freely available on the Web. When comparing the retrieval effectiveness of manually and automatically translated requests, we found that human-based translation outperformed machine-based approaches. However, when we analyzed the query-by-query performance, we found query performances based on machine-based translations to vary a great deal. The question that then arises is whether or not we can predict the retrieval performance of a translated query and as a result we may thus select only the best translation(s). To respond to this, we designed and evaluated a predictive system based on the logistic regression, and used it to select the top most appropriate machine-based translations. An evaluation of this approach shows retrieval performance is better than using the best machine-based translation.
Publication type
journal article
Identifiers
https://libra.unine.ch/handle/20.500.14713/58754
File(s)
Loading...
Thumbnail Image
Download
Name

Savoy_Jacques_-_Recherche_bilingue_et_multilingue_d_information_20100215.pdf

Type

Main Article

Size

360.79 KB

Format

Adobe PDF

Université de Neuchâtel logo

Service information scientifique & bibliothèques

Rue Emile-Argand 11

2000 Neuchâtel

contact.libra@unine.ch

Service informatique et télématique

Rue Emile-Argand 11

Bâtiment B, rez-de-chaussée

Powered by DSpace-CRIS

libra v2.1.0

© 2025 Université de Neuchâtel

Portal overviewUser guideOpen Access strategyOpen Access directive Research at UniNE Open Access ORCIDWhat's new