Logo du site
  • English
  • Français
  • Se connecter
Logo du site
  • English
  • Français
  • Se connecter
  1. Accueil
  2. Université de Neuchâtel
  3. Publications
  4. Etude comparative de stratégies de sélection de prédicteurs pour l’attribution d’auteur
 
  • Details
Options
Vignette d'image

Etude comparative de stratégies de sélection de prédicteurs pour l’attribution d’auteur

Auteur(s)
Savoy, Jacques 
Institut d'informatique 
In
Actes 9ème Conférence en Recherche d’Information et Applications CORIA’12, 2012///215-228
Mots-clés
  • Sélection de prédicte...

  • attribution d'auteur

  • catégorisation de tex...

  • Feature selection

  • authorship attributio...

  • text categorization

Résumé
L’attribution d'auteur peut être vue comme une tâche en catégorisation de textes qui se subdivise en deux étapes. D’abord nous devons sélectionner les mots les plus discriminants puis appliquer un modèle de classification. Afin de bien choisir les meilleurs termes, nous avons évalué sept fonctions de sélection dont l’information mutuelle ponctuelle, le gain d’information, le rapport de cotes, le <i>Χ</i><sup>2</sup> ou le coefficient de corrélation. Nous avons également retenu deux stratégies de sélection proposées dans le cadre d’attribution d’auteur. Afin de comparer ces méthodes, nous avons repris un corpus de 5 408 articles de presse (Glasgow Herald) écrits par vingt journalistes différents. Basé sur la performance obtenue par la méthode de divergence KLD (Zhao & Zobel, 2007) et Delta (Burrows, 2002), nous remarquons que des stratégies simples proposent des résultats aussi performants que des approches plus complexes., The authorship attribution problem can be viewed as a categorization problem. To determine the most effective features to discriminate between different writers (or categories), we have evaluated seven feature selection functions (e.g., pointwise mutual information, information gain, odds ratio, <i>Χ</i><sup>2</sup>, or correlation coefficient). We have also considered two selection functions proposed in the context of authorship attribution. To compare these approaches, we have selected a newspaper corpus (Glasgow Herald) composed of 5,408 articles written by twenty columnists. Using the KLD (Zhao & Zobel, 2007) and the Delta (Burrows, 2002) attribution scheme, we found that some simple selection functions tend to produce results comparable to more complex ones.
URI
https://libra.unine.ch/handle/123456789/9628
Autre version
http://cifed-coria2012.labri.fr/
Type de publication
Resource Types::text::journal::journal article
Dossier(s) à télécharger
 main article: Savoy_Jacques_Etude_comparative_de_strat_gies_20121220.pdf (1.04 MB)
google-scholar
Présentation du portailGuide d'utilisationStratégie Open AccessDirective Open Access La recherche à l'UniNE Open Access ORCID

Adresse:
UniNE, Service information scientifique & bibliothèques
Rue Emile-Argand 11
2000 Neuchâtel

Construit avec Logiciel DSpace-CRIS Maintenu et optimiser par 4Sciences

  • Paramètres des témoins de connexion
  • Politique de protection de la vie privée
  • Licence de l'utilisateur final