Options
Catégorisation de documents: applications en attribution d’auteur et analyse stylistique
Auteur(s)
Date de parution
2017
In
Le Document ? Actes du 20e Colloque International sur le Document numérique (CiDE.20), Europia Productions, 2017///1-14
Résumé
La catégorisation de documents (attribution d'un texte à une ou plusieurs catégories prédéfinies) représente un problème possédant de multiples facettes. Ainsi, l'indexation automatique correspond à l'une d'entre elles qui se fonde sur la sémantique des documents. Cependant d'autres applications analysent les mots outils, ces formes qui ne portent que peu ou pas de sens. Or ces dernières permettent, en grande partie, de décrire le style d'un auteur voire de déterminer quelques aspects de son profil. Sur la base de ces éléments, nous allons présenter comment identifier le véritable auteur d'un document, ou savoir si celui-ci a été écrit par un homme ou une femme. Afin d'illustrer nos propos, nous aborderons le cas <i>d'Elena Ferrante</i>, un pseudonyme mondialement connu depuis la parution de son roman <i>L'amie prodigieuse</i> (Gallimard, 2016). Comme autre exemple, nous analyserons les discours des présidents américains de G. Washington (1789) à D. Trump (2017) afin d'en découvrir quelques traces évolutives tant stylistiques que thématiques. Dans ce dernier cas, une synthèse sera extraite d'un corpus de discours sous la forme d'un graphique décrivant les rapprochements entre présidences.
Identifiants
Type de publication
journal article
Dossier(s) à télécharger