Repository logo
Research Data
Publications
Projects
Persons
Organizations
English
Français
Log In(current)
  1. Home
  2. Publications
  3. Article de recherche (journal article)
  4. Classification automatique d’opinions dans la blogosphère

Classification automatique d’opinions dans la blogosphère

Author(s)
Savoy, Jacques  
Institut d'informatique  
Kummer, Olena  
Chaire de linguistique computationnelle  
Date issued
2010
In
Actes 10e Journées Analyse statistique des Données Textuelles JADT 2010
From page
653
To page
664
Subjects
détection d'opinions classification d'opinions évaluation de classifieurs RI dans la blogosphère
Abstract
Cette communication traite de la classification automatique opinions dans la blogosphère. Sur la base d'une liste de phrases jugées pertinentes, le système doit déterminer si elles contiennent une opinion ou non. Afin d’atteindre ce but, plusieurs représentations et modèles de catégorisation peuvent être utilisés. Comme système de référence, nous avons retenu une classification basée sur le modèle <i>Naïve Bayes</i>. L'emploi d'une stratégie SVM (avec une représentation <i>tf idf</i>) permet d'accroître la performance du système. Le système que nous proposons détecte l'usage d'un vocabulaire spécifique à chaque catégorie en recourant à un score normalisé (score z). Ces valeurs nous permettent de déterminer si une phrase contient ou non une opinion. Le système proposé a été implémenté et évalué grâce à la collection test NCTIR écrite en langue anglaise. Celle évaluation indique que notre modèle apporte clairement la meilleure performance. Le recours à un thesaurus spécialisé permet d'accroître encore la performance de catégorisation., This paper describes the problem of classifying opinion from blogs. After retrieving relevant sentences, the search system must categorize them as opinionated or factual. To achieve this objective, different representations and automatic categorization models could be used. As baseline system, we have used the <i>Naïve Bayes</i> approach to classify the retrieved sentences as opinionated or not. As a second model, we have used an SVM model (based on a <i>tf idf</i> representation) showing an increase in the overall performance. We suggest using a normalized score (Z score) for catch term according to its presence or absence in opinionated sentences. Based on these Z-scores we can determine whether a given sentence belongs to opinionated or not- opinionated category. The proposed system has been evaluated using the NCTIR English test-collection. We show that the suggested classification method performs significantly better than other approaches. Using a specialized thesaurus, we can further improve the overall categorization performance.
Later version
http://www.ledonline.it/ledonline/index.html?/ledonline/jadt-2010.html
Publication type
journal article
Identifiers
https://libra.unine.ch/handle/20.500.14713/65913
File(s)
Loading...
Thumbnail Image
Download
Name

Savoy_Jacques-Classification_automatique_d_opinions_dans_la_blogosph_re-20130111.pdf

Type

Main Article

Size

640.1 KB

Format

Adobe PDF

Université de Neuchâtel logo

Service information scientifique & bibliothèques

Rue Emile-Argand 11

2000 Neuchâtel

contact.libra@unine.ch

Service informatique et télématique

Rue Emile-Argand 11

Bâtiment B, rez-de-chaussée

Powered by DSpace-CRIS

libra v2.1.0

© 2025 Université de Neuchâtel

Portal overviewUser guideOpen Access strategyOpen Access directive Research at UniNE Open Access ORCIDWhat's new