Repository logo
Research Data
Publications
Projects
Persons
Organizations
English
Français
Log In(current)
  1. Home
  2. Publications
  3. Thèse de doctorat (doctoral thesis)
  4. Computational exploration and analysis of meters and patterns in Arabic metrical poetry : detection, visualization, and clustering of structures and compositions

Computational exploration and analysis of meters and patterns in Arabic metrical poetry : detection, visualization, and clustering of structures and compositions

Author(s)
Berkani, Abdelmalek  
Service informatique et télématique  
Editor(s)
Holzer, Adrian  
Chaire de management des systèmes d'information  
Publisher
Neuchâtel : Université de Neuchâtel
Date issued
2024
Number of pages
204 p.
Subjects
poésie arabe mètres et patterns Clustering visualisation Arabic poetry Meters and patterns Visualization
Abstract
Cette thèse aborde le problème de l’insuffisance de données et d’outils de traitement automatique du langage naturel liés au système métrique de la poésie arabe, ce qui rend l’exploration des compositions poétiques difficile. Bien que le système métrique ait été largement étudié d’un point de vue linguistique, il a reçu beaucoup moins d’attention en linguistique computationnelle, où des données structurées et des techniques de traitement appropriées sont essentielles pour une analyse efficace. Pour aider à résoudre ce problème, la thèse propose des solutions dans trois domaines clés : les règles du système métrique arabe, les techniques de traitement automatique du langage naturel (NLP) et l’analyse et la visualisation des structures poétiques. Nous présentons <i>Arabic Meters Identification System (AMIS)</i> , un framework structuré organisé en modules spécialisés. Au coeur de AMIS, les données et les règles du système métrique arabe sont intégrées, caractérisant ainsi tous les mètres arabes. Des modules supplémentaires se concentrent sur la détection automatique des mètres dans les poèmes ou les vers individuels, avec une précision fiable de 99,97%. D’autres modules sont dédiés à l’analyse structurelle et à la visualisation des compositions poétiques, y compris des évaluations comparatives. En outre, cette thèse identifie les principales caractéristiques des structures poétiques arabes métrées grâce à une approche de Clustering basée sur cinq métriques : <i>Evenness, Variability, Repetition, Pattern Potential</i> et <i>Pattern Usage</i>. Nos résultats montrent que Repetition, Variability et Pattern Usage sont les métriques les plus significatives, avec seulement deux attributs suffisants pour caractériser la structure d’un poème. De plus, nous explorons le potentiel de la représentation visuelle de la structure de la poésie arabe, la rendant accessible aux locuteurs arabophones et non arabophones. Ces techniques de visualisation ont permis de découvrir de nouvelles métriques qui améliorent les résultats du Clustering, offrant des perspectives plus approfondies sur la structure de la poésie arabe.
ABSTRACT:
This thesis addresses the issue of insufficiency of data and natural language processing (NLP) tools related to the metrical system of Arabic poetry, which makes the exploration of poetic compositions challenging. Although the metrical system has been extensively studied from a linguistic perspective, it has received far less attention in computational linguistics, where structured data and appropriate processing techniques are essential for effective analysis. To help address this problem, the thesis provides solutions across three key areas: Arabic metrical system rules, NLP techniques, and the analysis and visualization of poetic structures. We introduce <i>Arabic Meters Identification System (AMIS)</i>, a structured framework organized into specialized modules. At its core, AMIS integrates the data and rules of the Arabic metrical system, which characterizes all Arabic meters. Additional modules focus on the automatic detection of meter in poems or individual verses, achieving a reliable accuracy of 99.97%. Other modules are dedicated to the structural analysis and visualization of poetic compositions, including comparative assessments. Furthermore, this thesis identifies the key features of metered Arabic poetic structures through a clustering approach based on five metrics: <i>Evenness, Variability, Repetition, Pattern Potential<i>, and <i>Pattern Usage</i>. Our findings show that Repetition, Variability, and Pattern Usage are the most significant metrics, with just two attributes being sufficient to characterize a poem’s structure. Additionally, we explore the potential of visual representation of Arabic poetry, making its structure visible and accessible to both Arabic and non-Arabic speakers. These visualization techniques uncovered new metrics that improve clustering outcomes, providing deeper insights into the structure of Arabic poetry.
Publication type
doctoral thesis
Identifiers
https://libra.unine.ch/handle/20.500.14713/33111
DOI
10.35662/unine-thesis-3167
File(s)
Loading...
Thumbnail Image
Download
Name

00003167_Berkani_Abdelmalek.pdf

Type

Main Article

Size

5.17 MB

Format

Adobe PDF

Université de Neuchâtel logo

Service information scientifique & bibliothèques

Rue Emile-Argand 11

2000 Neuchâtel

contact.libra@unine.ch

Service informatique et télématique

Rue Emile-Argand 11

Bâtiment B, rez-de-chaussée

Powered by DSpace-CRIS

libra v2.1.0

© 2026 Université de Neuchâtel

Portal overviewUser guideOpen Access strategyOpen Access directive Research at UniNE Open Access ORCIDWhat's new