• français
    • English
  • English 
    • français
    • English
  • Login
JavaScript is disabled for your browser. Some features of this site may not work without it.
BIRD Home

Browse

This CollectionBy Issue DateAuthorsTitlesSubjectsJournals BIRDResearch centres & CollectionsBy Issue DateAuthorsTitlesSubjectsJournals

My Account

Login

Statistics

View Usage Statistics

Décomposition et évaluation des mesures de stabilité d'un partitionnement

Decomposition and evaluation of partition stability measures

Thumbnail
View/Open
these El Moubarki.pdf (1.363Mb)
Date
2009-12
Dewey
Informatique générale
Sujet
Analyse des données; Partition; Décomposition
URI
https://basepub.dauphine.fr/handle/123456789/5776
Collections
  • LAMSADE : Thèses
Metadata
Show full item record
Author
El Moubarki, Lassad
Thesis supervisor
Bertrand, Patrice; Cazes, Pierre
Type
Thèse
Item number of pages
150
Abstract (FR)
Plusieurs méthodes ont récemment été proposées afin de valider un partitionnement en évaluant sa stabilité. Les mesures de validation utilisant le critère de stabilité se diffèrent, essentiellement, par leurs façons de comparer les partitions. Partant du principe qu'un manque de stabilité est dû à un défaut de cohésion et/ou d'isolation des classes, nous proposons d'interpréter certaines mesures de stabilité, tel que l'indice de Rand, par le degré global d'isolation et de cohésion de la partition. Nous montrons que pour toutes les classes, ces degrés de cohésion et d'isolation se décomposent en fonction des contributions de chaque élément de l'ensemble des données à classer. Nous illustrons notre approche sur des données réelles et sur des données simulées. En particulier, nous traitons un jeu de données simulées qui illustre le comportement asymptotique des mesures de stabilité qui a été formellement établi dans un article récent de Ben David, von Luxburg (2008). De plus, nous comparons, sur les jeux de données traités, les différentes mesures de stabilité de partitions obtenues par plusieurs méthodes de classification.
Abstract (EN)
During the last ten years, several stability measures have been proposed with the aim to assess partitions obtained from clustering algorithms. These measures differ in the way to compare partitions. Based on the idea that a lack of stability is due to either a lack of cohesion and/or isolation of clusters, we propose a validation process based on a two decomposition level of stability measures. We propose an additive decomposition of some partition stability measures such as the well known Rand index.The terms of this decomposition are related to either the cohesion or the isolation of any cluster in the examined partition, and each of these terms is the sum of the contributions of all the individual objects of the dataset. We then present our approach both on real and simulated datasets. In particular, we investigate simulated datasets that illustrate the theoretical limitations on partition stability measures, as recently established by Ben-David and von Luxburg (2008). The obtained results for these datasets suggest that the above decomposition of stability measures, may help to avoid misinterpretations of partition stability values.

  • Accueil Bibliothèque
  • Site de l'Université Paris-Dauphine
  • Contact
SCD Paris Dauphine - Place du Maréchal de Lattre de Tassigny 75775 Paris Cedex 16

 Content on this site is licensed under a Creative Commons 2.0 France (CC BY-NC-ND 2.0) license.