• français
    • English
  • English 
    • français
    • English
  • Login
JavaScript is disabled for your browser. Some features of this site may not work without it.
BIRD Home

Browse

This CollectionBy Issue DateAuthorsTitlesSubjectsJournals BIRDResearch centres & CollectionsBy Issue DateAuthorsTitlesSubjectsJournals

My Account

Login

Statistics

View Usage Statistics

Etude comparée de classifications sur matrices très creuses et de grandes dimensions

Thumbnail
Date
2010
Notes
Le document auquel le lien donne accès comprend uniquement les résumés en français et anglais (longs)et la bibliographie.
Link to item file
http://hal.archives-ouvertes.fr/inria-00494843/fr/
Dewey
Probabilités et mathématiques appliquées
Sujet
Statistiques
Conference name
42èmes Journées de Statistique
Conference date
05-2010
Conference city
Marseille
Conference country
France
URI
https://basepub.dauphine.fr/handle/123456789/4625
Collections
  • CEREMADE : Publications
Metadata
Show full item record
Author
Tortora, Cristina
Palumbo, Francesco
Gettler-Summa, Mireille
Type
Communication / Conférence
Abstract (FR)
Les méthodes de classification non supervisée ont pour but de révéler une structure entre des éléments, selon les associations qu’on peut y détecter par leurs valeurs sur un ensemble de variables. Lorsque l’on s’intéresse à des grands ensembles d’unités, il est nécessaire d’en réduire la dimensionnalité avant le processus de classification. Quand les variables présentent des liens non linéaires, les approches classiques sont inopérantes. Les classifications de variables qualitatives soulèvent dans ce sens de nombreux problèmes ; les associations sont en général non linéaires. Avec un recodage binaire de l’ensemble des modalités des variables, on obtient le plus souvent des matrices très creuses et de grande dimension. Pour contourner la situation, quand le nombre de variables est important, l’approche plus utilisée est de transformer les variables qualitatives en variables continues, puis de faire la classification sur les valeurs de ces dernières. Notre travail s’attache à clas- sifier de façon non supervisée des variables qualitatives dans le contexte général suivant : il n’y a pas de liens linéaires entre les variables et elles sont en grand nombre. Nous proposons une approche en plusieurs étapes: Analyse factorielle, redéploiement des coor- données des premiers axes factoriel dans un espace de dimension supérieure, construction des classes dans ce dernier espace, enfin visualisation des classes obtenues dans l’espace des facteurs. On appliquera cette approche sur les données "epub" du "CRAN-R", et nous nous intéresserons sur cet exemple à la comparaison entre l’approche par le détour des vecteurs de support et celle classique d’un arbre hiérarchique.

  • Accueil Bibliothèque
  • Site de l'Université Paris-Dauphine
  • Contact
SCD Paris Dauphine - Place du Maréchal de Lattre de Tassigny 75775 Paris Cedex 16

 Content on this site is licensed under a Creative Commons 2.0 France (CC BY-NC-ND 2.0) license.