Show simple item record

hal.structure.identifierCEntre de REcherches en MAthématiques de la DEcision [CEREMADE]
dc.contributor.authorSumma, Mireille
hal.structure.identifierDipartimento di Scienze Relazionali "G.Iacono"
dc.contributor.authorPalumbo, Francesco
hal.structure.identifierDipartimento di Matematica e Statistica
dc.contributor.authorTortora, Cristina
dc.date.accessioned2018-02-12T15:59:15Z
dc.date.available2018-02-12T15:59:15Z
dc.date.issued2010
dc.identifier.urihttps://basepub.dauphine.fr/handle/123456789/17386
dc.description.abstractfrLes méthodes de classification non supervisée ont pour but de révéler une structure entre des éléments, selon les associations qu'on peut y détecter par leurs valeurs sur un ensemble de variables. Lorsque l'on s'intéresse à des grands ensembles d'unités, il est nécessaire d'en réduire la dimensionnalité avant le processus de classification. Quand les variables présentent des liens non linéaires, les approches classiques sont inopérantes. Les classifications de variables qualitatives soulèvent dans ce sens de nombreux problèmes ; les associations sont en général non linéaires. Avec un recodage binaire de l'ensemble des modalités des variables, on obtient le plus souvent des matrices très creuses et de grande dimension. Pour contourner la situation, quand le nombre de variables est important, l'approche plus utilisée est de transformer les variables qualitatives en variables continues, puis de faire la classification sur les valeurs de ces dernières. Notre travail s'attache à classifier de façon non supervisée des variables qualitatives dans le contexte général suivant : il n'y a pas de liens linéaires entre les variables et elles sont en grand nombre. Nous proposons une approche en plusieurs étapes: Analyse factorielle, redéploiement des coordonnées des premiers axes factoriel dans un espace de dimension supérieure, construction des classes dans ce dernier espace, enfin visualisation des classes obtenues dans l'espace des facteurs. On appliquera cette approche sur les données epub" du "éCRAN-R", et nous nous intéresserons sur cet exemple à la comparaison entre l'approche par le détour des vecteurs de support et celle classique d'un arbre hiérarchique."en
dc.language.isofren
dc.subjectApprentissage et classificationen
dc.subjectAnalyse des données - data miningen
dc.subject.ddc519en
dc.titleEtude comparée de classifications sur matrices très creuses et de grandes dimentionsen
dc.typeCommunication / Conférence
dc.relation.ispartoftitle42èmes Journées de Statistiqueen
dc.identifier.urlsitehttps://hal.inria.fr/inria-00494843en
dc.subject.ddclabelProbabilités et mathématiques appliquéesen
dc.relation.conftitle42èmes Journées de Statistiqueen
dc.relation.confdate2010-05
dc.relation.confcityMarseilleen
dc.relation.confcountryFranceen
dc.relation.forthcomingnonen
dc.description.ssrncandidatenonen
dc.description.halcandidatenonen
dc.description.readershiprechercheen
dc.description.audienceNationalen
dc.relation.Isversionofjnlpeerreviewednonen
dc.relation.Isversionofjnlpeerreviewednonen
dc.date.updated2018-02-12T15:54:31Z
hal.author.functionaut
hal.author.functionaut
hal.author.functionaut


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record