Show simple item record

hal.structure.identifierStatistique, Analyse et Modélisation Multidisciplinaire (SAmos-Marin Mersenne) [SAMM]
dc.contributor.authorBarbaro, Florian
hal.structure.identifierCEntre de REcherches en MAthématiques de la DEcision [CEREMADE]
dc.contributor.authorRossi, Fabrice
HAL ID: 77
dc.date.accessioned2021-12-11T10:23:01Z
dc.date.available2021-12-11T10:23:01Z
dc.date.issued2021
dc.identifier.urihttps://basepub.dauphine.psl.eu/handle/123456789/22358
dc.description.abstractfrLes mélanges de lois de von Mises-Fisher permettent de construire des classifications (non supervisées) de données sur la sphère unité. Ces mélanges sont bien adaptés aux données directionnelles de grande dimension comme les textes. Pour améliorer la qualité des classes et leur interprétabilité, nous proposons dans cet article de pénaliser la vraisemblance par un terme l 1 , ce qui conduit à des centroïdes parcimonieux. Nous dérivons un algorithme EM pour ce modèle et nous illustrons l'intérêt de notre approche sur un jeu de données réelles. Mots-clés. Mélanges de lois de von Mises-Fisher, pénalisation l 1 , données de grande dimension.en
dc.language.isofren
dc.subjectMélanges de lois de von Mises-Fisheren
dc.subjectpénalisation l1en
dc.subjectdonnées de grandedimensionen
dc.subject.ddc519en
dc.titlePénalisation l 1 pour un mélange de lois de von Mises-Fisheren
dc.typeCommunication / Conférence
dc.description.abstractenMixtures of von Mises-Fisher distributions can be used to cluster data on the unit hypersphere. This is particularly adapted for high dimensional directional data such as texts. We propose in this article to estimate a von Mises mixture using a l1 penalised likelihood. This leads to sparse prototypes that improve both clustering quality and interpretability. We introduce an EM algorithm for this estimation and show the advantages of the approach on real data benchmark.en
dc.identifier.citationpages1-6en
dc.subject.ddclabelProbabilités et mathématiques appliquéesen
dc.relation.conftitleJDS 2021 : 52èmes Journées de Statistique de la Société Française de Statistique (SFdS)en
dc.relation.confdate2021-06
dc.relation.confcityNiceen
dc.relation.confcountryFranceen
dc.relation.forthcomingnonen
dc.description.ssrncandidatenon
dc.description.halcandidatenonen
dc.description.readershiprechercheen
dc.description.audienceNationalen
dc.relation.Isversionofjnlpeerreviewednonen
dc.date.updated2021-12-11T09:59:02Z
hal.author.functionaut
hal.author.functionaut


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record