• xmlui.mirage2.page-structure.header.title
    • français
    • English
  • Aide
  • Connexion
  • Langue 
    • Français
    • English
Consulter le document 
  •   Accueil
  • LAMSADE (UMR CNRS 7243)
  • LAMSADE : Publications
  • Consulter le document
  •   Accueil
  • LAMSADE (UMR CNRS 7243)
  • LAMSADE : Publications
  • Consulter le document
JavaScript is disabled for your browser. Some features of this site may not work without it.

Afficher

Toute la baseCentres de recherche & CollectionsAnnée de publicationAuteurTitreTypeCette collectionAnnée de publicationAuteurTitreType

Mon compte

Connexion

Enregistrement

Statistiques

Documents les plus consultésStatistiques par paysAuteurs les plus consultés
Thumbnail

Best Arm Identification in Graphical Bilinear Bandits

Voir/Ouvrir
rizk21a.pdf (1.055Mb)
Type
Communication / Conférence
Date
2021
Date du colloque
2021
Pays du colloque
UNITED STATES
Éditeur
Proceedings of the 38th International Conference on Machine Learning
Pages
139:9010-9019
Métadonnées
Afficher la notice complète
Auteur(s)
Rizk, Geovani
Thomas , A.
Colin, Igor
Laraki, Rida cc
Chevaleyre, Yann
Résumé (EN)
We introduce a new graphical bilinear bandit problem where a learner (or a \emph{central entity}) allocates arms to the nodes of a graph and observes for each edge a noisy bilinear reward representing the interaction between the two end nodes. We study the best arm identification problem in which the learner wants to find the graph allocation maximizing the sum of the bilinear rewards. By efficiently exploiting the geometry of this bandit problem, we propose a \emph{decentralized} allocation strategy based on random sampling with theoretical guarantees. In particular, we characterize the influence of the graph structure (e.g. star, complete or circle) on the convergence rate and propose empirical experiments that confirm this dependency.
Mots-clés
graphical bilinear bandit

Publications associées

Affichage des éléments liés par titre et auteur.

  • Vignette de prévisualisation
    On Averaging the Best Samples in Evolutionary Computation 
    Meunier, Laurent; Chevaleyre, Yann; Rapin, J.; Royer, Clément; Teytaud, O. (2020) Communication / Conférence
  • Vignette de prévisualisation
    On Averaging the Best Samples in Evolutionary Computation 
    Meunier, Laurent; Chevaleyre, Yann; Rapin, J.; Royer, Clément; Teytaud, O. (2020) Communication / Conférence
  • Vignette de prévisualisation
    NGO-GM: Natural Gradient Optimization for Graphical Models 
    Benhamou, Éric; Atif, Jamal; Laraki, Rida; Saltiel, David (2020) Document de travail / Working paper
  • Vignette de prévisualisation
    Identification de dynamique pour les systèmes bilinéaires et non-linéaires en présence d'incertitudes 
    Fu, Ying (2016-12-09) Thèse
  • Vignette de prévisualisation
    On the Existence of Approximate Equilibria and Sharing Rule Solutions in Discontinuous Games 
    Bich, Philippe; Laraki, Rida (2017) Article accepté pour publication ou publié
Dauphine PSL Bibliothèque logo
Place du Maréchal de Lattre de Tassigny 75775 Paris Cedex 16
Tél. : 01 44 05 40 94
Contact
Dauphine PSL logoEQUIS logoCreative Commons logo