Similarities between policy gradient methods (PGM) in reinforcement learning (RL) and supervised learning (SL)
Date
2019Publisher city
ParisCollection title
Preprint LamsadeLink to item file
https://hal.archives-ouvertes.fr/hal-02886505Dewey
Intelligence artificielleSujet
Policy gradient; Supervised learning; Cross entropy; Kullback Leibler divergence; entropyCollections
Metadata
Show full item recordAuthor
Benhamou, Éric
989 Laboratoire d'analyse et modélisation de systèmes pour l'aide à la décision [LAMSADE]