From optimality to robustness: Dirichlet sampling strategies in stochastic bandits (NeurIPS 2021)

Dorian Baudry, Patrick Saux, Odalric-Ambrym Maillard

Last updated on Jul 24, 2023

State-of-the-art randomised bandit algorithm with guarantees under weak assumptions.