Smooth Contextual Bandits: Bridging the Parametric and Nondifferentiable Regret Regimes

From MaRDI portal

Publication:5060501

Jump to:navigation, search

DOI10.1287/opre.2021.2237OpenAlexW3045217160MaRDI QIDQ5060501

Nathan Kallus, Xiaojie Mao, Yichun Hu

Publication date: 10 January 2023

Published in: Operations Research (Search for Journal in Brave)

Full work available at URL: https://arxiv.org/abs/1909.02553

zbMATH Keywords

minimax regret local polynomial regression contextual bandits margin condition

Mathematics Subject Classification ID

Statistics (62-XX)

Related Items

Transfer learning for contextual multi-armed bandits

Cites Work

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:5060501&oldid=19545694"