Satisficing in Time-Sensitive Bandit Learning

From MaRDI portal

Publication:5870357

Jump to:navigation, search

DOI10.1287/moor.2021.1229OpenAlexW2791950347MaRDI QIDQ5870357

Benjamin van Roy, Daniel J. Russo

Publication date: 9 January 2023

Published in: Mathematics of Operations Research (Search for Journal in Brave)

Full work available at URL: https://arxiv.org/abs/1803.02855

zbMATH Keywords

information theory online optimization satisficing rate-distortion theory Thompson sampling bandit learning

Mathematics Subject Classification ID

Bayesian problems; characterization of Bayes procedures (62C10) Learning and adaptive systems in artificial intelligence (68T05)

Related Items

Reinforcement Learning, Bit by Bit

Cites Work

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:5870357&oldid=30728357"