Transfer learning for contextual multi-armed bandits

From MaRDI portal

Publication:6192325

Jump to:navigation, search

DOI10.1214/23-aos2341arXiv2211.12612MaRDI QIDQ6192325

Unnamed Author, Hongzhe Li, Changxiao Cai

Publication date: 11 March 2024

Published in: The Annals of Statistics (Search for Journal in Brave)

Full work available at URL: https://arxiv.org/abs/2211.12612

zbMATH Keywords

self-similarity adaptivity minimax rate regret bounds transfer learning covariate shift contextual multi-armed bandit

Mathematics Subject Classification ID

Nonparametric regression and quantile regression (62G08) Sequential estimation (62L12)

Cites Work

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:6192325&oldid=35690296"