Multi-armed bandits with episode context

From MaRDI portal

Publication:766259

Jump to:navigation, search

DOI10.1007/S10472-011-9258-6MaRDI QIDQ766259zbMATH OpenOpenAlexWikidataFDO

Authors Christopher D. Rosin

Publication date 23 March 2012

Published in Annals of Mathematics and Artificial Intelligence (Search for Journal in Brave)

Full work available at URL https://doi.org/10.1007/s10472-011-9258-6

zbMATH Keywords

contextual bandits computer Go computational learning theory multi-armed bandits PUCB UCB

Mathematics Subject Classification ID

Learning and adaptive systems in artificial intelligence (68T05) Computational learning theory (68Q32)

Recommendations

Cites work

Cited in

(5)

This page was built for publication: Multi-armed bandits with episode context

Report a bug (only for logged in users!)Click here to report a bug for this page (MaRDI item Q766259)

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:766259&oldid=12699047"