On nearly selfoptimizing strategies for multiarmed bandit problems with controlled arms

From MaRDI portal

Publication:4879862

Jump to:navigation, search

DOI10.4064/AM-23-4-449-473MaRDI QIDQ4879862zbMATH OpenOpenAlexFDO

Authors Ewa Drabik

Publication date 2 June 1996

Published in Applicationes Mathematicae (Search for Journal in Brave)

Full work available at URL https://eudml.org/doc/219145

zbMATH Keywords

adaptive control invariant measure stochastic control multiarmed Markov bandit problem selfoptimizing strategies

Mathematics Subject Classification ID

Applications of Markov chains and discrete-time Markov processes on general state spaces (social mobility, learning theory, industrial processes, etc.) (60J20) Optimal stochastic control (93E20) Stochastic learning and adaptive control (93E35)

Recommendations

Cited in

(3)

This page was built for publication: On nearly selfoptimizing strategies for multiarmed bandit problems with controlled arms

Report a bug (only for logged in users!)Click here to report a bug for this page (MaRDI item Q4879862)

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:4879862&oldid=19247192"