Optimal learning with non-Gaussian rewards

From MaRDI portal

Publication:2806349

Jump to:navigation, search

DOI10.1017/APR.2015.9MaRDI QIDQ2806349zbMATH OpenOpenAlexFDO

Authors Zi Ding, Ilya O. Ryzhov

Publication date 17 May 2016

Published in Advances in Applied Probability (Search for Journal in Brave)

Full work available at URL https://projecteuclid.org/euclid.aap/1457466158

zbMATH Keywords

multi-armed bandit optimal stopping partial integro-differential equation optimal learning Gittins indices non-Gaussian rewards probabilistic interpolation Lévy process

Mathematics Subject Classification ID

Processes with independent increments; Lévy processes (60G51) Integro-partial differential equations (45K05) Integro-partial differential equations (35R09) Stopping times; optimal stopping problems; gambling theory (60G40) Numerical methods for integral equations, integral transforms (65R99)

Recommendations

Cites work

Cited in

(11)

This page was built for publication: Optimal learning with non-Gaussian rewards

Report a bug (only for logged in users!)Click here to report a bug for this page (MaRDI item Q2806349)

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:2806349&oldid=15716454"