Finite-Time Analysis for the Knowledge-Gradient Policy

From MaRDI portal

Publication:4610155

Jump to:navigation, search

DOI10.1137/16M1073388zbMath1387.62029arXiv1606.04624OpenAlexW2963389017WikidataQ130050586 ScholiaQ130050586MaRDI QIDQ4610155

Yingfei Wang, Warren B. Powell

Publication date: 5 April 2018

Published in: SIAM Journal on Control and Optimization (Search for Journal in Brave)

Full work available at URL: https://arxiv.org/abs/1606.04624

zbMATH Keywords

stochastic control ranking and selection sequential decision analysis

Mathematics Subject Classification ID

Bayesian problems; characterization of Bayes procedures (62C10) Learning and adaptive systems in artificial intelligence (68T05) Sequential statistical analysis (62L10) Statistical ranking and selection procedures (62F07)

Uses Software

Cites Work

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:4610155&oldid=18784082"