Simulation‐based Uniform Value Function Estimates of Markov Decision Processes

From MaRDI portal

Publication:3593009

Jump to:navigation, search

DOI10.1137/040619508zbMATH Open1119.90070OpenAlexW2084794933MaRDI QIDQ3593009FDOQ3593009

Authors: Rahul Jain, Pravin Varaiya

Publication date: 24 September 2007

Published in: SIAM Journal on Control and Optimization (Search for Journal in Brave)

Full work available at URL: https://doi.org/10.1137/040619508

Recommendations

zbMATH Keywords

Markov decision processes Markov games PAC learning empirical process theory uniform rate of convergence value function estimation

Mathematics Subject Classification ID

Markov processes: estimation; hidden Markov models (62M05) Empirical decision procedures; empirical Bayes procedures (62C12) Markov and semi-Markov decision processes (90C40)

Cited In (9)

This page was built for publication: Simulation‐based Uniform Value Function Estimates of Markov Decision Processes

Report a bug (only for logged in users!)Click here to report a bug for this page (MaRDI item Q3593009)

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:3593009&oldid=17005631"